OpenAI baru sahaja secara rasminya memperkenalkan peningkatan yang luar biasa kepada keupayaan penjanaan imej AI dalam ChatGPT, satu langkah penting ke hadapan dan bukannya menggunakan model penjanaan imej yang berasingan seperti DALL-E sebelumnya. Ciri baharu ini telah disepadukan terus ke dalam GPT-4o, membawa peningkatan yang ketara.
Mengatasi batasan yang wujud
Walaupun banyak model penjanaan imej AI semasa boleh mencipta imej artistik yang mengagumkan, mereka sering bergelut dengan elemen seperti teks, logo atau objek harian. OpenAI mendakwa GPT-4o baharu boleh mengatasi batasan ini berkat keupayaannya untuk:
- Paparkan teks dengan betul
- Patuhi dengan ketat keperluan pengguna
- Manfaatkan pengetahuan latar belakang dan konteks perbualan
- Membenarkan pengeditan foto yang dimuat naik atau penciptaan foto baharu berdasarkan foto asal
- Tersedia secara meluas
Ciri baharu ini sedang dilancarkan kepada pengguna ChatGPT Free, ChatGPT Plus, Pro dan Pasukan, dan akan tersedia di ChatGPT Enterprise dan Edu dalam beberapa minggu akan datang. Terutama, ini akan menjadi alat penciptaan imej lalai dalam ChatGPT, menjadikannya mudah untuk pengguna mengakses tanpa pilihan tambahan. Pengguna boleh menyesuaikan foto dengan:
- Nisbah aspek tertentu
- Warna tepat (menggunakan kod hex)
- Latar belakang lutsinar
- Sokongan berbilang platform

Selain ChatGPT, ciri ini juga akan tersedia pada platform termasuk Sora (penjanaan imej), DALL·E GPT khusus dan API GPT-4o (untuk pembangun, pelancaran dalam minggu-minggu akan datang).
Walaupun menjanjikan banyak penambahbaikan, model baharu itu masih mempunyai beberapa batasan:
- Masa penjanaan imej boleh sehingga 1 minit kerana perincian yang tinggi
- Pemotongan yang tidak diingini dengan foto menegak
- Kadangkala "membuat" maklumat dengan sedikit konteks yang diperlukan
- Kesukaran memproses lebih daripada 10-20 konsep sekaligus
- Kesukaran dengan bahasa bukan Latin
- Pembetulan terperinci (seperti kesilapan ejaan) tidak begitu berkesan
- Sukar untuk memaparkan maklumat terperinci pada saiz yang kecil
Semua imej yang dijana oleh GPT-4o akan mengandungi metadata C2PA, membenarkan pengesahan asal menggunakan alat dalaman OpenAI.
Walaupun terdapat beberapa batasan, GPT-4o berjanji untuk menyampaikan pengimejan yang lebih tepat dan boleh disesuaikan. OpenAI berkata ia akan terus menambah baik model dalam beberapa bulan akan datang, membuka kemungkinan baharu untuk penciptaan kandungan visual dikuasakan AI.
Dengan kemas kini utama ini, OpenAI terus mengukuhkan kepimpinannya dalam perlumbaan AI kreatif, memberikan pengalaman yang lebih lancar dan berkuasa kepada pengguna merentasi pelbagai platform.