Kumpulan teknologi China Alibaba baru sahaja mengumumkan model AI baharu yang dipanggil QVQ-Max siri Qwen, menandakan kejayaan dalam bidang AI multimedia. Keistimewaan model ini ialah kebolehan menganalisis kandungan imej/video, kemudian membuat hujah dan penyelesaian berdasarkan maklumat yang diperoleh.
Keupayaan yang mengagumkan
QVQ-Max digambarkan oleh Alibaba sebagai jambatan antara model AI berasaskan teks tulen dan dunia sebenar. Dengan keupayaan penaakulan visual, sistem boleh:
- Menganalisis imej dan mengenal pasti elemen utama
- Aplikasi serba boleh dalam banyak bidang daripada reka bentuk ilustrasi, penciptaan skrip video kepada lakonan watak
- Menyelesaikan masalah dengan gambar rajah (matematik, fizik)
- Arahan memasak langkah demi langkah berdasarkan gambar resipi
Alibaba berkata model itu membantu merapatkan jurang antara AI yang hanya memproses teks dan maklumat dunia sebenar. Terima kasih kepada keupayaan penaakulan visualnya, QVQ-Max boleh "melihat, memahami dan berfikir" tentang dunia di sekelilingnya. Syarikat itu menekankan model unggulnya dalam analisis imej, mengenal pasti elemen utama, dan fleksibiliti dalam aplikasi dalam banyak bidang seperti reka bentuk ilustrasi, penciptaan skrip video atau main peranan.

Seperti chatbot AI lain, QVQ-Max menyokong kerja, pendidikan dan kehidupan peribadi, tetapi terima kasih kepada penyepaduan visual, ia juga menyelesaikan tugas yang lebih khusus seperti: menyelesaikan masalah matematik/fizik dengan gambar rajah, arahan memasak melalui imej resipi.
Alibaba menganggap QVQ-Max sebagai versi pertama dan telah menggariskan peta jalan naik taraf untuk versi seterusnya. Pertama, mereka ingin meningkatkan ketepatan pengecaman imej menggunakan teknik pembumian. Kedua, model ini akan dioptimumkan untuk menangani masalah multitasking dan kompleks seperti bekerja dengan telefon, komputer atau bermain permainan. Akhirnya, Alibaba merancang untuk berkembang daripada interaksi teks kepada pengesahan alat dan penciptaan kandungan imej.
Pengguna boleh mengalami QVQ-Max dengan:
- Lawati chat.qwen.ai
- Pilih menu model di sudut kiri → " Kembangkan lebih banyak model "
- Pilih QVQ-Max dan mula bersembang
- Lampirkan fail imej untuk meneroka keupayaan pemprosesan AI
Dengan pelancaran QVQ-Max, Alibaba terus menegaskan kedudukannya dalam perlumbaan untuk membangunkan AI multimedia, bersaing secara langsung dengan gergasi teknologi global. Model itu menjanjikan untuk membawa aplikasi praktikal dalam kerja, pendidikan dan kehidupan peribadi.