Alibaba baru sahaja mengumumkan model penaakulan terbaharunya secara rasmi, dan nampaknya DeepSeek dan OpenAI mempunyai beberapa sebab untuk dibimbangkan — jika semua "gembar-gembur" Alibaba adalah benar. Model ini adalah sumber terbuka, jadi semua orang boleh mengakses dan mengalaminya secara percuma.
Digelar QwQ-32b (Quan-with-Questions), model AI baharu Alibaba berjalan pada parameter yang jauh lebih sedikit daripada hampir semua model bahasa utama hari ini, bermakna ia memerlukan lebih sedikit sumber. Alibaba mendakwa QwQ-32b berprestasi pada tahap yang sama dengan DeepSeek atau o1-mini OpenAI.
Model bahasa besar DeepSeek-R1 (LLM) membuat gelombang apabila ia dilancarkan pada awal Februari, mencabar standard emas yang ditetapkan oleh ChatGPT, tetapi pada kos operasi yang jauh lebih rendah. Dengan QwQ-32b, nampaknya Alibaba mahu menolak had ini lebih jauh lagi.
Secara teknikal DeepSeek-R1 memerlukan 671 bilion parameter untuk dijalankan, dengan 37 bilion parameter didayakan. Sementara itu, QwQ-32b Alibaba hanya memerlukan 32 bilion parameter. Nombor-nombor ini mungkin kelihatan abstrak kepada ramai, tetapi ia membuat perbezaan besar dalam kuasa pengkomputeran: manakala DeepSeek-R1 memerlukan 1600GB VRAM untuk dijalankan, QwQ-32b hanya memerlukan 24GB VRAM. Dalam kebanyakan kes, ini memerlukan kad grafik seperti Nvidia H100 atau yang setara, tetapi RTX 4090 yang mesra pemain juga mempunyai 24GB VRAM. RTX 5090 terkini meningkatkan jumlah ini kepada 32GB.
Malah dikatakan bahawa walaupun dengan hanya 32 bilion parameter, QwQ-32B masih memberikan prestasi yang sama atau lebih tinggi daripada R1 dalam bidang seperti matematik, pengaturcaraan, dan penyelesaian masalah umum. Alibaba juga berkata QwQ-32B mengatasi prestasi o1-mini OpenAI, yang dibina dengan 100 bilion parameter. QwQ-32B tersedia di Hugging Face, komuniti model AI sumber terbuka terbesar di dunia.

QwQ-32b Alibaba tersedia di bawah lesen Apache 2.0, bermakna syarikat dan penyelidik boleh menggunakannya secara bebas. Lebih penting lagi, kita boleh mencubanya melalui Sembang Qwen Alibaba. Seperti DeepSeek, QwQ-32b mempunyai beberapa had dari segi had subjek. Sebagai contoh, apabila ditanya tentang isu politik, Qwen Chat akan memberikan mesej bahawa ini adalah topik yang tidak sesuai. Tetapi terdapat juga beberapa kelebihan yang dapat dilihat dengan serta-merta.
QwQ-32b nampaknya memberikan jawapan yang agak terperinci walaupun kepada soalan yang cepat dan mudah. Ini boleh menjadi baik, tetapi dalam satu cara, ia agak menjengkelkan kerana ia memberikan banyak maklumat yang tidak perlu yang anda tidak minta. Satu kelebihan ialah QwQ-32b boleh menunjukkan keseluruhan proses penaakulan, serupa dengan ciri Pemikiran Dalam ChatGPT — tetapi dengan kurang mendalam.
Sama ada dakwaan Alibaba akan menjadi kenyataan masih belum dapat dilihat, tetapi nampaknya ChatGPT dan DeepSeek kini mempunyai pesaing baharu yang layak.