3 Ciri Baharu Terbaik Model Meta AI Llama 4

Pada awal April 2025, Meta melancarkan Llama 4 , siri model AI terkini yang direka untuk membawa syarikat ke peringkat seterusnya. Setiap model Llama 4 baharu mempunyai peningkatan yang ketara berbanding pendahulunya, dan ini adalah ciri baharu yang menonjol untuk dicuba.

3. Seni Bina Campuran Pakar (KPM).

Salah satu ciri yang paling ketara bagi model Llama 4 ialah seni bina MoE baharu, yang pertama untuk siri Llama, yang menggunakan pendekatan berbeza daripada model sebelumnya. Dalam seni bina baharu, hanya sebahagian kecil daripada parameter model yang diaktifkan untuk setiap token, tidak seperti dalam model pengubah padat tradisional seperti Llama 3 dan ke bawah, di mana semua parameter diaktifkan untuk setiap tugas.

Sebagai contoh, Llama 4 Maverick hanya menggunakan 17 bilion parameter aktif daripada 400 bilion, dengan 128 pakar dihalakan dan seorang pakar dikongsi. Llama 4 Scout, yang terkecil dalam siri ini, mempunyai sejumlah 109 bilion parameter, mengaktifkan hanya 17 bilion dengan 16 pakar.

Versi terbesar trio, Llama 4 Behemoth, menggunakan 288 bilion parameter aktif (dengan 16 pakar) daripada jumlah hampir dua trilion parameter. Terima kasih kepada seni bina baharu ini, hanya dua pakar ditugaskan untuk setiap tugas.

Terima kasih kepada perubahan seni bina, model dalam siri Llama 4 lebih cekap dari segi pengiraan semasa latihan dan inferens. Mendayakan hanya sebahagian kecil parameter mengurangkan kos perkhidmatan dan kependaman. Terima kasih kepada seni bina MoE, Meta mendakwa bahawa Llama boleh berjalan pada satu GPU Nvidia H100, satu pencapaian yang mengagumkan memandangkan bilangan parameter. Walaupun tiada metrik khusus, adalah dipercayai bahawa setiap pertanyaan kepada ChatGPT menggunakan berbilang GPU Nvidia, yang menghasilkan overhed yang lebih besar dalam hampir setiap metrik yang boleh diukur.

2. Keupayaan pemprosesan berbilang modal asli

Satu lagi kemas kini penting untuk model AI Llama 4 ialah pemprosesan multimodal asli, bermakna ketiga-tiga mereka boleh memahami teks dan imej secara serentak.

Ini adalah terima kasih kepada gabungan yang dilakukan dalam fasa latihan awal, di mana token teks dan visual disepadukan ke dalam seni bina bersatu. Model dilatih menggunakan sejumlah besar teks, imej dan data video yang tidak berlabel.

3 Ciri Baharu Terbaik Model Meta AI Llama 4

Ia tidak menjadi lebih baik daripada ini. Jika anda masih ingat, peningkatan Llama 3.2 Meta , yang dikeluarkan pada September 2024, memperkenalkan beberapa model baharu (10 kesemuanya), termasuk 5 model penglihatan multimodal dan 5 model teks. Dengan generasi ini, syarikat tidak perlu mengeluarkan model teks dan penglihatan yang berasingan berkat keupayaan pemprosesan multimodal asli.

Selain itu, Llama 4 menggunakan pengekod visual yang dipertingkatkan, membolehkan model mengendalikan tugas inferens visual yang kompleks dan input berbilang imej, menjadikannya mampu mengendalikan aplikasi yang memerlukan pemahaman lanjutan tentang teks dan imej. Pemprosesan multimodal juga membolehkan model LLama 4 digunakan dalam pelbagai aplikasi.

1. Tetingkap kontekstual peneraju industri

Model AI Llama 4 mempunyai tetingkap kontekstual yang belum pernah berlaku sebelum ini sehingga 10 juta token. Semasa Llama 4 Behemoth masih dalam pembangunan pada masa penerbitan, Llama 4 Scout telah menetapkan penanda aras industri baharu dengan keupayaannya untuk menyokong sehingga 10 juta token dalam panjang konteks, membolehkan anda memasukkan teks lebih panjang daripada 5 juta perkataan.

Panjang konteks lanjutan ini ialah peningkatan ketara daripada token 8k Llama 3 apabila ia mula-mula dilancarkan dan juga pengembangan seterusnya kepada 128k selepas peningkatan Llama 3.2. Dan bukan hanya 10 juta panjang konteks Pengakap Llama 4 yang menarik; Malah Llama 4 Maverick, dengan satu juta panjang konteksnya, adalah pencapaian yang mengagumkan.

Llama 3.2 kini merupakan salah satu chatbot AI terbaik untuk perbualan lanjutan. Walau bagaimanapun, tetingkap konteks Llama 4 yang diperluas meletakkan Llama di hadapan, mengatasi tetingkap konteks token 2 juta teratas Gemini sebelumnya, 200K Sonnet Claude 3.7 dan 128K GPT-4.5.

3 Ciri Baharu Terbaik Model Meta AI Llama 4

Dengan tetingkap konteks yang besar, siri Llama 4 boleh mengendalikan tugasan yang memerlukan input dengan jumlah maklumat yang besar. Tetingkap besar itu berguna untuk tugas seperti menganalisis dokumen yang panjang dan berbilang, menganalisis asas kod yang besar secara terperinci dan membuat penaakulan pada set data yang besar.

Ia juga membolehkan Llama 4 menjalankan perbualan lanjutan, tidak seperti model dan model Llama sebelumnya daripada syarikat AI lain. Jika salah satu sebab Gemini 2.5 Pro ialah model penaakulan terbaik ialah tetingkap konteksnya yang besar, anda boleh bayangkan betapa hebatnya tetingkap konteks 5x atau 10x.

Model Llama 3 siri Meta telah menjadi antara LLM terbaik di pasaran. Tetapi dengan keluaran siri Llama 4, Meta mengambil langkah lebih jauh dengan bukan sahaja memfokuskan pada prestasi inferens yang dipertingkatkan (terima kasih kepada tetingkap konteks peneraju industri baharu) tetapi juga memastikan model yang paling cekap mungkin dengan menggunakan seni bina MoE baharu semasa latihan dan inferens.

Keupayaan pemprosesan multimodal asli Llama 4, seni bina MoE yang cekap dan tetingkap konteks besar meletakkannya sebagai model AI berwajaran berat yang terbuka, berprestasi tinggi, fleksibel yang boleh bersaing dengan atau mengatasi model terkemuka untuk inferens, pengekodan dan banyak tugas lain.

Sign up and earn $1000 a day ⋙

Leave a Comment

Google Melancarkan Ciri Penciptaan Video AI pada Gemini

Google Melancarkan Ciri Penciptaan Video AI pada Gemini

Google baru sahaja mengumumkan bahawa pengguna kini boleh membuat video menggunakan kecerdasan buatan melalui chatbot Gemini dan alat eksperimen Whisk yang dilancarkan baru-baru ini.

Arahan untuk mencipta watak AI anda sendiri untuk bersembang dengan semua orang

Arahan untuk mencipta watak AI anda sendiri untuk bersembang dengan semua orang

Meta AI Studio kini membolehkan anda mencipta watak AI anda sendiri untuk bersembang dengan orang dalam gaya watak yang anda cipta dan reka sendiri.

Rusia mengenakan denda berat ke atas Google, jumlah denda berkali-kali ganda KDNK dunia

Rusia mengenakan denda berat ke atas Google, jumlah denda berkali-kali ganda KDNK dunia

Denda besar telah dijatuhkan dalam pertikaian undang-undang antara Google dan Rusia berhubung penggantungan akaun YouTube pro-Kremlin.

Kod Hero Lagenda Terkini dan cara masuk

Kod Hero Lagenda Terkini dan cara masuk

Perjalanan untuk meneroka dunia Tiga Kerajaan dalam Legend of the Proud akan menjadi lebih mudah dengan satu siri kod hadiah yang menarik. Jom explore sekarang.

Orang pertama yang ditanamkan ChatGPT dalam otak untuk membantu memanipulasi peranti elektronik

Orang pertama yang ditanamkan ChatGPT dalam otak untuk membantu memanipulasi peranti elektronik

ChatGPT sedang diuji oleh Synchron, salah satu perintis cip implan otak (BCI) untuk membantu pesakit memanipulasi peranti elektronik.

Cara Penjana Seni AI Meningkatkan Foto Harian Anda

Cara Penjana Seni AI Meningkatkan Foto Harian Anda

Ingin menukar rupa foto harian anda? Alat penciptaan seni AI boleh menambah sentuhan unik dan kreatif yang mungkin tidak anda capai dengan pengeditan manual.

5 Sebab Aria AI Opera Berguna

5 Sebab Aria AI Opera Berguna

Ramai orang tidak menyukai AI kerana mereka mahu membaca data mentah dan menganalisisnya sendiri. Walau bagaimanapun, cuba Aria AI Opera apabila anda terjebak dengan beberapa tugas yang membosankan dan memerlukan idea. Inilah sebabnya Aria AI Opera berguna!

Kod Terkini untuk House of Flying Daggers dan cara menebus kod tersebut

Kod Terkini untuk House of Flying Daggers dan cara menebus kod tersebut

Code Thap Dien Mai Phuc memberikan pemain Kim Nguyen Bao, Hoan Khon Halo, Gold, Huyen Tinh, Huyen Tinh Chest

Mitos Hitam: Wukong mencuri rekod dari Cyberpunk 2077

Mitos Hitam: Wukong mencuri rekod dari Cyberpunk 2077

Dengan banyak ulasan yang kebanyakannya positif, tidak menghairankan bahawa Mitos Hitam: Wukong telah memecahkan rekod di Steam.

Ketahui tentang kod ralat 0xc00000e dan cara membetulkannya

Ketahui tentang kod ralat 0xc00000e dan cara membetulkannya

Kod ralat Blue Screen of Death (BSOD) yang digeruni 0xc00000e, yang sering muncul apabila memulakan Windows 10, boleh mengelirukan.

Ruang Play Together, namakan ruang Play Together

Ruang Play Together, namakan ruang Play Together

Ramai orang menggunakan ruang dalam nama Play Together mereka atau menggunakan garis bawah kecil untuk mencipta ruang antara huruf yang anda tulis dalam nama anda.

Bagaimana untuk memuat turun Black Beacon PC

Bagaimana untuk memuat turun Black Beacon PC

Walaupun adalah mungkin untuk mengalami Black Beacon pada PC, permainan ini tidak dioptimumkan secara rasmi untuk platform ini pada masa ini.

Formula untuk mengira luas permukaan dan isipadu sfera

Formula untuk mengira luas permukaan dan isipadu sfera

Luas permukaan sfera adalah empat kali luas bulatan besar, iaitu empat kali pemalar Pi didarab dengan kuasa dua jejari sfera itu.

Apakah keistimewaan pakaian angkasa lepas yang dipilih China untuk pendaratan berawak pertama di bulan?

Apakah keistimewaan pakaian angkasa lepas yang dipilih China untuk pendaratan berawak pertama di bulan?

China menyasarkan untuk menghantar warga pertamanya ke Bulan menjelang 2030, dan negara itu baru sahaja melancarkan pakaian angkasa lepas yang direka bentuk baharu yang akan digunakan dalam misi bersejarah yang akan datang.

Makanan yang mudah menyebabkan keradangan dalam badan

Makanan yang mudah menyebabkan keradangan dalam badan

Banyak makanan boleh menyebabkan keradangan dan penyakit kronik. Di bawah adalah makanan yang anda harus elakkan mengambil terlalu banyak jika anda tidak mahu membawa penyakit ke dalam badan anda.