Gemma 2 atau Llama 3 ialah model sumber terbuka terbaik?

Pada I/O 2024, Google mengumumkan barisan model Gemma 2 seterusnya, dan kini syarikat itu akhirnya mengeluarkan model ringan di bawah lesen sumber terbuka. Model Gemma 2 27B baharu dikatakan sangat menjanjikan, mengatasi beberapa model yang lebih besar seperti Llama 3 70B dan Qwen 1.5 32B. Jadi untuk menguji dakwaan ini, mari kita bandingkan Gemma 2 dan Llama 3 - dua daripada model sumber terbuka teratas hari ini.

Penulisan kreatif

Mula-mula, mari kita lihat betapa bagusnya Gemma 2 dan Llama 3 dalam penulisan kreatif. Penulis artikel meminta kedua-dua model menulis cerita pendek tentang hubungan antara bulan dan matahari. Kedua-duanya melakukan kerja yang hebat, tetapi model Gemma 2 Google terserlah berkat prosa yang menarik dan cerita yang bagus.

Gemma 2 atau Llama 3 ialah model sumber terbuka terbaik?
Gemma 2 atau Llama 3 ialah model sumber terbuka terbaik?

Sebaliknya, Llama 3 kelihatan agak membosankan dan robotik. Google sentiasa mahir dalam penjanaan teks dengan model Gemini dan Gemma 2 27B yang lebih kecil tidak terkecuali.

Pilihan Menang: Gemma 2

Ujian berbilang bahasa

Pada pusingan seterusnya, mari kita lihat sejauh mana kedua-dua model mengendalikan bahasa bukan bahasa Inggeris. Memandangkan Google mengiklankan bahawa Gemma 2 pandai memahami pelbagai bahasa, penulis membandingkannya dengan model Meta Llama 3. Pengarang meminta kedua-dua model untuk menterjemah petikan dalam bahasa Hindi. Kedua-dua Gemma 2 dan Llama 3 beraksi dengan sangat baik.

Gemma 2 atau Llama 3 ialah model sumber terbuka terbaik?
Gemma 2 atau Llama 3 ialah model sumber terbuka terbaik?

Penulis juga mencuba bahasa lain, Bengali, dan model-model tersebut memberikan hasil yang sama baiknya. Sekurang-kurangnya untuk bahasa India, boleh dikatakan bahawa Gemma 2 dan Llama 3 terlatih dengan baik pada korpus yang besar. Walau bagaimanapun, Gemma 2 27B hampir 2.5 kali lebih kecil daripada Llama 3 70B, yang menjadikannya lebih mengagumkan.

Pilihan Menang: Gemma 2 dan Llama 3

Semak logik

Walaupun Gemma 2 dan Llama 3 bukanlah model paling pintar di luar sana, mereka boleh melakukan beberapa ujian penaakulan biasa seperti model yang lebih besar. Dalam perbandingan sebelumnya antara Llama 3 dan GPT-4 , model 70B Meta sangat mengagumkan kerana ia menunjukkan kecerdasan yang cukup baik walaupun pada saiznya yang lebih kecil.

Gemma 2 atau Llama 3 ialah model sumber terbuka terbaik?
Gemma 2 atau Llama 3 ialah model sumber terbuka terbaik?

Dalam pusingan ini, Llama 3 mengalahkan Gemma 2 dengan perbezaan markah yang besar. Llama 3 menjawab 2 daripada 3 soalan dengan betul manakala Gemma 2 bergelut untuk menjawab walaupun satu dengan betul. Gemma 2 hanya tidak dilatih untuk menyelesaikan soalan penaakulan yang kompleks.

Sebaliknya, Llama 3 mempunyai asas penaakulan yang kukuh, yang kemungkinan besar boleh disimpulkan daripada set data yang disulitkan. Walaupun saiznya kecil - sekurang-kurangnya berbanding model trilion parameter seperti GPT-4 - ia mempamerkan lebih daripada tahap kecerdasan yang adil. Akhirnya, menggunakan lebih banyak token untuk melatih model sebenarnya menghasilkan model yang lebih berkuasa.

Pilihan Menang: Llama 3

Ikut arahan

Pada pusingan seterusnya, penulis meminta Gemma 2 dan Llama 3 mencipta 10 perkataan yang berakhir dengan perkataan "NPU". Dan Llama 3 mendapat 10/10 jawapan yang betul. Sebaliknya, Gemma 2 hanya menghasilkan 7 ayat yang betul daripada 10. Dalam banyak keluaran sebelum ini, model Google termasuk Gemini tidak mengikuti arahan pengguna dengan baik. Dan trend yang sama berterusan dengan Gemma 2.

Gemma 2 atau Llama 3 ialah model sumber terbuka terbaik?
Gemma 2 atau Llama 3 ialah model sumber terbuka terbaik?

Mematuhi arahan pengguna adalah penting untuk model AI. Ia memastikan kebolehpercayaan dan menjana maklum balas yang tepat untuk perkara yang telah anda arahkan. Dari segi keselamatan juga, ia membantu memastikan model dibumikan untuk pematuhan yang lebih baik dengan protokol keselamatan.

Pilihan Menang: Llama 3

Cari maklumat

Kedua-dua Gemma 2 dan Llama 3 mempunyai panjang konteks 8K token. Pengarang menambah blok teks yang besar, bersumber terus daripada buku Pride and Prejudice, yang mengandungi lebih 17,000 aksara dan 3.8K token. Seperti biasa, pengarang meletakkan petikan rawak di suatu tempat dalam teks dan meminta kedua-dua model mencarinya.

Gemma 2 atau Llama 3 ialah model sumber terbuka terbaik?

Gemma 2 dengan cepat mengetahui maklumat itu dan menunjukkan bahawa petikan itu dimasukkan secara rawak. Llama 3 juga mendapati dan mencadangkan bahawa dakwaan ini kelihatan tidak sesuai. Dari segi memori konteks yang panjang, walaupun terhad kepada token 8K, kedua-dua model agak kuat dalam hal ini.

Harap maklum bahawa pengarang menjalankan ujian ini di HuggingChat (web) kerana meta.ai enggan menjalankan gesaan ini, kemungkinan besar disebabkan kandungan hak cipta.

Pilihan Menang: Gemma 2 dan Llama 3

Semak halusinasi

Model yang lebih kecil cenderung mengalami halusinasi AI kerana data latihan yang terhad, selalunya mengada-adakan maklumat apabila model menghadapi topik yang tidak dikenali. Jadi penulis melemparkan nama negara rekaannya untuk menguji sama ada Gemma 2 dan Llama 3 sedang berhalusinasi. Dan yang menghairankan, mereka tidak melakukannya, yang bermaksud bahawa kedua-dua Google dan Meta mempunyai asas yang cukup baik untuk model mereka.

Gemma 2 atau Llama 3 ialah model sumber terbuka terbaik?
Gemma 2 atau Llama 3 ialah model sumber terbuka terbaik?
Gemma 2 atau Llama 3 ialah model sumber terbuka terbaik?

Penulis juga mengemukakan satu lagi soalan (palsu) untuk menguji kesahihan model, tetapi sekali lagi, mereka tidak khayal. Ngomong-ngomong, penulis menguji Llama 3 di HuggingChat manakala meta.ai melayari Internet untuk mendapatkan maklumat semasa mengenai topik yang berkaitan.

Pilihan Menang: Gemma 2 dan Llama 3

buat kesimpulan

Walaupun model Gemma 2 27B Google tidak berfungsi dengan baik dalam ujian penaakulan, ia mampu melakukan beberapa tugas lain. Ia bagus untuk penulisan kreatif, menyokong pelbagai bahasa, mempunyai ingatan yang baik dan yang paling penting adalah tidak halusinogen seperti model sebelumnya.

Llama 3 lebih baik, sudah tentu, tetapi ia juga merupakan model yang jauh lebih besar, dilatih pada 70 bilion parameter. Pembangun akan mendapati model Gemma 2 27B berguna untuk pelbagai kes penggunaan. Dan untuk ukuran yang baik, Gemma 2 9B juga tersedia.

Selain itu, pengguna harus melihat Gemini 1.5 Flash, yang sekali lagi merupakan model yang lebih kecil dan juga menyokong input berbilang modal. Apatah lagi, ia sangat pantas dan cekap.

Sign up and earn $1000 a day ⋙

Leave a Comment

Perbezaan antara TV biasa dan TV Pintar

Perbezaan antara TV biasa dan TV Pintar

TV pintar benar-benar telah melanda dunia. Dengan begitu banyak ciri hebat dan sambungan internet, teknologi telah mengubah cara kita menonton TV.

Mengapa peti sejuk tidak mempunyai lampu tetapi peti sejuk ada?

Mengapa peti sejuk tidak mempunyai lampu tetapi peti sejuk ada?

Peti sejuk adalah peralatan biasa dalam isi rumah. Peti ais biasanya mempunyai 2 kompartmen iaitu ruang sejuk yang luas dan mempunyai lampu yang menyala secara automatik setiap kali pengguna membukanya, manakala ruang peti sejuk beku pula sempit dan tiada cahaya.

2 Cara untuk Membetulkan Kesesakan Rangkaian Yang Melambatkan Wi-Fi

2 Cara untuk Membetulkan Kesesakan Rangkaian Yang Melambatkan Wi-Fi

Rangkaian Wi-Fi dipengaruhi oleh banyak faktor di luar penghala, lebar jalur dan gangguan, tetapi terdapat beberapa cara pintar untuk meningkatkan rangkaian anda.

Cara Menurunkan Taraf daripada iOS 17 kepada iOS 16 tanpa Kehilangan Data menggunakan Tenorshare Reiboot

Cara Menurunkan Taraf daripada iOS 17 kepada iOS 16 tanpa Kehilangan Data menggunakan Tenorshare Reiboot

Jika anda ingin kembali kepada iOS 16 yang stabil pada telefon anda, berikut ialah panduan asas untuk menyahpasang iOS 17 dan menurunkan taraf daripada iOS 17 kepada 16.

Apa yang berlaku kepada badan apabila anda makan yogurt setiap hari?

Apa yang berlaku kepada badan apabila anda makan yogurt setiap hari?

Yogurt adalah makanan yang indah. Adakah baik untuk makan yogurt setiap hari? Apabila anda makan yogurt setiap hari, bagaimana badan anda akan berubah? Mari kita ketahui bersama!

Apakah jenis beras yang terbaik untuk kesihatan?

Apakah jenis beras yang terbaik untuk kesihatan?

Artikel ini membincangkan jenis beras yang paling berkhasiat dan cara memaksimumkan manfaat kesihatan bagi mana-mana beras yang anda pilih.

Bagaimana untuk bangun tepat pada waktunya pada waktu pagi

Bagaimana untuk bangun tepat pada waktunya pada waktu pagi

Menetapkan jadual tidur dan rutin waktu tidur, menukar jam penggera anda dan melaraskan diet anda ialah beberapa langkah yang boleh membantu anda tidur dengan lebih lena dan bangun tepat pada waktunya pada waktu pagi.

Petua untuk bermain Rent Please! Tuan Tanah Sim untuk Pemula

Petua untuk bermain Rent Please! Tuan Tanah Sim untuk Pemula

Tolong Sewa! Landlord Sim ialah permainan mudah alih simulasi pada iOS dan Android. Anda akan bermain sebagai tuan tanah kompleks pangsapuri dan mula menyewa sebuah apartmen dengan matlamat untuk menaik taraf bahagian dalam pangsapuri anda dan menyediakannya untuk penyewa.

Kod Pertahanan Menara Bilik Mandi Terkini dan Cara Memasukkan Kod

Kod Pertahanan Menara Bilik Mandi Terkini dan Cara Memasukkan Kod

Dapatkan kod permainan Bathroom Tower Defense Roblox dan tebus untuk ganjaran yang menarik. Mereka akan membantu anda menaik taraf atau membuka kunci menara dengan kerosakan yang lebih tinggi.

Struktur, simbol dan prinsip operasi transformer

Struktur, simbol dan prinsip operasi transformer

Mari belajar tentang struktur, simbol dan prinsip operasi transformer dengan cara yang paling tepat.

4 Cara AI Menjadikan TV Pintar Lebih Baik

4 Cara AI Menjadikan TV Pintar Lebih Baik

Daripada kualiti gambar dan bunyi yang lebih baik kepada kawalan suara dan banyak lagi, ciri dikuasakan AI ini menjadikan TV pintar lebih baik!

Mengapa ChatGPT lebih baik daripada DeepSeek

Mengapa ChatGPT lebih baik daripada DeepSeek

Pada mulanya, orang ramai menaruh harapan yang tinggi untuk DeepSeek. Sebagai chatbot AI yang dipasarkan sebagai pesaing kuat kepada ChatGPT, ia menjanjikan keupayaan dan pengalaman sembang pintar.

Temui Fireflies.ai: Setiausaha AI Percuma Yang Menjimatkan Masa Kerja Anda

Temui Fireflies.ai: Setiausaha AI Percuma Yang Menjimatkan Masa Kerja Anda

Sangat mudah untuk terlepas butiran penting semasa mencatat perkara penting lain, dan cuba mencatat nota semasa bersembang boleh mengganggu. Fireflies.ai adalah penyelesaiannya.

Bagaimana untuk membesarkan Axolotl Minecraft, menjinakkan Minecraft Salamander

Bagaimana untuk membesarkan Axolotl Minecraft, menjinakkan Minecraft Salamander

Axolot Minecraft akan menjadi pembantu yang hebat untuk pemain semasa beroperasi di bawah air jika mereka tahu cara menggunakannya.

Tempat yang Tenang: Konfigurasi Permainan PC Jalan Hadapan

Tempat yang Tenang: Konfigurasi Permainan PC Jalan Hadapan

Tempat yang Tenang: Konfigurasi The Road Ahead dinilai agak tinggi, jadi anda perlu mempertimbangkan konfigurasi sebelum membuat keputusan untuk memuat turun.