9 LLM Tempatan/Luar Talian Terbaik yang Boleh Anda Cuba Sekarang

Dengan LLM kuantum kini tersedia pada ekosistem HuggingFace dan AI seperti H20, Text Gen dan GPT4All yang membolehkan anda memuatkan pemberat LLM pada komputer anda, kini anda mempunyai pilihan untuk AI percuma, fleksibel dan selamat. Berikut ialah 9 LLM tempatan/luar talian terbaik yang boleh anda cuba sekarang!

Jadual Kandungan

1. Hermes 2 Pro GPTQ
2. Zephyr 7B Beta
3. Falcon Arahkan GPTQ
4. GPT4ALL-J Groovy
5. DeepSeek Coder V2 Arahan
6. Mixtral-8x7B
7. Wizard Vicuna Uncensored-GPTQ
8. Orca Mini-GPTQ
9. Llama 2 13B Sembang GPTQ

1. Hermes 2 Pro GPTQ

9 LLM Tempatan/Luar Talian Terbaik yang Boleh Anda Cuba Sekarang

Hermes 2 Pro ialah model bahasa lanjutan yang diperhalusi oleh Nous Research. Ia menggunakan versi set data OpenHermes 2.5 yang dikemas kini dan dikecilkan, bersama-sama dengan set data Panggilan Fungsi dan JSON yang baru diperkenalkan yang dibangunkan oleh syarikat itu sendiri. Model ini berdasarkan seni bina Mistral 7B dan telah dilatih pada 1,000,000 arahan/perbualan kualiti GPT-4 atau lebih baik, kebanyakannya data sintetik.

Model	Hermes 2 Pro GPTQ
Saiz model	7.26 GB
Parameter	7 bilion
Kuantisasi	4-bit
taip	Mistral
Lesen	Apache 2.0

Hermes 2 Pro pada Mistral 7B ialah model Hermes 7B perdana baharu, menawarkan prestasi yang dipertingkatkan merentas pelbagai penanda aras, termasuk AGIEval, BigBench Reasoning, GPT4All dan TruthfulQA. Keupayaan canggihnya menjadikannya sesuai untuk banyak tugas pemprosesan bahasa semula jadi (NLP), seperti penjanaan kod, penciptaan kandungan dan aplikasi AI perbualan.

2. Zephyr 7B Beta

Zephyr ialah satu siri model bahasa yang dilatih untuk bertindak sebagai pembantu yang membantu. Zephyr-7B-Beta ialah model kedua dalam siri ini, diperhalusi daripada Mistral-7B-v0.1 menggunakan Pengoptimuman Keutamaan Terus (DPO) pada campuran set data sintetik yang tersedia untuk umum.

Model	Zephyr 7B Beta
Saiz model	7.26 GB
Parameter	7 bilion
Kuantisasi	4-bit
taip	Mistral
Lesen	Apache 2.0

Dengan menghapuskan penjajaran terbina dalam set data latihan, Zephyr-7B-Beta menunjukkan prestasi yang lebih baik pada penanda aras seperti MT-Bench, meningkatkan kegunaannya dalam pelbagai tugas. Walau bagaimanapun, pelarasan ini boleh membawa kepada penjanaan teks yang bermasalah apabila digesa dengan cara tertentu.

3. Falcon Arahkan GPTQ

Versi terkuantiti Falcon ini adalah berdasarkan seni bina penyahkod sahaja yang diperhalusi pada model mentah Falcon-7b TII. Model Falcon asas dilatih menggunakan 1.5 trilion token tertunggak yang diperoleh daripada Internet awam. Sebagai model penyahkod berasaskan arahan berlesen Apache 2 sahaja, Falcon Instruct sesuai untuk perniagaan kecil yang mencari model untuk digunakan untuk terjemahan bahasa dan pengingesan data.

Model	Falcon-7B-Arahan
Saiz model	7.58 GB
Parameter	7 bilion
Kuantisasi	4-bit
taip	Falcon
Lesen	Apache 2.0

Walau bagaimanapun, versi Falcon ini tidak sesuai untuk penalaan halus dan hanya bertujuan untuk inferens. Jika anda ingin memperhalusi Falcon, anda perlu menggunakan model mentah, yang mungkin memerlukan akses kepada perkakasan latihan gred perusahaan seperti NVIDIA DGX atau AMD Instinct AI Accelerators.

4. GPT4ALL-J Groovy

GPT4All-J Groovy ialah model penyahkod sahaja yang ditala oleh Nomic AI dan dilesenkan di bawah Apache 2.0. GPT4ALL-J Groovy adalah berdasarkan model GPT-J asal, yang diketahui hebat dalam menjana teks daripada gesaan. GPT4ALL -J Groovy telah diubah suai kepada model perbualan, yang bagus untuk aplikasi penjanaan teks yang pantas dan kreatif. Ini menjadikan GPT4All-J Groovy sesuai untuk pencipta kandungan dalam membantu mereka dengan penulisan dan gubahan mereka, sama ada puisi, muzik atau cerita.

Model	GPT4ALL-J Groovy
Saiz model	3.53 GB
Parameter	7 bilion
Kuantisasi	4-bit
taip	GPT-J
Lesen	Apache 2.0

Malangnya, model GPT-J garis dasar telah dilatih pada set data bahasa Inggeris sahaja, yang bermaksud bahawa model GPT4ALL-J yang diperhalusi ini hanya boleh bercakap dan melaksanakan aplikasi penjanaan teks dalam bahasa Inggeris.

5. DeepSeek Coder V2 Arahan

DeepSeek Coder V2 ialah model bahasa lanjutan yang meningkatkan pengaturcaraan dan penaakulan matematik. DeepSeek Coder V2 menyokong berbilang bahasa pengaturcaraan dan menawarkan panjang konteks lanjutan, menjadikannya alat serba boleh untuk pembangun.

Model	DeepSeek Coder V2 Arahan
Saiz model	13 GB
Parameter	33 bilion
Kuantisasi	4-bit
taip	DeepSeek
Lesen	Apache 2.0

Berbanding dengan pendahulunya, DeepSeek Coder V2 menunjukkan peningkatan ketara dalam tugas yang berkaitan dengan kod, penaakulan dan keupayaan umum. Ia melanjutkan sokongan untuk bahasa pengaturcaraan daripada 86 kepada 338 dan memanjangkan panjang konteks daripada 16K kepada 128K token. Dalam penanda aras, ia mengatasi model seperti GPT-4 Turbo, Claude 3 Opus dan Gemini 1.5 Pro dalam penanda aras kriptografi dan matematik.

6. Mixtral-8x7B

Mixtral-8x7B ialah gabungan model pakar (MoE) yang dibangunkan oleh Mistral AI. Ia mempunyai 8 pakar setiap MLP, berjumlah 45 bilion parameter. Walau bagaimanapun, hanya dua pakar diaktifkan setiap token semasa inferens, menjadikannya cekap dari segi pengiraan, dengan kelajuan dan kos yang setanding dengan model parameter 12 bilion.

Model	Mixtral-8x7B
Saiz model	12 GB
Parameter	45 bilion (8 pakar)
Kuantisasi	4-bit
taip	Mistral MoE
Lesen	Apache 2.0

Mixtral menyokong panjang konteks sebanyak 32k token dan mengatasi prestasi Llama 2 sebanyak 70B pada kebanyakan penanda aras, sepadan atau melebihi prestasi GPT-3.5. Ia fasih dalam berbilang bahasa, termasuk Inggeris, Perancis, Jerman, Sepanyol dan Itali, menjadikannya pilihan serba boleh untuk pelbagai tugas NLP.

7. Wizard Vicuna Uncensored-GPTQ

Wizard-Vicuna GPTQ ialah versi kuantum Wizard Vicuna berdasarkan model LlaMA. Tidak seperti kebanyakan LLM yang dikeluarkan kepada umum, Wizard-Vicuna ialah model yang tidak ditapis dengan perkaitan dialih keluar. Ini bermakna model tersebut tidak mempunyai standard keselamatan dan etika yang sama seperti kebanyakan model lain.

Model	Wizard-Vicuna-30B-Uncensored-GPTQ
Saiz model	16.94 GB
Parameter	30 bilion
Kuantisasi	4-bit
taip	LlaMA
Lesen	GPL 3

Walaupun ia mungkin menimbulkan masalah untuk kawalan penjajaran AI, mempunyai LLM yang tidak ditapis juga memberikan yang terbaik dalam model dengan membenarkannya menjawab tanpa sebarang kekangan. Ini juga membolehkan pengguna menambah penjajaran tersuai mereka sendiri tentang cara AI harus bertindak atau bertindak balas berdasarkan gesaan yang diberikan.

8. Orca Mini-GPTQ

Adakah anda ingin menguji model yang dilatih menggunakan kaedah pembelajaran yang unik? Orca Mini ialah pelaksanaan tidak rasmi kertas penyelidikan Orca Microsoft. Model ini dilatih menggunakan pendekatan pembelajaran guru-murid, di mana set data diisi dengan penjelasan dan bukannya gesaan dan respons sahaja. Secara teori, ini sepatutnya menjadikan pelajar lebih bijak, kerana model itu boleh memahami masalah dan bukannya hanya mencari pasangan input dan output kerana LLM konvensional berfungsi.

9. Llama 2 13B Sembang GPTQ

Llama 2 ialah pengganti kepada Llama LLM yang asal, menawarkan prestasi yang lebih baik dan serba boleh. Varian 13B Chat GPTQ ditala untuk aplikasi AI perbualan yang dioptimumkan untuk dialog bahasa Inggeris.

Beberapa model yang disenaraikan di atas datang dalam pelbagai versi dari segi spesifikasi. Secara umum, versi spesifikasi yang lebih tinggi menghasilkan hasil yang lebih baik tetapi memerlukan perkakasan yang lebih berkuasa, manakala versi spesifikasi yang lebih rendah menghasilkan hasil kualiti yang lebih rendah tetapi boleh dijalankan pada perkakasan yang lebih rendah. Jika anda tidak pasti sama ada PC anda boleh menjalankan model ini, cuba versi spesifikasi yang lebih rendah dahulu, kemudian teruskan sehingga anda merasakan penurunan prestasi tidak lagi boleh diterima.

Tags: #llm #llm tempatan #llm luar talian #llm tempatan terbaik #llm luar talian terbaik #hermes 2 pro gptq

Microsoft menambah GPT-4 Turbo LLM kepada versi percuma Copilot

Tahun 2023 menyaksikan Microsoft bertaruh besar pada kecerdasan buatan dan perkongsiannya dengan OpenAI untuk menjadikan Copilot satu realiti.

Nvidia Baru Keluarkan LLM Sumber Terbuka untuk Bersaing dengan GPT-4

Nvidia baru sahaja mengumumkan keluaran model bahasa besar (LLM) sumber terbuka yang dikatakan berprestasi setanding dengan model proprietari terkemuka daripada OpenAI, Anthropic, Meta dan Google.

Foxconn Mengumumkan Model Bahasa Besar (LLM) Ditapis daripada Meta Llama 3.1

Foxconn, syarikat yang paling terkenal dalam pembuatan iPhone dan produk perkakasan Apple yang lain, baru sahaja mengejutkan semua orang dengan mengumumkan model bahasa besar (LLM) pertamanya, dipanggil FoxBrain, yang bertujuan untuk digunakan untuk meningkatkan pengurusan pembuatan dan rantaian bekalan.

Bagaimana untuk mendapatkan semula akses kepada cakera keras, betulkan ralat kerana tidak dapat membuka cakera keras

Dalam artikel ini, kami akan membimbing anda cara mendapatkan semula akses kepada cakera keras anda apabila ia gagal. Jom ikut!

Cara menggunakan Kesedaran Perbualan dan Dengar Langsung pada AirPods

Pada pandangan pertama, AirPods kelihatan seperti mana-mana fon telinga wayarles sebenar yang lain. Tetapi itu semua berubah apabila beberapa ciri yang kurang diketahui ditemui.

Semua tentang iOS 26

Apple telah memperkenalkan iOS 26 – kemas kini utama dengan reka bentuk kaca beku yang serba baharu, pengalaman yang lebih pintar dan penambahbaikan pada apl biasa.

Komputer riba terbaik untuk pelajar pada tahun 2025

Pelajar memerlukan jenis komputer riba tertentu untuk pengajian mereka. Ia bukan sahaja cukup berkuasa untuk beraksi dengan baik dalam jurusan pilihan mereka, tetapi juga padat dan cukup ringan untuk dibawa sepanjang hari.

Bagaimana untuk menambah pencetak pada Windows 10

Menambah pencetak pada Windows 10 adalah mudah, walaupun proses untuk peranti berwayar akan berbeza daripada peranti wayarles.

Cara menyemak RAM dan menyemak ralat RAM pada komputer anda dengan kadar ketepatan tertinggi

Seperti yang anda tahu, RAM adalah bahagian perkakasan yang sangat penting dalam komputer, bertindak sebagai memori untuk memproses data dan merupakan faktor yang menentukan kelajuan komputer riba atau PC. Dalam artikel di bawah, WebTech360 akan memperkenalkan anda kepada beberapa cara untuk menyemak ralat RAM menggunakan perisian pada Windows.

Perbezaan antara TV biasa dan TV Pintar

TV pintar benar-benar telah melanda dunia. Dengan begitu banyak ciri hebat dan sambungan internet, teknologi telah mengubah cara kita menonton TV.

Mengapa peti sejuk tidak mempunyai lampu tetapi peti sejuk ada?

Peti sejuk adalah peralatan biasa dalam isi rumah. Peti ais biasanya mempunyai 2 kompartmen iaitu ruang sejuk yang luas dan mempunyai lampu yang menyala secara automatik setiap kali pengguna membukanya, manakala ruang peti sejuk beku pula sempit dan tiada cahaya.

2 Cara untuk Membetulkan Kesesakan Rangkaian Yang Melambatkan Wi-Fi

Rangkaian Wi-Fi dipengaruhi oleh banyak faktor di luar penghala, lebar jalur dan gangguan, tetapi terdapat beberapa cara pintar untuk meningkatkan rangkaian anda.

Cara Menurunkan Taraf daripada iOS 17 kepada iOS 16 tanpa Kehilangan Data menggunakan Tenorshare Reiboot

Jika anda ingin kembali kepada iOS 16 yang stabil pada telefon anda, berikut ialah panduan asas untuk menyahpasang iOS 17 dan menurunkan taraf daripada iOS 17 kepada 16.

Apa yang berlaku kepada badan apabila anda makan yogurt setiap hari?

Yogurt adalah makanan yang indah. Adakah baik untuk makan yogurt setiap hari? Apabila anda makan yogurt setiap hari, bagaimana badan anda akan berubah? Mari kita ketahui bersama!

Apakah jenis beras yang terbaik untuk kesihatan?

Artikel ini membincangkan jenis beras yang paling berkhasiat dan cara memaksimumkan manfaat kesihatan bagi mana-mana beras yang anda pilih.

Bagaimana untuk bangun tepat pada waktunya pada waktu pagi

Menetapkan jadual tidur dan rutin waktu tidur, menukar jam penggera anda dan melaraskan diet anda ialah beberapa langkah yang boleh membantu anda tidur dengan lebih lena dan bangun tepat pada waktunya pada waktu pagi.

Petua untuk bermain Rent Please! Tuan Tanah Sim untuk Pemula

Tolong Sewa! Landlord Sim ialah permainan mudah alih simulasi pada iOS dan Android. Anda akan bermain sebagai tuan tanah kompleks pangsapuri dan mula menyewa sebuah apartmen dengan matlamat untuk menaik taraf bahagian dalam pangsapuri anda dan menyediakannya untuk penyewa.

Kod Pertahanan Menara Bilik Mandi Terkini dan Cara Memasukkan Kod

Dapatkan kod permainan Bathroom Tower Defense Roblox dan tebus untuk ganjaran yang menarik. Mereka akan membantu anda menaik taraf atau membuka kunci menara dengan kerosakan yang lebih tinggi.