Deepseek Mengeluarkan Model Bahasa Percuma v3 Yang Berjalan dengan Baik pada Konfigurasi Perkakasan Biasa

Permulaan AI China DeepSeek baru sahaja mengeluarkan model bahasa besar (LLM) terbaharunya, DeepSeek-V3-0324. Dengan kapasiti sehingga 641GB, model ini diumumkan pada platform AI ​​Hugging Face tanpa banyak maklumat didedahkan, selari dengan gaya berahsia tentang produk baharu yang selalu diaplikasikan oleh syarikat setakat ini.

Keistimewaan model ini ialah lesen MIT, yang membenarkan penggunaan percuma untuk tujuan komersial. Keputusan penanda aras awal menunjukkan bahawa DeepSeek-V3-0324 mampu berjalan pada konfigurasi perkakasan arus perdana, seperti Apple Mac Studio dengan cip M3 Ultra. Saintis AI Awni Hannun melaporkan bahawa adalah mungkin untuk mencapai kelajuan pemprosesan lebih daripada 20 token sesaat menggunakan konfigurasi ini. Keupayaan untuk menjalankan model bahasa yang besar pada perkakasan komoditi di premis ini sangat berbeza dengan pendekatan tradisional menggunakan infrastruktur pusat data besar-besaran untuk menyokong model AI lanjutan.

Deepseek Mengeluarkan Model Bahasa Percuma v3 Yang Berjalan dengan Baik pada Konfigurasi Perkakasan Biasa

Menurut maklumat daripada DeepSeek, ujian awal telah menunjukkan peningkatan yang ketara berbanding versi sebelumnya. Model ini telah diuji dengan teliti oleh pihak berkepentingan dalaman dan menunjukkan prestasi cemerlang, malah mengatasi semua model pesaing lain dan menewaskan Claude Sonnet 3.5 Anthropic dalam tugasan yang tidak memerlukan pemikiran mendalam. Walau bagaimanapun, tidak seperti model gaya Sonnet yang memerlukan langganan berbayar, DeepSeek-V3-0324 adalah percuma untuk dimuat turun dan digunakan.

Secara teknikal, DeepSeek-V3-0324 menggunakan seni bina campuran pakar (MoE). Ia menonjol kerana keupayaannya untuk secara terpilih menggunakan kira-kira 37 bilion daripada 685 bilion parameter setiap tugas, meningkatkan kecekapan dengan mengurangkan permintaan pengiraan sambil mengekalkan prestasi. Model ini juga menggunakan teknologi Multi-Head Latent Attention (MLA) dan Multi-Token Prediction (MTP), yang menyumbang kepada meningkatkan memori konteks dan mempercepatkan output.

Pengguna boleh mengakses DeepSeek-V3-0324 melalui Hugging Face, antara muka sembang OpenRouter dan API, serta platform sembang DeepSeek jika mahu. Pembekal perkhidmatan inferens Hyperbolic Labs juga menyediakan akses kepada model.

Dengan keluaran DeepSeek-V3-0324, syarikat itu terus menegaskan kedudukannya dalam perlumbaan untuk membangunkan model bahasa yang besar, sambil menyediakan pilihan yang berkuasa dan boleh diakses untuk komuniti penyelidikan dan pembangunan AI. Keupayaan untuk berjalan pada perkakasan komoditi ditambah dengan lesen percuma pastinya akan membuka banyak peluang aplikasi praktikal untuk model ini dalam masa terdekat.

Sign up and earn $1000 a day ⋙

Leave a Comment

Microsoft menyepadukan DeepSeek ke dalam platform PC Copilot+

Microsoft menyepadukan DeepSeek ke dalam platform PC Copilot+

Pada bulan Januari, Microsoft mengumumkan rancangan untuk membawa versi model DeepSeek-R1 yang dioptimumkan NPU terus ke komputer Copilot+ yang dijalankan pada pemproses Qualcomm Snapdragon X.

Cara cepat mendaftar akaun DeepSeek

Cara cepat mendaftar akaun DeepSeek

Aplikasi AI yang berpangkalan di China DeepSeek kini mendahului carta gedung aplikasi.

Penipu Menggunakan Deepseek untuk Mencuri Data Pengguna

Penipu Menggunakan Deepseek untuk Mencuri Data Pengguna

Orang jahat mencipta beribu-ribu tapak web seperti DeepSeek dengan harapan pengguna yang tidak curiga akan memberikan maklumat peribadi mereka.

Softbank merancang untuk mengatasi Microsoft untuk menjadi pelabur terbesar OpenAI

Softbank merancang untuk mengatasi Microsoft untuk menjadi pelabur terbesar OpenAI

Gergasi pelaburan Jepun Softbank merancang untuk melabur $15 hingga $25 bilion dalam OpenAI. Sekiranya perjanjian itu berjaya, Softbank akan menjadi pelabur terbesar OpenAI, menggantikan Microsoft, yang kini memegang jawatan itu.

Iklan DeepSeek Palsu Ini Menyebarkan Perisian Hasad Berbahaya

Iklan DeepSeek Palsu Ini Menyebarkan Perisian Hasad Berbahaya

Satu siri iklan penipuan DeepSeek di Google menyampaikan perisian hasad yang mencuri maklumat berbahaya kepada pengguna DeepSeek yang tidak curiga.

DeepSeek Menjemput Pengguna untuk Menjelajah Di Sebalik Tabir AI Sumber Terbuka Syarikat

DeepSeek Menjemput Pengguna untuk Menjelajah Di Sebalik Tabir AI Sumber Terbuka Syarikat

Permulaan kecerdasan buatan yang berpangkalan di China, DeepSeek merancang untuk menjadi lebih "telus" mengenai teknologi di sebalik model AI sumber terbukanya, seperti model penaakulan R1.

Huawei melancarkan telefon boleh lipat Pura X dengan pembantu AI DeepSeek

Huawei melancarkan telefon boleh lipat Pura X dengan pembantu AI DeepSeek

Huawei sedang memulakan era tanpa Android sepenuhnya dengan Pura X, telefon boleh lipat baharu yang menjalankan perisian HarmonyOS 5 syarikat dan tidak menyertakan pilihan untuk orang ramai menggunakan sistem pengendalian Google.

4 Sebab Anda Perlu Menolak ChatGPT dan Mula Menggunakan DeepSeek

4 Sebab Anda Perlu Menolak ChatGPT dan Mula Menggunakan DeepSeek

DeepSeek ialah nama sebuah syarikat kecerdasan buatan China dan chatbotnya dengan nama yang sama. Model utama syarikat, DeepSeek-V3 dan DeepSeek-R1, telah membuat gelombang kerana mereka lebih murah untuk dilatih dan digunakan daripada rakan sejawat mereka.

Lupakan RTX 5070, Malah RTX 5080 Tidak Boleh Mengalahkan RTX 4090

Lupakan RTX 5070, Malah RTX 5080 Tidak Boleh Mengalahkan RTX 4090

Minggu lalu bukanlah minggu yang menggembirakan bagi pelabur atau peminat Nvidia.

AS mempertimbangkan untuk menyiasat penyeludupan GPU Nvidia ke China untuk menjalankan DeepSeek

AS mempertimbangkan untuk menyiasat penyeludupan GPU Nvidia ke China untuk menjalankan DeepSeek

DeepSeek, syarikat China di sebalik model AI percuma yang menggegarkan dunia teknologi, menghadapi beberapa dakwaan negatif, termasuk penggunaan GPU Nvidia yang diseludup untuk melatih dan menjalankan model AI eponimnya.

Monitor luaran boleh memberi kesan negatif pada bateri komputer riba.

Monitor luaran boleh memberi kesan negatif pada bateri komputer riba.

Menggunakan komputer riba dengan monitor luaran ialah gabungan hebat untuk produktiviti dan membantu anda menyelesaikan kerja. Tetapi lama kelamaan, anda akan mendapati komputer riba anda tiba-tiba kehabisan bateri dengan cepat dan hayat bateri mula berkurangan.

8 kelemahan utama telefon skrin lipat yang anda tidak jangkakan

8 kelemahan utama telefon skrin lipat yang anda tidak jangkakan

Tidak dapat dinafikan bahawa telefon boleh lipat adalah sangat keren. Tetapi selepas beberapa ketika menggunakannya, terdapat beberapa keanehan dengan peranti ini. Berikut ialah 5 kelemahan utama telefon skrin boleh lipat yang anda tidak jangkakan!

Adobe membawa teknologi penciptaan video AI ke Premiere Pro

Adobe membawa teknologi penciptaan video AI ke Premiere Pro

Adobe telah membawa teknologi penciptaan video AI kepada orang ramai dengan cara baharu, walaupun ia masih belum mencipta filem siap menggunakan teknologi tersebut.

Kod Kesan Genshin Terkini April 2025

Kod Kesan Genshin Terkini April 2025

Kod Genshin Impact 5.5 membantu anda menukar Batu Primordial, Mineral Ajaib, pengalaman dan banyak ganjaran lain.

Cara Mengubah iPad Anda menjadi Paparan Mac Tambahan

Cara Mengubah iPad Anda menjadi Paparan Mac Tambahan

macOS Catalina dan iPadOS menyertakan sokongan untuk ciri baharu yang dipanggil Sidecar, direka untuk membolehkan anda menggunakan iPad anda sebagai paparan kedua untuk Mac anda.

Kertas dinding 1280, kertas dinding telefon Nokia 1280 yang cantik

Kertas dinding 1280, kertas dinding telefon Nokia 1280 yang cantik

Ini ialah satu set kertas dinding Nokia 1280, jika anda pernah menghantar mesej teks untuk mendapatkan kertas dinding 1280, kertas dinding telefon bata, kemudian cuba lihat kertas dinding ini.

Pesawat angkasa hipersonik mencapai kelajuan 11,115 km/j

Pesawat angkasa hipersonik mencapai kelajuan 11,115 km/j

Venus Aerospace telah mendedahkan imej pertama pesawat hipersonik baharunya yang dipanggil Stargazer, yang boleh mencapai kelajuan tertinggi 11,115 km/j, bersamaan dengan Mach 9.

Makan pisang untuk sarapan pagi membantu anda mengurangkan kembung perut

Makan pisang untuk sarapan pagi membantu anda mengurangkan kembung perut

Kembung perut boleh berlaku kepada sesiapa sahaja. Berita baiknya ialah sarapan pagi adalah masa yang sesuai untuk menambah beberapa bahan pada hidangan anda yang akan membantu mengurangkan kembung perut. Bahan itu ialah pisang.

OpenAI Mengumumkan Kemas Kini Utama kepada Penjanaan Imej AI dalam ChatGPT

OpenAI Mengumumkan Kemas Kini Utama kepada Penjanaan Imej AI dalam ChatGPT

OpenAI baru sahaja secara rasminya memperkenalkan peningkatan yang luar biasa kepada keupayaan penjanaan imej AI dalam ChatGPT, satu langkah penting ke hadapan dan bukannya menggunakan model penjanaan imej yang berasingan seperti DALL-E sebelumnya.

Deepseek Mengeluarkan Model Bahasa Percuma v3 Yang Berjalan dengan Baik pada Konfigurasi Perkakasan Biasa

Deepseek Mengeluarkan Model Bahasa Percuma v3 Yang Berjalan dengan Baik pada Konfigurasi Perkakasan Biasa

Permulaan AI China DeepSeek baru sahaja mengeluarkan model bahasa besar (LLM) terbaharunya, DeepSeek-V3-0324.

Sebab untuk meninggalkan Gboard dan beralih kepada Papan Kekunci Samsung

Sebab untuk meninggalkan Gboard dan beralih kepada Papan Kekunci Samsung

Gboard telah lama menjadi papan kekunci pilihan pada telefon Android. Walau bagaimanapun, ramai orang baru-baru ini bertukar kepada Papan Kekunci Samsung dan tidak menoleh ke belakang.

Ucapan Manis dan Romantik Hujung Minggu untuk Kekasih

Ucapan Manis dan Romantik Hujung Minggu untuk Kekasih

Hantar ucapan manis dan romantis hujung minggu kepada kekasih anda. Walaupun ia hanyalah kata-kata atau mesej, ia akan menjadi karunia rohani yang bermakna, membantu mengukuhkan hubungan anda.

Siri TV Harry Potter memerlukan elemen berikut untuk berjaya

Siri TV Harry Potter memerlukan elemen berikut untuk berjaya

Pembuatan semula Harry Potter HBO dijangka ditayangkan pada tahun 2026. Inilah yang menjadikan TV Harry Potter berjaya.

Gambar supermoon yang menakjubkan dari seluruh dunia

Gambar supermoon yang menakjubkan dari seluruh dunia

Gambar bulan yang cantik tidak jarang di Internet. Artikel ini akan meringkaskan untuk anda gambar bulan yang paling indah di dunia.

Pengguna AMD Ryzen Perlu Memasang Kemas Kini BIOS Ini untuk Peningkatan Prestasi Percuma

Pengguna AMD Ryzen Perlu Memasang Kemas Kini BIOS Ini untuk Peningkatan Prestasi Percuma

Kini, AMD telah menjawab isu dengan barisan CPU perdananya yang kurang berprestasi dengan kemas kini baharu yang boleh menyampaikan beberapa lagi bingkai sesaat.