Deepseek Mengeluarkan Model Bahasa Percuma v3 Yang Berjalan dengan Baik pada Konfigurasi Perkakasan Biasa

Permulaan AI China DeepSeek baru sahaja mengeluarkan model bahasa besar (LLM) terbaharunya, DeepSeek-V3-0324. Dengan kapasiti sehingga 641GB, model ini diumumkan pada platform AI ​​Hugging Face tanpa banyak maklumat didedahkan, selari dengan gaya berahsia tentang produk baharu yang selalu diaplikasikan oleh syarikat setakat ini.

Keistimewaan model ini ialah lesen MIT, yang membenarkan penggunaan percuma untuk tujuan komersial. Keputusan penanda aras awal menunjukkan bahawa DeepSeek-V3-0324 mampu berjalan pada konfigurasi perkakasan arus perdana, seperti Apple Mac Studio dengan cip M3 Ultra. Saintis AI Awni Hannun melaporkan bahawa adalah mungkin untuk mencapai kelajuan pemprosesan lebih daripada 20 token sesaat menggunakan konfigurasi ini. Keupayaan untuk menjalankan model bahasa yang besar pada perkakasan komoditi di premis ini sangat berbeza dengan pendekatan tradisional menggunakan infrastruktur pusat data besar-besaran untuk menyokong model AI lanjutan.

Deepseek Mengeluarkan Model Bahasa Percuma v3 Yang Berjalan dengan Baik pada Konfigurasi Perkakasan Biasa

Menurut maklumat daripada DeepSeek, ujian awal telah menunjukkan peningkatan yang ketara berbanding versi sebelumnya. Model ini telah diuji dengan teliti oleh pihak berkepentingan dalaman dan menunjukkan prestasi cemerlang, malah mengatasi semua model pesaing lain dan menewaskan Claude Sonnet 3.5 Anthropic dalam tugasan yang tidak memerlukan pemikiran mendalam. Walau bagaimanapun, tidak seperti model gaya Sonnet yang memerlukan langganan berbayar, DeepSeek-V3-0324 adalah percuma untuk dimuat turun dan digunakan.

Secara teknikal, DeepSeek-V3-0324 menggunakan seni bina campuran pakar (MoE). Ia menonjol kerana keupayaannya untuk secara terpilih menggunakan kira-kira 37 bilion daripada 685 bilion parameter setiap tugas, meningkatkan kecekapan dengan mengurangkan permintaan pengiraan sambil mengekalkan prestasi. Model ini juga menggunakan teknologi Multi-Head Latent Attention (MLA) dan Multi-Token Prediction (MTP), yang menyumbang kepada meningkatkan memori konteks dan mempercepatkan output.

Pengguna boleh mengakses DeepSeek-V3-0324 melalui Hugging Face, antara muka sembang OpenRouter dan API, serta platform sembang DeepSeek jika mahu. Pembekal perkhidmatan inferens Hyperbolic Labs juga menyediakan akses kepada model.

Dengan keluaran DeepSeek-V3-0324, syarikat itu terus menegaskan kedudukannya dalam perlumbaan untuk membangunkan model bahasa yang besar, sambil menyediakan pilihan yang berkuasa dan boleh diakses untuk komuniti penyelidikan dan pembangunan AI. Keupayaan untuk berjalan pada perkakasan komoditi ditambah dengan lesen percuma pastinya akan membuka banyak peluang aplikasi praktikal untuk model ini dalam masa terdekat.

Sign up and earn $1000 a day ⋙

Leave a Comment

Mengapa ChatGPT lebih baik daripada DeepSeek

Mengapa ChatGPT lebih baik daripada DeepSeek

Pada mulanya, orang ramai menaruh harapan yang tinggi untuk DeepSeek. Sebagai chatbot AI yang dipasarkan sebagai pesaing kuat kepada ChatGPT, ia menjanjikan keupayaan dan pengalaman sembang pintar.

Alibaba Memperkenalkan QwQ-32b, Pesaing Layak untuk DeepSeek

Alibaba Memperkenalkan QwQ-32b, Pesaing Layak untuk DeepSeek

Sama ada dakwaan Alibaba akan menjadi kenyataan masih belum dapat dilihat, tetapi nampaknya ChatGPT dan DeepSeek kini mempunyai pesaing baharu yang layak.

Microsoft menyepadukan DeepSeek ke dalam platform PC Copilot+

Microsoft menyepadukan DeepSeek ke dalam platform PC Copilot+

Pada bulan Januari, Microsoft mengumumkan rancangan untuk membawa versi model DeepSeek-R1 yang dioptimumkan NPU terus ke komputer Copilot+ yang dijalankan pada pemproses Qualcomm Snapdragon X.

Cara cepat mendaftar akaun DeepSeek

Cara cepat mendaftar akaun DeepSeek

Aplikasi AI yang berpangkalan di China DeepSeek kini mendahului carta gedung aplikasi.

Penipu Menggunakan Deepseek untuk Mencuri Data Pengguna

Penipu Menggunakan Deepseek untuk Mencuri Data Pengguna

Orang jahat mencipta beribu-ribu tapak web seperti DeepSeek dengan harapan pengguna yang tidak curiga akan memberikan maklumat peribadi mereka.

Softbank merancang untuk mengatasi Microsoft untuk menjadi pelabur terbesar OpenAI

Softbank merancang untuk mengatasi Microsoft untuk menjadi pelabur terbesar OpenAI

Gergasi pelaburan Jepun Softbank merancang untuk melabur $15 hingga $25 bilion dalam OpenAI. Sekiranya perjanjian itu berjaya, Softbank akan menjadi pelabur terbesar OpenAI, menggantikan Microsoft, yang kini memegang jawatan itu.

Iklan DeepSeek Palsu Ini Menyebarkan Perisian Hasad Berbahaya

Iklan DeepSeek Palsu Ini Menyebarkan Perisian Hasad Berbahaya

Satu siri iklan penipuan DeepSeek di Google menyampaikan perisian hasad yang mencuri maklumat berbahaya kepada pengguna DeepSeek yang tidak curiga.

DeepSeek Menjemput Pengguna untuk Menjelajah Di Sebalik Tabir AI Sumber Terbuka Syarikat

DeepSeek Menjemput Pengguna untuk Menjelajah Di Sebalik Tabir AI Sumber Terbuka Syarikat

Permulaan kecerdasan buatan yang berpangkalan di China, DeepSeek merancang untuk menjadi lebih "telus" mengenai teknologi di sebalik model AI sumber terbukanya, seperti model penaakulan R1.

Huawei melancarkan telefon boleh lipat Pura X dengan pembantu AI DeepSeek

Huawei melancarkan telefon boleh lipat Pura X dengan pembantu AI DeepSeek

Huawei sedang memulakan era tanpa Android sepenuhnya dengan Pura X, telefon boleh lipat baharu yang menjalankan perisian HarmonyOS 5 syarikat dan tidak menyertakan pilihan untuk orang ramai menggunakan sistem pengendalian Google.

4 Sebab Anda Perlu Menolak ChatGPT dan Mula Menggunakan DeepSeek

4 Sebab Anda Perlu Menolak ChatGPT dan Mula Menggunakan DeepSeek

DeepSeek ialah nama sebuah syarikat kecerdasan buatan China dan chatbotnya dengan nama yang sama. Model utama syarikat, DeepSeek-V3 dan DeepSeek-R1, telah membuat gelombang kerana mereka lebih murah untuk dilatih dan digunakan daripada rakan sejawat mereka.

Lupakan RTX 5070, Malah RTX 5080 Tidak Boleh Mengalahkan RTX 4090

Lupakan RTX 5070, Malah RTX 5080 Tidak Boleh Mengalahkan RTX 4090

Minggu lalu bukanlah minggu yang menggembirakan bagi pelabur atau peminat Nvidia.

AS mempertimbangkan untuk menyiasat penyeludupan GPU Nvidia ke China untuk menjalankan DeepSeek

AS mempertimbangkan untuk menyiasat penyeludupan GPU Nvidia ke China untuk menjalankan DeepSeek

DeepSeek, syarikat China di sebalik model AI percuma yang menggegarkan dunia teknologi, menghadapi beberapa dakwaan negatif, termasuk penggunaan GPU Nvidia yang diseludup untuk melatih dan menjalankan model AI eponimnya.

Perbezaan antara TV biasa dan TV Pintar

Perbezaan antara TV biasa dan TV Pintar

TV pintar benar-benar telah melanda dunia. Dengan begitu banyak ciri hebat dan sambungan internet, teknologi telah mengubah cara kita menonton TV.

Mengapa peti sejuk tidak mempunyai lampu tetapi peti sejuk ada?

Mengapa peti sejuk tidak mempunyai lampu tetapi peti sejuk ada?

Peti sejuk adalah peralatan biasa dalam isi rumah. Peti ais biasanya mempunyai 2 kompartmen iaitu ruang sejuk yang luas dan mempunyai lampu yang menyala secara automatik setiap kali pengguna membukanya, manakala ruang peti sejuk beku pula sempit dan tiada cahaya.

2 Cara untuk Membetulkan Kesesakan Rangkaian Yang Melambatkan Wi-Fi

2 Cara untuk Membetulkan Kesesakan Rangkaian Yang Melambatkan Wi-Fi

Rangkaian Wi-Fi dipengaruhi oleh banyak faktor di luar penghala, lebar jalur dan gangguan, tetapi terdapat beberapa cara pintar untuk meningkatkan rangkaian anda.

Cara Menurunkan Taraf daripada iOS 17 kepada iOS 16 tanpa Kehilangan Data menggunakan Tenorshare Reiboot

Cara Menurunkan Taraf daripada iOS 17 kepada iOS 16 tanpa Kehilangan Data menggunakan Tenorshare Reiboot

Jika anda ingin kembali kepada iOS 16 yang stabil pada telefon anda, berikut ialah panduan asas untuk menyahpasang iOS 17 dan menurunkan taraf daripada iOS 17 kepada 16.

Apa yang berlaku kepada badan apabila anda makan yogurt setiap hari?

Apa yang berlaku kepada badan apabila anda makan yogurt setiap hari?

Yogurt adalah makanan yang indah. Adakah baik untuk makan yogurt setiap hari? Apabila anda makan yogurt setiap hari, bagaimana badan anda akan berubah? Mari kita ketahui bersama!

Apakah jenis beras yang terbaik untuk kesihatan?

Apakah jenis beras yang terbaik untuk kesihatan?

Artikel ini membincangkan jenis beras yang paling berkhasiat dan cara memaksimumkan manfaat kesihatan bagi mana-mana beras yang anda pilih.

Bagaimana untuk bangun tepat pada waktunya pada waktu pagi

Bagaimana untuk bangun tepat pada waktunya pada waktu pagi

Menetapkan jadual tidur dan rutin waktu tidur, menukar jam penggera anda dan melaraskan diet anda ialah beberapa langkah yang boleh membantu anda tidur dengan lebih lena dan bangun tepat pada waktunya pada waktu pagi.

Petua untuk bermain Rent Please! Tuan Tanah Sim untuk Pemula

Petua untuk bermain Rent Please! Tuan Tanah Sim untuk Pemula

Tolong Sewa! Landlord Sim ialah permainan mudah alih simulasi pada iOS dan Android. Anda akan bermain sebagai tuan tanah kompleks pangsapuri dan mula menyewa sebuah apartmen dengan matlamat untuk menaik taraf bahagian dalam pangsapuri anda dan menyediakannya untuk penyewa.

Kod Pertahanan Menara Bilik Mandi Terkini dan Cara Memasukkan Kod

Kod Pertahanan Menara Bilik Mandi Terkini dan Cara Memasukkan Kod

Dapatkan kod permainan Bathroom Tower Defense Roblox dan tebus untuk ganjaran yang menarik. Mereka akan membantu anda menaik taraf atau membuka kunci menara dengan kerosakan yang lebih tinggi.

Struktur, simbol dan prinsip operasi transformer

Struktur, simbol dan prinsip operasi transformer

Mari belajar tentang struktur, simbol dan prinsip operasi transformer dengan cara yang paling tepat.

4 Cara AI Menjadikan TV Pintar Lebih Baik

4 Cara AI Menjadikan TV Pintar Lebih Baik

Daripada kualiti gambar dan bunyi yang lebih baik kepada kawalan suara dan banyak lagi, ciri dikuasakan AI ini menjadikan TV pintar lebih baik!

Mengapa ChatGPT lebih baik daripada DeepSeek

Mengapa ChatGPT lebih baik daripada DeepSeek

Pada mulanya, orang ramai menaruh harapan yang tinggi untuk DeepSeek. Sebagai chatbot AI yang dipasarkan sebagai pesaing kuat kepada ChatGPT, ia menjanjikan keupayaan dan pengalaman sembang pintar.

Temui Fireflies.ai: Setiausaha AI Percuma Yang Menjimatkan Masa Kerja Anda

Temui Fireflies.ai: Setiausaha AI Percuma Yang Menjimatkan Masa Kerja Anda

Sangat mudah untuk terlepas butiran penting semasa mencatat perkara penting lain, dan cuba mencatat nota semasa bersembang boleh mengganggu. Fireflies.ai adalah penyelesaiannya.

Bagaimana untuk membesarkan Axolotl Minecraft, menjinakkan Minecraft Salamander

Bagaimana untuk membesarkan Axolotl Minecraft, menjinakkan Minecraft Salamander

Axolot Minecraft akan menjadi pembantu yang hebat untuk pemain semasa beroperasi di bawah air jika mereka tahu cara menggunakannya.

Tempat yang Tenang: Konfigurasi Permainan PC Jalan Hadapan

Tempat yang Tenang: Konfigurasi Permainan PC Jalan Hadapan

Tempat yang Tenang: Konfigurasi The Road Ahead dinilai agak tinggi, jadi anda perlu mempertimbangkan konfigurasi sebelum membuat keputusan untuk memuat turun.