Cerebras Melancarkan Teknologi Inferens AI Terpantas di Dunia, Prestasi 20x ganda Daripada NVIDIA

Sistem Cerebras baru sahaja mengumumkan Inferens Cerebras secara rasmi, yang dianggap sebagai penyelesaian inferens AI terpantas di dunia. Inferens Cerebras ini menyampaikan prestasi sehingga 1,800 token sesaat untuk model Llama 3.1 8B (8 bilion parameter) dan 450 token sesaat untuk Llama 3.1 70B, yang sehingga hampir 20 kali lebih pantas daripada penyelesaian inferens AI berasaskan GPU NVIDIA yang tersedia dalam awan Azure berskala besar di seluruh dunia hari ini.

Selain prestasinya yang luar biasa, harga perkhidmatan penyelesaian inferens baharu ini juga sangat murah, pada sebahagian kecil daripada harga platform awan GPU yang popular. Sebagai contoh, pelanggan boleh mendapatkan satu juta token dengan hanya 10 sen, sekali gus memberikan prestasi harga 100x lebih tinggi untuk beban kerja AI.

Ketepatan 16-bit Cerebras dan kelajuan inferens 20x lebih pantas akan membolehkan pembangun membina aplikasi AI berprestasi tinggi generasi seterusnya tanpa menjejaskan kelajuan atau kos. Nisbah harga/prestasi terobosan ini dimungkinkan oleh sistem Cerebras CS-3 dan pemproses AI Wafer Scale Engine 3 (WSE-3). CS-3 menawarkan 7,000 kali lebih lebar jalur memori daripada Nvidia H100, menyelesaikan cabaran teknikal jalur lebar memori untuk AI generatif.

Cerebras Melancarkan Teknologi Inferens AI Terpantas di Dunia, Prestasi 20x ganda Daripada NVIDIA

Inferens Cerebras kini tersedia pada tiga peringkat berikut:

Peringkat Percuma menawarkan akses API percuma dan had penggunaan yang besar kepada sesiapa sahaja yang mendaftar.
Peringkat Pembangun direka bentuk untuk penggunaan fleksibel tanpa pelayan, menyediakan pengguna dengan titik akhir API pada sebahagian kecil daripada kos alternatif sedia ada di pasaran, dengan model Llama 3.1 8B dan 70B masing-masing berharga 10 sen dan 60 sen bagi setiap juta token.
Pelan Peringkat Perusahaan menawarkan model yang diperhalusi, perjanjian tahap perkhidmatan tersuai dan sokongan khusus. Sesuai untuk beban kerja yang berterusan, perniagaan boleh mengakses Inferens Cerebras melalui awan peribadi yang diuruskan oleh Cerebras atau di premis.

Dengan prestasi rekod, harga kompetitif dan akses API terbuka, Cerebras Inference menetapkan standard baharu untuk pembangunan dan penggunaan LLM terbuka. Sebagai satu-satunya penyelesaian yang mampu menyampaikan latihan dan inferens berkelajuan tinggi, Cerebras membuka kemungkinan baharu sepenuhnya untuk AI.

Dengan trend AI berkembang pesat, dan NVIDIA kini memegang kedudukan dominan dalam pasaran, kemunculan syarikat seperti Cerebras dan Groq menandakan potensi peralihan dalam dinamik keseluruhan industri. Memandangkan permintaan untuk penyelesaian inferens AI yang lebih pantas dan lebih kos efektif meningkat, penyelesaian seperti Cerebras Inference berada pada kedudukan yang baik untuk mengambil peluang terhadap penguasaan NVIDIA, terutamanya dalam ruang inferens.

Tags: #cerebras #teknologi inferens ai #nvidia #kecerdasan buatan

Bagaimana untuk mendapatkan semula akses kepada cakera keras, betulkan ralat kerana tidak dapat membuka cakera keras

Dalam artikel ini, kami akan membimbing anda cara mendapatkan semula akses kepada cakera keras anda apabila ia gagal. Jom ikut!

Cara menggunakan Kesedaran Perbualan dan Dengar Langsung pada AirPods

Pada pandangan pertama, AirPods kelihatan seperti mana-mana fon telinga wayarles sebenar yang lain. Tetapi itu semua berubah apabila beberapa ciri yang kurang diketahui ditemui.

Semua tentang iOS 26

Apple telah memperkenalkan iOS 26 – kemas kini utama dengan reka bentuk kaca beku yang serba baharu, pengalaman yang lebih pintar dan penambahbaikan pada apl biasa.

Komputer riba terbaik untuk pelajar pada tahun 2025

Pelajar memerlukan jenis komputer riba tertentu untuk pengajian mereka. Ia bukan sahaja cukup berkuasa untuk beraksi dengan baik dalam jurusan pilihan mereka, tetapi juga padat dan cukup ringan untuk dibawa sepanjang hari.

Bagaimana untuk menambah pencetak pada Windows 10

Menambah pencetak pada Windows 10 adalah mudah, walaupun proses untuk peranti berwayar akan berbeza daripada peranti wayarles.

Cara menyemak RAM dan menyemak ralat RAM pada komputer anda dengan kadar ketepatan tertinggi

Seperti yang anda tahu, RAM adalah bahagian perkakasan yang sangat penting dalam komputer, bertindak sebagai memori untuk memproses data dan merupakan faktor yang menentukan kelajuan komputer riba atau PC. Dalam artikel di bawah, WebTech360 akan memperkenalkan anda kepada beberapa cara untuk menyemak ralat RAM menggunakan perisian pada Windows.

Perbezaan antara TV biasa dan TV Pintar

TV pintar benar-benar telah melanda dunia. Dengan begitu banyak ciri hebat dan sambungan internet, teknologi telah mengubah cara kita menonton TV.

Mengapa peti sejuk tidak mempunyai lampu tetapi peti sejuk ada?

Peti sejuk adalah peralatan biasa dalam isi rumah. Peti ais biasanya mempunyai 2 kompartmen iaitu ruang sejuk yang luas dan mempunyai lampu yang menyala secara automatik setiap kali pengguna membukanya, manakala ruang peti sejuk beku pula sempit dan tiada cahaya.

2 Cara untuk Membetulkan Kesesakan Rangkaian Yang Melambatkan Wi-Fi

Rangkaian Wi-Fi dipengaruhi oleh banyak faktor di luar penghala, lebar jalur dan gangguan, tetapi terdapat beberapa cara pintar untuk meningkatkan rangkaian anda.

Cara Menurunkan Taraf daripada iOS 17 kepada iOS 16 tanpa Kehilangan Data menggunakan Tenorshare Reiboot

Jika anda ingin kembali kepada iOS 16 yang stabil pada telefon anda, berikut ialah panduan asas untuk menyahpasang iOS 17 dan menurunkan taraf daripada iOS 17 kepada 16.

Apa yang berlaku kepada badan apabila anda makan yogurt setiap hari?

Yogurt adalah makanan yang indah. Adakah baik untuk makan yogurt setiap hari? Apabila anda makan yogurt setiap hari, bagaimana badan anda akan berubah? Mari kita ketahui bersama!

Apakah jenis beras yang terbaik untuk kesihatan?

Artikel ini membincangkan jenis beras yang paling berkhasiat dan cara memaksimumkan manfaat kesihatan bagi mana-mana beras yang anda pilih.

Bagaimana untuk bangun tepat pada waktunya pada waktu pagi

Menetapkan jadual tidur dan rutin waktu tidur, menukar jam penggera anda dan melaraskan diet anda ialah beberapa langkah yang boleh membantu anda tidur dengan lebih lena dan bangun tepat pada waktunya pada waktu pagi.

Petua untuk bermain Rent Please! Tuan Tanah Sim untuk Pemula

Tolong Sewa! Landlord Sim ialah permainan mudah alih simulasi pada iOS dan Android. Anda akan bermain sebagai tuan tanah kompleks pangsapuri dan mula menyewa sebuah apartmen dengan matlamat untuk menaik taraf bahagian dalam pangsapuri anda dan menyediakannya untuk penyewa.

Kod Pertahanan Menara Bilik Mandi Terkini dan Cara Memasukkan Kod

Dapatkan kod permainan Bathroom Tower Defense Roblox dan tebus untuk ganjaran yang menarik. Mereka akan membantu anda menaik taraf atau membuka kunci menara dengan kerosakan yang lebih tinggi.