Foxconn, syarikat yang paling terkenal dalam pembuatan iPhone dan produk perkakasan Apple yang lain, baru sahaja mengejutkan semua orang dengan mengumumkan model bahasa besar (LLM) pertamanya, dipanggil FoxBrain, yang bertujuan untuk digunakan untuk meningkatkan pengurusan pembuatan dan rantaian bekalan.
Pengilang Taiwan berkata FoxBrain dilatih dengan hanya 120 GPU H100 Nvidia. LLM ini pada asasnya dibangunkan berdasarkan seni bina Meta Llama 3.1, dengan 70 bilion parameter melalui penyulingan. Konsep penghalusan LLM melibatkan penggunaan model "ibu bapa" dan melatih model "anak" berdasarkan responsnya. Foxconn juga mengakui bahawa LLM mereka tidak sebaik model halus DeepSeek (China), tetapi prestasi keseluruhannya sangat hampir dengan piawaian bertaraf dunia.
Bercakap mengenai pencapaian ini, Dr. Yung-Hui Li, Pengarah Pusat Penyelidikan Kepintaran Buatan di Institut Penyelidikan Hon Hai (Foxconn), berkata:
Dalam beberapa bulan kebelakangan ini, peningkatan keupayaan penaakulan dan penggunaan GPU yang cekap secara beransur-ansur menjadi trend utama dalam bidang AI. Model FoxBrain kami menggunakan strategi latihan yang sangat cekap, memfokuskan pada mengoptimumkan proses latihan dan bukannya membuta tuli mengumpul kuasa pengkomputeran.
Melalui kaedah latihan yang direka dengan teliti dan pengoptimuman sumber, kami telah berjaya membina model AI tempatan dengan keupayaan penaakulan yang kukuh."

Foxconn bukan sahaja memasang produk Apple, tetapi juga mengeluarkan pelayan AI Nvidia. Bersama-sama dengan 120 GPU H100, FoxBrain ditingkatkan menggunakan rangkaian InfiniBand Quantum-2 Nvidia, dan latihan mengambil masa hanya kira-kira 4 minggu (untuk jumlah kos pengiraan 2,688 hari GPU). Foxconn menjana 98 bilion token data pralatihan berkualiti tinggi dalam Bahasa Cina Tradisional dengan panjang tetingkap konteks sehingga 128,000 token.
Perkongsian antara Foxconn dan Nvidia bukanlah perkara baharu, dan kedua-dua syarikat itu juga sedang mengusahakan projek lain, termasuk membina kemudahan pembuatan GPU Blackwell terbesar di dunia.
Nvidia juga menyediakan Foxconn superkomputer Taipei-1 untuk melengkapkan proses pra-latihan model. Foxconn berkata FoxBrain akan menjadi "enjin utama" untuk menaik taraf tiga platform utama syarikat: Pembuatan Pintar, Kenderaan Elektrik Pintar dan Bandar Pintar.