OpenAI Mengumumkan GPT-4.1 - Model Paling Pintar untuk Tugasan Kompleks

OpenAI secara rasminya telah memperkenalkan tiga model baharu: GPT-4.1, GPT-4.1 mini dan GPT-4.1 nano. Model ini disertakan dengan keupayaan pemprosesan konteks yang besar sehingga 1 juta token dan had pengetahuan yang dikemas kini sehingga Jun 2024.

Syarikat itu berkata model ini mengatasi prestasi GPT-4o dan GPT-4o mini yang dikemas kini baru-baru ini, yang dilancarkan Julai lalu. Pada masa ini GPT-4.1 hanya tersedia melalui API, jadi anda tidak akan dapat menggunakannya secara langsung dalam ChatGPT lagi.

OpenAI menyatakan bahawa GPT-4.1 hanya akan tersedia melalui API. Dalam ChatGPT, banyak penambahbaikan dalam pematuhan arahan, pengaturcaraan dan kecerdasan telah disepadukan secara beransur-ansur ke dalam versi terkini GPT-4o, dan syarikat akan terus menambah lebih banyak lagi dalam keluaran akan datang.

OpenAI Mengumumkan GPT-4.1 - Model Paling Pintar untuk Tugasan Kompleks

Penanda aras menunjukkan peningkatan luar biasa yang dibawa oleh GPT-4.1. Model ini mendapat markah 54.6% pada SWE-bench Verified, peningkatan 21.4 mata berbanding GPT-4o. Model ini mendapat markah 38.3% pada MultiChallenge — penanda aras yang mengukur pematuhan garis panduan — dan menetapkan rekod baharu untuk pemahaman video dalam bentuk panjang dengan skor 72.0% pada penanda aras Video-MME, di mana model menganalisis video sehingga satu jam tanpa kapsyen.

OpenAI juga telah bekerjasama dengan rakan kongsi alpha untuk menguji prestasi GPT-4.1 dalam kes penggunaan dunia sebenar.

  • Thomson Reuters menguji GPT-4.1 dengan pembantu AI sahnya CoCounsel. Berbanding dengan GPT-4o, GPT-4.1 merekodkan peningkatan 17% dalam ketepatan dalam penilaian berbilang dokumen. Jenis kerja ini sangat bergantung pada keupayaan untuk menjejak konteks merentas pelbagai sumber dan mengenal pasti perhubungan yang kompleks seperti istilah yang bercanggah atau kebergantungan tersembunyi, dan GPT-4.1 telah menunjukkan prestasi yang kukuh secara konsisten.
  • Carlyle menggunakan GPT-4.1 untuk mengekstrak data kewangan daripada dokumen yang panjang dan kompleks, termasuk fail Excel dan PDF. Menurut penanda aras dalaman syarikat, model tersebut berprestasi 50% lebih baik daripada model sebelumnya dalam pengambilan dokumen. Ia merupakan model pertama yang menangani masalah dengan pasti seperti mencari "jarum dalam timbunan jerami", kehilangan maklumat di tengah-tengah dokumen dan hujah yang memerlukan maklumat penyambungan merentas berbilang fail.

Prestasi adalah satu perkara, tetapi kelajuan adalah sama penting. OpenAI berkata GPT-4.1 mengembalikan token pertama dalam masa kira-kira 15 saat apabila memproses 128,000 token, dan sehingga 30 saat pada sejuta token penuh. GPT-4.1 mini dan nano adalah lebih pantas.

GPT-4.1 nano biasanya bertindak balas dalam masa kurang daripada 5 saat kepada gesaan dengan 128,000 token input. Caching segera boleh mengurangkan lagi kependaman sambil menjimatkan kos.

Pemahaman imej juga mencapai kemajuan yang ketara. Khususnya, GPT-4.1 mini mengatasi GPT-4o pada pelbagai penanda aras visual.

  • Pada MMMU (termasuk graf, rajah dan peta), GPT-4.1 mini mendapat markah 73%. Ini lebih tinggi daripada GPT-4.5 dan jauh melebihi 56% GPT-4o mini.
  • Pada MathVista (yang menguji keupayaan untuk menyelesaikan masalah imej), kedua-dua GPT-4.1 dan GPT-4.1 mini memperoleh 57%, jauh mengatasi 37% GPT-4o mini.
  • Mengenai CharXiv-Reasoning , di mana model menjawab soalan berdasarkan graf saintifik, GPT-4.1 terus mendahului.
  • Pada Video-MME (video panjang tanpa sari kata), GPT-4.1 mencapai 72%, peningkatan ketara berbanding 65% GPT-4o.

Mengenai harga:

  • GPT-4.1 berharga $2 setiap 1 juta input token dan $8 untuk output.
  • GPT-4.1 mini berharga $0.40 untuk input dan $1.60 untuk output.
  • GPT-4.1 nano berharga $0.10 input dan $0.40 output.

Menggunakan caching segera atau API Batch boleh mengurangkan lagi kos ini, yang bagus untuk aplikasi berskala besar. OpenAI juga sedang bersedia untuk menghentikan sokongan untuk Pratonton GPT-4.5 pada 14 Julai 2025, memetik prestasi GPT-4.1 yang lebih baik, kependaman yang lebih rendah dan kos yang lebih rendah.

Leave a Comment

OpenAI Mengumumkan Operator, Ejen AI yang Secara Automatik Melaksanakan Tugas Bagi Pihak Pengguna

OpenAI Mengumumkan Operator, Ejen AI yang Secara Automatik Melaksanakan Tugas Bagi Pihak Pengguna

Syarikat di belakang ChatGPT mendedahkan cara baharu untuk menggunakan AI. OpenAI baru sahaja mengumumkan Operator, ejen AI yang boleh melaksanakan tugas secara automatik untuk anda.

OpenAI Melancarkan Alat Baharu untuk Membantu Pembangun Membina Ejen AI

OpenAI Melancarkan Alat Baharu untuk Membantu Pembangun Membina Ejen AI

Melihat ejen AI sebagai masa depan industri kecerdasan buatan, OpenAI mengakui bahawa membina ejen "gred industri" yang berkuasa dengan alatan semasa adalah sangat sukar.

Alibaba Memperkenalkan QwQ-32b, Pesaing Layak untuk DeepSeek

Alibaba Memperkenalkan QwQ-32b, Pesaing Layak untuk DeepSeek

Sama ada dakwaan Alibaba akan menjadi kenyataan masih belum dapat dilihat, tetapi nampaknya ChatGPT dan DeepSeek kini mempunyai pesaing baharu yang layak.

OpenAI Mencabar Google Chrome Dengan Penyemak Imbas Baharunya

OpenAI Mencabar Google Chrome Dengan Penyemak Imbas Baharunya

OpenAI dilaporkan sedang mengusahakan projek pelayar web yang berpotensi bersaing secara langsung dengan Google Chrome.

Samsung bekerjasama dengan OpenAI untuk membangunkan AI TV, menjanjikan banyak ciri menarik

Samsung bekerjasama dengan OpenAI untuk membangunkan AI TV, menjanjikan banyak ciri menarik

Samsung Electronics dilaporkan bekerjasama dengan OpenAI dalam projek bersama yang bercita-cita tinggi untuk membangunkan TV AI yang menggabungkan teknologi kecerdasan buatan yang menerajui industri.

Microsoft akan terus melabur banyak dalam OpenAI pada penilaian lebih daripada $100 bilion

Microsoft akan terus melabur banyak dalam OpenAI pada penilaian lebih daripada $100 bilion

Microsoft telah melabur berbilion dolar dalam OpenAI sejak 2019, walaupun gergasi perisian berasaskan Redmond itu bukanlah pelabur utama dalam permulaan AI yang inovatif.

OpenAI ditetapkan untuk memperoleh Windsurf - salah satu editor kod AI yang paling berkuasa di dunia

OpenAI ditetapkan untuk memperoleh Windsurf - salah satu editor kod AI yang paling berkuasa di dunia

OpenAI sedang berbincang untuk memperoleh Windsurf, editor kod berkuasa AI terkemuka dalam industri.

O1-pro ialah model AI OpenAI yang paling mahal setakat ini

O1-pro ialah model AI OpenAI yang paling mahal setakat ini

OpenAI telah mengeluarkan versi yang lebih berkuasa bagi model AI penaakulan o1nya, o1-pro, dalam API pembangunnya.

OpenAI Mengumumkan Pelan ChatGPT Pro untuk $200 sebulan

OpenAI Mengumumkan Pelan ChatGPT Pro untuk $200 sebulan

OpenAI kini menawarkan empat tahap langganan ChatGPT untuk memenuhi keperluan kumpulan pelanggan yang berbeza.

OpenAI Memperkenalkan Projek ChatGPT: Ciri Baharu untuk Menyusun Perbualan Lebih Pintar

OpenAI Memperkenalkan Projek ChatGPT: Ciri Baharu untuk Menyusun Perbualan Lebih Pintar

Dengan mencipta projek, pengguna boleh menyimpan perbualan, fail dan arahan penyesuaian semuanya di satu tempat. Ini membolehkan mereka dengan mudah kembali kepada apa yang mereka lakukan.

OpenAI Mengumumkan Inisiatif untuk Membina Piawaian AI untuk Industri

OpenAI Mengumumkan Inisiatif untuk Membina Piawaian AI untuk Industri

OpenAI baru sahaja mengumumkan Program Perintis – usaha untuk mempromosikan aplikasi AI dalam situasi dunia sebenar.

Softbank merancang untuk mengatasi Microsoft untuk menjadi pelabur terbesar OpenAI

Softbank merancang untuk mengatasi Microsoft untuk menjadi pelabur terbesar OpenAI

Gergasi pelaburan Jepun Softbank merancang untuk melabur $15 hingga $25 bilion dalam OpenAI. Sekiranya perjanjian itu berjaya, Softbank akan menjadi pelabur terbesar OpenAI, menggantikan Microsoft, yang kini memegang jawatan itu.

Pengguna boleh bersembang dengan Santa menggunakan Mod Suara ChatGPT

Pengguna boleh bersembang dengan Santa menggunakan Mod Suara ChatGPT

ChatGPT akan membantu anda melakukan sesuatu dengan lebih baik, memberi anda peluang untuk bersembang terus dengan Santa Claus.

OpenAI untuk Melancarkan Orion, Model AI Besar Seterusnya, pada bulan Disember

OpenAI untuk Melancarkan Orion, Model AI Besar Seterusnya, pada bulan Disember

OpenAI merancang untuk melancarkan Orion, model AI utama seterusnya, pada bulan Disember, menurut The Verge.

Cara Membaiki Microsoft Teams Di Mana Boleh Cari Ralat Team

Cara Membaiki Microsoft Teams Di Mana Boleh Cari Ralat Team

Bosan dengan ralat Microsoft Teams Where to Find Team yang mengecewakan? Dapatkan pembetulan langkah demi langkah untuk desktop, web dan mudah alih. Selesaikannya dengan cepat dengan panduan pakar kami—tiada kemahiran teknikal diperlukan!

Cara Membaiki Ralat Bantuan Cara Menggunakan Microsoft Teams

Cara Membaiki Ralat Bantuan Cara Menggunakan Microsoft Teams

Bosan dengan Ralat Bantuan Microsoft Teams yang mengecewakan yang menyekat aliran kerja anda? Dapatkan pembetulan langkah demi langkah yang berfungsi pada versi terkini. Kosongkan cache, kemas kini dan banyak lagi—tiada kemahiran teknikal diperlukan!

Cara Membaiki Ralat Log Masuk Microsoft Teams pada Chromebook

Cara Membaiki Ralat Log Masuk Microsoft Teams pada Chromebook

Menghadapi ralat log masuk Microsoft Teams pada Chromebook? Temui penyelesaian langkah demi langkah untuk menyelesaikan masalah log masuk dengan cepat. Kosongkan cache, kemas kini aplikasi dan banyak lagi untuk kerja berpasukan yang lancar. Berfungsi pada OS Chrome terkini!

Menyelesaikan Masalah Kelewatan Persidangan Video Microsoft Teams pada Wi-Fi

Menyelesaikan Masalah Kelewatan Persidangan Video Microsoft Teams pada Wi-Fi

Bergelut dengan kelewatan persidangan video Microsoft Teams semasa menggunakan Wi-Fi? Panduan penyelesaian masalah muktamad ini memberikan penyelesaian pantas, petua lanjutan dan pengoptimuman Wi-Fi untuk memulihkan panggilan video yang jelas serta-merta.

Mengapa Status Microsoft Teams Saya Tersekat?

Mengapa Status Microsoft Teams Saya Tersekat?

Kecewa dengan status Microsoft Teams anda yang tersekat pada Away? Ketahui sebab utama seperti tamat masa melahu dan tetapan kuasa, serta pembetulan langkah demi langkah untuk kembali ke Available dengan pantas. Dikemas kini dengan ciri Teams terkini.

Menyelesaikan Ralat Sertai Mesyuarat Microsoft Teams melalui Pautan Langsung

Menyelesaikan Ralat Sertai Mesyuarat Microsoft Teams melalui Pautan Langsung

Bergelut dengan Ralat Sertai Mesyuarat Microsoft Teams? Temui langkah-langkah terbukti untuk menyelesaikannya melalui pautan langsung. Penyelesaian pantas untuk penyertaan yang lancar – tiada kemahiran teknikal diperlukan!

Di Mana Boleh Cari Kod QR Microsoft Teams untuk Log Masuk Mudah Alih Pantas

Di Mana Boleh Cari Kod QR Microsoft Teams untuk Log Masuk Mudah Alih Pantas

Ketahui dengan tepat di mana untuk mencari Kod QR Microsoft Teams untuk log masuk mudah alih yang sangat pantas. Panduan langkah demi langkah dengan visual untuk memudahkan anda berhubung dalam beberapa saat—tiada kata laluan diperlukan!

Cara Membaiki Ralat Main Semula Media Microsoft Teams pada tahun 2026

Cara Membaiki Ralat Main Semula Media Microsoft Teams pada tahun 2026

Bosan dengan ralat main balik media Microsoft Teams yang merosakkan mesyuarat 2026 anda? Ikuti panduan pakar langkah demi langkah kami untuk membetulkan gangguan audio, video dan perkongsian dengan pantas—tiada kemahiran teknikal diperlukan. Kolaborasi yang lancar menanti!

Di manakah Kunci Pendaftaran Microsoft Teams Terletak pada Windows 11?

Di manakah Kunci Pendaftaran Microsoft Teams Terletak pada Windows 11?

Buka kunci lokasi tepat kunci pendaftaran Microsoft Teams pada Windows 11. Panduan langkah demi langkah untuk mencari, mengakses dan mengubahnya dengan selamat untuk prestasi dan penyelesaian masalah yang optimum. Penting untuk profesional IT dan peminat Teams.

Menyelesaikan Masalah Gelung Permulaan Skrin Aluan Microsoft Teams

Menyelesaikan Masalah Gelung Permulaan Skrin Aluan Microsoft Teams

Kecewa dengan gelung permulaan skrin alu-aluan Microsoft Teams? Ikuti langkah penyelesaian masalah yang terbukti untuk gelung permulaan skrin alu-aluan Microsoft Teams kami: kosongkan cache, tetapkan semula aplikasi, pasang semula. Kembali ke kolaborasi yang lancar dalam beberapa minit!

Penyelesaian Masalah Ralat Proksi Microsoft Teams

Penyelesaian Masalah Ralat Proksi Microsoft Teams

Bergelut dengan Ralat Proksi Microsoft Teams? Ketahui Penyelesaian Masalah Ralat Proksi Microsoft Teams yang terbukti Langkah-langkah pembetulan. Kosongkan cache, laraskan tetapan proksi dan kembali kepada panggilan lancar dalam beberapa minit dengan panduan pakar kami.

Di manakah Microsoft Teams dalam Outlook? Mencari Ikon yang Hilang

Di manakah Microsoft Teams dalam Outlook? Mencari Ikon yang Hilang

Kecewa dengan ikon Microsoft Teams yang hilang dalam Outlook? Ketahui dengan tepat di mana untuk mencarinya, mengapa ia hilang dan langkah-langkah terbukti untuk memulihkannya untuk mesyuarat yang mudah. ​​Dikemas kini untuk versi terkini!

Mengapa Microsoft Teams Begitu Perlahan? 10 Petua untuk Mempercepatkannya pada Tahun 2026

Mengapa Microsoft Teams Begitu Perlahan? 10 Petua untuk Mempercepatkannya pada Tahun 2026

Kecewa dengan Microsoft Teams yang lambat? Ketahui mengapa Microsoft Teams begitu perlahan dan gunakan 10 petua terbukti ini untuk mempercepatkannya secara dramatik pada tahun 2026 untuk kolaborasi yang lancar.

Cara Log Masuk ke Pusat Pentadbiran Microsoft Teams dengan Betul

Cara Log Masuk ke Pusat Pentadbiran Microsoft Teams dengan Betul

Kuasai cara log masuk ke Pusat Pentadbiran Microsoft Teams dengan betul dengan panduan langkah demi langkah kami yang tepat. Betulkan ralat biasa, pastikan keselamatan dan uruskan Teams dengan mudah untuk pentadbir di mana-mana sahaja.

Cara Muat Turun Microsoft Teams untuk Mac dan MacBook Air/Pro

Cara Muat Turun Microsoft Teams untuk Mac dan MacBook Air/Pro

Temui cara paling mudah untuk memuat turun Microsoft Teams untuk Mac, MacBook Air dan MacBook Pro. Arahan langkah demi langkah, keperluan sistem dan petua penyelesaian masalah untuk pemasangan yang lancar dalam versi terkini. Mulakan sekarang!