OpenAI Mengumumkan GPT-4.1 - Model Paling Pintar untuk Tugasan Kompleks

OpenAI secara rasminya telah memperkenalkan tiga model baharu: GPT-4.1, GPT-4.1 mini dan GPT-4.1 nano. Model ini disertakan dengan keupayaan pemprosesan konteks yang besar sehingga 1 juta token dan had pengetahuan yang dikemas kini sehingga Jun 2024.

Syarikat itu berkata model ini mengatasi prestasi GPT-4o dan GPT-4o mini yang dikemas kini baru-baru ini, yang dilancarkan Julai lalu. Pada masa ini GPT-4.1 hanya tersedia melalui API, jadi anda tidak akan dapat menggunakannya secara langsung dalam ChatGPT lagi.

OpenAI menyatakan bahawa GPT-4.1 hanya akan tersedia melalui API. Dalam ChatGPT, banyak penambahbaikan dalam pematuhan arahan, pengaturcaraan dan kecerdasan telah disepadukan secara beransur-ansur ke dalam versi terkini GPT-4o, dan syarikat akan terus menambah lebih banyak lagi dalam keluaran akan datang.

OpenAI Mengumumkan GPT-4.1 - Model Paling Pintar untuk Tugasan Kompleks

Penanda aras menunjukkan peningkatan luar biasa yang dibawa oleh GPT-4.1. Model ini mendapat markah 54.6% pada SWE-bench Verified, peningkatan 21.4 mata berbanding GPT-4o. Model ini mendapat markah 38.3% pada MultiChallenge — penanda aras yang mengukur pematuhan garis panduan — dan menetapkan rekod baharu untuk pemahaman video dalam bentuk panjang dengan skor 72.0% pada penanda aras Video-MME, di mana model menganalisis video sehingga satu jam tanpa kapsyen.

OpenAI juga telah bekerjasama dengan rakan kongsi alpha untuk menguji prestasi GPT-4.1 dalam kes penggunaan dunia sebenar.

  • Thomson Reuters menguji GPT-4.1 dengan pembantu AI sahnya CoCounsel. Berbanding dengan GPT-4o, GPT-4.1 merekodkan peningkatan 17% dalam ketepatan dalam penilaian berbilang dokumen. Jenis kerja ini sangat bergantung pada keupayaan untuk menjejak konteks merentas pelbagai sumber dan mengenal pasti perhubungan yang kompleks seperti istilah yang bercanggah atau kebergantungan tersembunyi, dan GPT-4.1 telah menunjukkan prestasi yang kukuh secara konsisten.
  • Carlyle menggunakan GPT-4.1 untuk mengekstrak data kewangan daripada dokumen yang panjang dan kompleks, termasuk fail Excel dan PDF. Menurut penanda aras dalaman syarikat, model tersebut berprestasi 50% lebih baik daripada model sebelumnya dalam pengambilan dokumen. Ia merupakan model pertama yang menangani masalah dengan pasti seperti mencari "jarum dalam timbunan jerami", kehilangan maklumat di tengah-tengah dokumen dan hujah yang memerlukan maklumat penyambungan merentas berbilang fail.

Prestasi adalah satu perkara, tetapi kelajuan adalah sama penting. OpenAI berkata GPT-4.1 mengembalikan token pertama dalam masa kira-kira 15 saat apabila memproses 128,000 token, dan sehingga 30 saat pada sejuta token penuh. GPT-4.1 mini dan nano adalah lebih pantas.

GPT-4.1 nano biasanya bertindak balas dalam masa kurang daripada 5 saat kepada gesaan dengan 128,000 token input. Caching segera boleh mengurangkan lagi kependaman sambil menjimatkan kos.

Pemahaman imej juga mencapai kemajuan yang ketara. Khususnya, GPT-4.1 mini mengatasi GPT-4o pada pelbagai penanda aras visual.

  • Pada MMMU (termasuk graf, rajah dan peta), GPT-4.1 mini mendapat markah 73%. Ini lebih tinggi daripada GPT-4.5 dan jauh melebihi 56% GPT-4o mini.
  • Pada MathVista (yang menguji keupayaan untuk menyelesaikan masalah imej), kedua-dua GPT-4.1 dan GPT-4.1 mini memperoleh 57%, jauh mengatasi 37% GPT-4o mini.
  • Mengenai CharXiv-Reasoning , di mana model menjawab soalan berdasarkan graf saintifik, GPT-4.1 terus mendahului.
  • Pada Video-MME (video panjang tanpa sari kata), GPT-4.1 mencapai 72%, peningkatan ketara berbanding 65% GPT-4o.

Mengenai harga:

  • GPT-4.1 berharga $2 setiap 1 juta input token dan $8 untuk output.
  • GPT-4.1 mini berharga $0.40 untuk input dan $1.60 untuk output.
  • GPT-4.1 nano berharga $0.10 input dan $0.40 output.

Menggunakan caching segera atau API Batch boleh mengurangkan lagi kos ini, yang bagus untuk aplikasi berskala besar. OpenAI juga sedang bersedia untuk menghentikan sokongan untuk Pratonton GPT-4.5 pada 14 Julai 2025, memetik prestasi GPT-4.1 yang lebih baik, kependaman yang lebih rendah dan kos yang lebih rendah.

Sign up and earn $1000 a day ⋙

Leave a Comment

OpenAI Mengumumkan Operator, Ejen AI yang Secara Automatik Melaksanakan Tugas Bagi Pihak Pengguna

OpenAI Mengumumkan Operator, Ejen AI yang Secara Automatik Melaksanakan Tugas Bagi Pihak Pengguna

Syarikat di belakang ChatGPT mendedahkan cara baharu untuk menggunakan AI. OpenAI baru sahaja mengumumkan Operator, ejen AI yang boleh melaksanakan tugas secara automatik untuk anda.

OpenAI Melancarkan Alat Baharu untuk Membantu Pembangun Membina Ejen AI

OpenAI Melancarkan Alat Baharu untuk Membantu Pembangun Membina Ejen AI

Melihat ejen AI sebagai masa depan industri kecerdasan buatan, OpenAI mengakui bahawa membina ejen "gred industri" yang berkuasa dengan alatan semasa adalah sangat sukar.

Alibaba Memperkenalkan QwQ-32b, Pesaing Layak untuk DeepSeek

Alibaba Memperkenalkan QwQ-32b, Pesaing Layak untuk DeepSeek

Sama ada dakwaan Alibaba akan menjadi kenyataan masih belum dapat dilihat, tetapi nampaknya ChatGPT dan DeepSeek kini mempunyai pesaing baharu yang layak.

OpenAI Mencabar Google Chrome Dengan Penyemak Imbas Baharunya

OpenAI Mencabar Google Chrome Dengan Penyemak Imbas Baharunya

OpenAI dilaporkan sedang mengusahakan projek pelayar web yang berpotensi bersaing secara langsung dengan Google Chrome.

Samsung bekerjasama dengan OpenAI untuk membangunkan AI TV, menjanjikan banyak ciri menarik

Samsung bekerjasama dengan OpenAI untuk membangunkan AI TV, menjanjikan banyak ciri menarik

Samsung Electronics dilaporkan bekerjasama dengan OpenAI dalam projek bersama yang bercita-cita tinggi untuk membangunkan TV AI yang menggabungkan teknologi kecerdasan buatan yang menerajui industri.

Microsoft akan terus melabur banyak dalam OpenAI pada penilaian lebih daripada $100 bilion

Microsoft akan terus melabur banyak dalam OpenAI pada penilaian lebih daripada $100 bilion

Microsoft telah melabur berbilion dolar dalam OpenAI sejak 2019, walaupun gergasi perisian berasaskan Redmond itu bukanlah pelabur utama dalam permulaan AI yang inovatif.

OpenAI ditetapkan untuk memperoleh Windsurf - salah satu editor kod AI yang paling berkuasa di dunia

OpenAI ditetapkan untuk memperoleh Windsurf - salah satu editor kod AI yang paling berkuasa di dunia

OpenAI sedang berbincang untuk memperoleh Windsurf, editor kod berkuasa AI terkemuka dalam industri.

O1-pro ialah model AI OpenAI yang paling mahal setakat ini

O1-pro ialah model AI OpenAI yang paling mahal setakat ini

OpenAI telah mengeluarkan versi yang lebih berkuasa bagi model AI penaakulan o1nya, o1-pro, dalam API pembangunnya.

OpenAI Mengumumkan Pelan ChatGPT Pro untuk $200 sebulan

OpenAI Mengumumkan Pelan ChatGPT Pro untuk $200 sebulan

OpenAI kini menawarkan empat tahap langganan ChatGPT untuk memenuhi keperluan kumpulan pelanggan yang berbeza.

OpenAI Memperkenalkan Projek ChatGPT: Ciri Baharu untuk Menyusun Perbualan Lebih Pintar

OpenAI Memperkenalkan Projek ChatGPT: Ciri Baharu untuk Menyusun Perbualan Lebih Pintar

Dengan mencipta projek, pengguna boleh menyimpan perbualan, fail dan arahan penyesuaian semuanya di satu tempat. Ini membolehkan mereka dengan mudah kembali kepada apa yang mereka lakukan.

OpenAI Mengumumkan Inisiatif untuk Membina Piawaian AI untuk Industri

OpenAI Mengumumkan Inisiatif untuk Membina Piawaian AI untuk Industri

OpenAI baru sahaja mengumumkan Program Perintis – usaha untuk mempromosikan aplikasi AI dalam situasi dunia sebenar.

Softbank merancang untuk mengatasi Microsoft untuk menjadi pelabur terbesar OpenAI

Softbank merancang untuk mengatasi Microsoft untuk menjadi pelabur terbesar OpenAI

Gergasi pelaburan Jepun Softbank merancang untuk melabur $15 hingga $25 bilion dalam OpenAI. Sekiranya perjanjian itu berjaya, Softbank akan menjadi pelabur terbesar OpenAI, menggantikan Microsoft, yang kini memegang jawatan itu.

Pengguna boleh bersembang dengan Santa menggunakan Mod Suara ChatGPT

Pengguna boleh bersembang dengan Santa menggunakan Mod Suara ChatGPT

ChatGPT akan membantu anda melakukan sesuatu dengan lebih baik, memberi anda peluang untuk bersembang terus dengan Santa Claus.

OpenAI untuk Melancarkan Orion, Model AI Besar Seterusnya, pada bulan Disember

OpenAI untuk Melancarkan Orion, Model AI Besar Seterusnya, pada bulan Disember

OpenAI merancang untuk melancarkan Orion, model AI utama seterusnya, pada bulan Disember, menurut The Verge.

Perbezaan antara TV biasa dan TV Pintar

Perbezaan antara TV biasa dan TV Pintar

TV pintar benar-benar telah melanda dunia. Dengan begitu banyak ciri hebat dan sambungan internet, teknologi telah mengubah cara kita menonton TV.

Mengapa peti sejuk tidak mempunyai lampu tetapi peti sejuk ada?

Mengapa peti sejuk tidak mempunyai lampu tetapi peti sejuk ada?

Peti sejuk adalah peralatan biasa dalam isi rumah. Peti ais biasanya mempunyai 2 kompartmen iaitu ruang sejuk yang luas dan mempunyai lampu yang menyala secara automatik setiap kali pengguna membukanya, manakala ruang peti sejuk beku pula sempit dan tiada cahaya.

2 Cara untuk Membetulkan Kesesakan Rangkaian Yang Melambatkan Wi-Fi

2 Cara untuk Membetulkan Kesesakan Rangkaian Yang Melambatkan Wi-Fi

Rangkaian Wi-Fi dipengaruhi oleh banyak faktor di luar penghala, lebar jalur dan gangguan, tetapi terdapat beberapa cara pintar untuk meningkatkan rangkaian anda.

Cara Menurunkan Taraf daripada iOS 17 kepada iOS 16 tanpa Kehilangan Data menggunakan Tenorshare Reiboot

Cara Menurunkan Taraf daripada iOS 17 kepada iOS 16 tanpa Kehilangan Data menggunakan Tenorshare Reiboot

Jika anda ingin kembali kepada iOS 16 yang stabil pada telefon anda, berikut ialah panduan asas untuk menyahpasang iOS 17 dan menurunkan taraf daripada iOS 17 kepada 16.

Apa yang berlaku kepada badan apabila anda makan yogurt setiap hari?

Apa yang berlaku kepada badan apabila anda makan yogurt setiap hari?

Yogurt adalah makanan yang indah. Adakah baik untuk makan yogurt setiap hari? Apabila anda makan yogurt setiap hari, bagaimana badan anda akan berubah? Mari kita ketahui bersama!

Apakah jenis beras yang terbaik untuk kesihatan?

Apakah jenis beras yang terbaik untuk kesihatan?

Artikel ini membincangkan jenis beras yang paling berkhasiat dan cara memaksimumkan manfaat kesihatan bagi mana-mana beras yang anda pilih.

Bagaimana untuk bangun tepat pada waktunya pada waktu pagi

Bagaimana untuk bangun tepat pada waktunya pada waktu pagi

Menetapkan jadual tidur dan rutin waktu tidur, menukar jam penggera anda dan melaraskan diet anda ialah beberapa langkah yang boleh membantu anda tidur dengan lebih lena dan bangun tepat pada waktunya pada waktu pagi.

Petua untuk bermain Rent Please! Tuan Tanah Sim untuk Pemula

Petua untuk bermain Rent Please! Tuan Tanah Sim untuk Pemula

Tolong Sewa! Landlord Sim ialah permainan mudah alih simulasi pada iOS dan Android. Anda akan bermain sebagai tuan tanah kompleks pangsapuri dan mula menyewa sebuah apartmen dengan matlamat untuk menaik taraf bahagian dalam pangsapuri anda dan menyediakannya untuk penyewa.

Kod Pertahanan Menara Bilik Mandi Terkini dan Cara Memasukkan Kod

Kod Pertahanan Menara Bilik Mandi Terkini dan Cara Memasukkan Kod

Dapatkan kod permainan Bathroom Tower Defense Roblox dan tebus untuk ganjaran yang menarik. Mereka akan membantu anda menaik taraf atau membuka kunci menara dengan kerosakan yang lebih tinggi.

Struktur, simbol dan prinsip operasi transformer

Struktur, simbol dan prinsip operasi transformer

Mari belajar tentang struktur, simbol dan prinsip operasi transformer dengan cara yang paling tepat.

4 Cara AI Menjadikan TV Pintar Lebih Baik

4 Cara AI Menjadikan TV Pintar Lebih Baik

Daripada kualiti gambar dan bunyi yang lebih baik kepada kawalan suara dan banyak lagi, ciri dikuasakan AI ini menjadikan TV pintar lebih baik!

Mengapa ChatGPT lebih baik daripada DeepSeek

Mengapa ChatGPT lebih baik daripada DeepSeek

Pada mulanya, orang ramai menaruh harapan yang tinggi untuk DeepSeek. Sebagai chatbot AI yang dipasarkan sebagai pesaing kuat kepada ChatGPT, ia menjanjikan keupayaan dan pengalaman sembang pintar.

Temui Fireflies.ai: Setiausaha AI Percuma Yang Menjimatkan Masa Kerja Anda

Temui Fireflies.ai: Setiausaha AI Percuma Yang Menjimatkan Masa Kerja Anda

Sangat mudah untuk terlepas butiran penting semasa mencatat perkara penting lain, dan cuba mencatat nota semasa bersembang boleh mengganggu. Fireflies.ai adalah penyelesaiannya.

Bagaimana untuk membesarkan Axolotl Minecraft, menjinakkan Minecraft Salamander

Bagaimana untuk membesarkan Axolotl Minecraft, menjinakkan Minecraft Salamander

Axolot Minecraft akan menjadi pembantu yang hebat untuk pemain semasa beroperasi di bawah air jika mereka tahu cara menggunakannya.

Tempat yang Tenang: Konfigurasi Permainan PC Jalan Hadapan

Tempat yang Tenang: Konfigurasi Permainan PC Jalan Hadapan

Tempat yang Tenang: Konfigurasi The Road Ahead dinilai agak tinggi, jadi anda perlu mempertimbangkan konfigurasi sebelum membuat keputusan untuk memuat turun.