OpenAI Merilis GPT-5.4 Mini dan Nano: Kecepatan Berlipat Ganda, Dirancang Khusus untuk Era AI Agen Sub, Hanya $0.2 per Juta Token

動區BlockTempo

2026-03-18 01:50:34

OpenAI hari ini (18) secara resmi meluncurkan dua model ringan baru GPT-5.4 Mini dan GPT-5.4 Nano, yang pertama memiliki kecepatan dua kali lipat dari generasi sebelumnya dengan harga hanya $0.75 per juta token input, sedangkan yang kedua menawarkan latensi sangat rendah dan harga kompetitif sebesar $0.20 untuk menembus pasar throughput tinggi.
（Latar belakang: OpenAI meluncurkan GPT-5.2! Mengincar pengganti profesional, mengurangi halusinasi, dan ringkasan biaya API）
（Informasi tambahan: Ringkasan peluncuran GPT-5 terkuat dari OpenAI: akses gratis, fitur utama, gpt-5, gpt-5-mini dan gpt-5-nano API harga）

Daftar isi artikel

Toggle

GPT-5.4 Mini: 2 kali lebih cepat, kekuatan serba bisa dan ringan
GPT-5.4 Nano: latensi sangat rendah, dirancang untuk skenario throughput tinggi
Arsitektur sub-agen: model kecil bukan versi downgrade, melainkan bagian dari desain sistem

OpenAI hari ini (18) tengah malam secara bersamaan meluncurkan GPT-5.4 Mini dan GPT-5.4 Nano, dua model bahasa kecil ini. Kedua model ini bukan model flagship, melainkan dirancang sebagai lapisan eksekusi dalam sistem AI campuran: model flagship yang lebih kuat mengatur jadwal, sementara banyak model kecil menjalankan pekerjaan komputasi harian secara paralel di belakang layar.

OpenAI menyebut arsitektur ini sebagai “peningkatan signifikan dalam kecepatan dan efisiensi biaya dengan mengorbankan sebagian presisi,” dan pilihan ini mencerminkan tren industri AI saat ini dari model besar tunggal menuju “kolaborasi multi-agen.”

GPT-5.4 Mini: 2 kali lebih cepat, kekuatan serba bisa dan ringan

GPT-5.4 Mini adalah produk utama dari peluncuran ini, menyeimbangkan kecepatan dan kemampuan multitasking. Dibandingkan generasi sebelumnya, kecepatan inferensinya meningkat dua kali lipat, dan secara menyeluruh meningkatkan kemampuan dalam kode, pemahaman multimodal, dan panggilan alat.

Dalam pengujian standar, GPT-5.4 Mini mencapai 54,4% di SWE-Bench Pro (perbaikan otomatis masalah GitHub) dan 72,1% di OSWorld-Verified (otomatisasi operasi desktop), angka-angka ini menunjukkan posisi terdepan di kelasnya.

Dari segi fitur, model ini mendukung input teks dan gambar campuran, panggilan alat, pencarian internet dan file, serta interaksi UI komputer, hampir mencakup seluruh kebutuhan aplikasi AI modern. Penggunaan utama yang disarankan oleh OpenAI meliputi: asisten kode, integrasi IDE, review kode, interpretasi screenshot, sub-agen penggunaan komputer, dan sistem interaktif yang membutuhkan respons real-time.

Dari segi harga, GPT-5.4 Mini dikenai biaya $0.75 per juta token input dan $4.50 per juta token output, mengikuti strategi OpenAI yang aktif menekan biaya akhir-akhir ini.

Dari segi ketersediaan, GPT-5.4 Mini sudah dapat digunakan mulai hari ini di ChatGPT (baik versi gratis maupun berlangganan Go), Codex, dan OpenAI API, serta dapat di-deploy melalui Azure AI Foundry.

GPT-5.4 Nano: latensi sangat rendah, dirancang untuk throughput tinggi

GPT-5.4 Nano memiliki posisi yang lebih spesifik: OpenAI menyebutnya sebagai “model terkecil dan paling efisien biaya saat ini,” dirancang khusus untuk skenario yang sangat sensitif terhadap latensi dan membutuhkan pemrosesan paralel skala besar.

Dalam pengujian standar, skor SWE-Bench Pro Nano adalah 52,4%, dan OSWorld 39,0%. Meskipun sedikit tertinggal dari Mini, harga yang sangat kompetitif membuat rasio nilai-harga sangat menarik.

Dari segi fitur, Nano mendukung perintah mengikuti, panggilan fungsi, kode dasar, pemahaman gambar, klasifikasi, dan ekstraksi data, mampu menangani sebagian besar tugas terstruktur, tetapi tidak mendukung operasi desktop kompleks atau inferensi mendalam.

Dari segi harga, Nano hanya dikenai biaya $0.20 per juta token input dan $1.25 per juta token output, sekitar seperempat dari harga Mini, cocok untuk perusahaan yang membutuhkan otomatisasi panggilan dalam jumlah besar. Skenario yang disarankan meliputi: klasifikasi dan ekstraksi data, dukungan sub-agen kode, otomatisasi tinggi, routing permintaan, pengolahan formulir, dan alur kerja layanan pelanggan.

Perlu dicatat, GPT-5.4 Nano saat ini hanya dapat diakses melalui API dan tidak akan muncul di antarmuka pengguna ChatGPT, secara tegas ditujukan untuk pengembang dan produk perusahaan.

Arsitektur sub-agen: model kecil bukan versi downgrade, melainkan bagian dari desain sistem

OpenAI menyebut bahwa kedua model ini “diciptakan untuk era sub-agen,” yang memiliki makna produk yang spesifik.

Dalam sistem AI multi-agen, model flagship (seperti GPT-5 atau model inferensi seri o) bertanggung jawab atas perencanaan tingkat tinggi dan pengambilan keputusan kompleks, sementara banyak tugas berulang dan terstruktur—seperti pengambilan data dari web, konversi data, pengisian formulir, dan pembuatan potongan kode—dapat diproses secara paralel oleh model yang lebih kecil, lebih cepat, dan lebih murah. GPT-5.4 Mini dan Nano dirancang untuk peran lapisan eksekusi ini.

Pendekatan ini juga menjelaskan mengapa kedua model menekankan kemampuan panggilan alat dan interaksi dengan komputer: dalam arsitektur aplikasi AI yang semakin otomatis, model kecil yang mampu menjalankan instruksi secara stabil dan berinteraksi dengan sistem eksternal memiliki nilai komersial yang tidak kalah dari model flagship yang parameter-nya lebih besar.

Lihat Asli

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Komentar

0/400

Tidak ada komentar