AI pertama yang menciptakan AI! GPT-5.3 ikut serta dalam pengembangan dirinya sendiri, fiksi ilmiah menjadi kenyataan

MarketWhisper

OpenAI merilis GPT-5.3-Codex, model pertama yang “berpartisipasi dalam menciptakan dirinya sendiri” untuk men-debug kodenya sendiri, mengelola penerapan, dan mendiagnosis pengujian. Karpathy menyebut revisi itu “paling dekat dengan adegan lepas landas AI.”

AI mulai menciptakan singularitas teknologi dan terobosan dalam AI

Akun resmi OpenAI dirilis: GPT-5.3-Codex secara resmi diluncurkan, yang merupakan “yang pertama berpartisipasi dalam membuat model Anda sendiri”. Apa artinya? Dengan kata lain, selama proses pengembangan, AI ini membantu men-debug kode pelatihannya sendiri, mengelola proses penerapannya sendiri, dan mendiagnosis hasil pengujiannya sendiri. Dalam istilah manusia, AI sudah mulai menciptakan AI.

Andrej Karpathy, mantan peneliti OpenAI dan direktur AI Tesla, men-tweet langsung setelah membacanya: “Ini adalah hal terdekat yang pernah saya lihat dengan adegan lepas landas AI dalam fiksi ilmiah.” Penilaian dari peneliti AI top ini berbobot karena Karpathy secara pribadi telah mengalami beberapa tahap kunci pengembangan AI, dan penilaiannya didasarkan pada pemahaman teknis yang mendalam.

AI mengulangi dirinya sendiri, ini bukan retorika pemasaran. Menurut pengungkapan internal OpenAI, GPT-5.3-Codex melakukan hal-hal ini selama proses pengembangan: menganalisis pengujian yang gagal menandai log pelatihan, menyarankan perbaikan untuk skrip dan profil pelatihan, menghasilkan resep penerapan, dan meringkas serta mengevaluasi anomali untuk ditinjau manusia. Apa artinya ini? AI bukan lagi hanya alat, tetapi mulai menjadi bagian dari tim pengembangan, dan itu adalah jenis yang dapat meningkatkan dirinya sendiri.

Kemampuan untuk berpartisipasi dalam pengembangan ini mendorong melalui pemosisian AI tradisional. Di masa lalu, model AI dirancang, dilatih, dan digunakan sepenuhnya oleh manusia, dan AI adalah produk pasif. Sekarang GPT-5.3 telah memainkan peran aktif dalam kelahirannya sendiri, dan sementara masih di bawah pengawasan manusia, pergeseran peran ini memiliki implikasi yang luas. Ini mengisyaratkan kemungkinan: model AI masa depan sebagian besar dapat dirancang dan dioptimalkan oleh AI itu sendiri, dengan manusia hanya memberikan arahan dan tinjauan akhir.

GPT-5.3 partisipasi diri dalam pengembangan

Menganalisis log pelatihan: Secara otomatis menandai pengujian yang gagal untuk mengidentifikasi anomali selama pelatihan

Rencana perbaikan yang direkomendasikan: Menyarankan penyempurnaan pada skrip dan profil pelatihan

Hasilkan resep penyebaran: Mengotomatiskan proses penerapan dan mengurangi operasi manual

Anomali penilaian ringkasan: Atur hasil penilaian yang kompleks ke dalam laporan yang dapat dimengerti manusia

Sebuah makalah SEAL baru-baru ini yang diterbitkan oleh MIT (arXiv:2506.10943) menggambarkan arsitektur AI yang terus belajar setelah penerapan, mengembangkan dirinya sendiri tanpa pelatihan ulang. Khususnya, beberapa peneliti SEAL kini telah bergabung dengan OpenAI. Ini berarti bahwa AI telah berubah dari “alat statis” menjadi “sistem dinamis”, pembelajaran tidak lagi berhenti pada penerapan, dan batas-batas inferensi dan pelatihan mencair. GPT-5.3 mungkin merupakan aplikasi komersial pertama dari arsitektur baru ini.

77,3% menghancurkan pembantaian acuan Claude

Pada 5 Februari, OpenAI dan Anthropic keduanya merilis model generasi baru dengan jarak hanya 20 menit. Pertama, Anthropic merilis Claude Opus 4.6, dan kemudian OpenAI meluncurkan GPT-5.3-Codex. Karena OpenAI ingin menggunakan GPT-5.3-Codex untuk menembak model baru orang lain, ia harus memiliki beberapa kemampuan. Data tidak berbohong, GPT-5.3-Codex mencetak rekor baru dalam beberapa tolok ukur industri segera setelah diluncurkan.

Terminal-Bench 2.0 menguji kemampuan operasional AI di lingkungan terminal nyata, mengkompilasi kode, model pelatihan, dan mengonfigurasi server. GPT-5.3-Codex mencetak 77,3%, sedangkan GPT-5.2-Codex hanya memiliki 64,0% dan Claude Opus 4.6 melaporkan 65,4%. Ini adalah peningkatan 13 poin persentase antar generasi, yang sudah merupakan lompatan besar ke depan di bidang AI. Perbandingan 77,3% vs 65,4% menunjukkan bahwa GPT-5.3 memberikan keuntungan yang signifikan dalam tugas rekayasa dunia nyata.

SWE-Bench Pro adalah tolok ukur yang dirancang khusus untuk menguji kemampuan rekayasa perangkat lunak dunia nyata, yang mencakup empat bahasa pemrograman: Python, JavaScript, Go, dan Ruby. GPT-5.3-Codex mencetak skor 56,8%, melampaui 56,4% dari pendahulunya, GPT-5.2-Codex, dan terus mempertahankan tempat pertamanya di industri ini. Lebih penting lagi, OpenAI mengungkapkan bahwa GPT-5.3-Codex menggunakan jumlah token output terkecil dari model apa pun ketika mencapai skor ini, artinya tidak hanya akurat tetapi juga efisien.

OSWorld-Verified menguji kemampuan AI untuk menyelesaikan tugas produktivitas di lingkungan desktop visual, mengedit spreadsheet, membuat presentasi, mengerjakan dokumen, dan banyak lagi. GPT-5.3-Codex mencetak skor 64,7%, dibandingkan dengan rata-rata manusia sebesar 72%. Ini berarti bahwa ia telah mendekati kinerja orang biasa dalam tugas pengoperasian komputer, hampir dua kali lipat dari pendahulunya. Kinerja mendekati manusia ini membuat AI benar-benar mampu bekerja di kantor untuk pertama kalinya, bukan hanya alat tambahan.

Claude membalas 100K Token dan Tim Agen

Yang lebih penting adalah Claude Opus 4.6 mendukung jendela konteks token 100K (beta) untuk pertama kalinya dalam model tingkat Opus, yang dapat memproses seluruh basis kode atau ratusan halaman dokumen sekaligus, dan meluncurkan fungsi Agent Teams, di mana beberapa agen AI dapat berkolaborasi dalam pemrograman, pengujian, dan penulisan dokumen secara bersamaan.

Ketika OpenAI dan Anthropic merilis model andalan mereka pada hari yang sama dan pada saat yang sama, kompetisi ini bukan lagi hanya kompetisi teknis, tetapi pertempuran atas bentuk masa depan AI: rute “evolusi diri” OpenAI atau rute “kolaborasi multi-agen” Anthropic? Strategi OpenAI adalah membuat satu AI lebih kuat dan bahkan meningkatkan dirinya sendiri. Strategi Anthropic adalah memungkinkan beberapa AI berkolaborasi dalam tugas-tugas kompleks melalui pembagian kerja dan kolaborasi.

Konteks 100K token adalah terobosan teknologi. Ini setara dengan sekitar 75 juta kata bahasa Inggris atau 300 karakter Cina, yang cukup untuk memuat seluruh kode proyek perangkat lunak berukuran sedang atau dokumentasi teknis yang tebal. Kapasitas ini memungkinkan Claude untuk “melihat” seluruh proyek daripada pemahaman yang terfragmentasi. Untuk analisis arsitektur dan pemfaktoran ulang proyek skala besar, pandangan global ini sangat penting.

Agent Teams menghadirkan konsep kolaborasi ke AI. Satu Agen menulis kode, yang lain menguji, dan yang ketiga menulis dokumentasi, dan mereka dapat berkomunikasi dan berkoordinasi satu sama lain. Pola ini meniru cara kerja tim perangkat lunak manusia dan mungkin lebih cocok untuk skenario tertentu daripada AI super tunggal. Namun, kolaborasi multi-agen juga memperkenalkan kompleksitas baru: cara berkoordinasi, cara menghindari konflik, dan bagaimana memastikan konsistensi.

Kedua rute tersebut memiliki kelebihan dan kekurangannya masing-masing. Rute evolusi diri OpenAI lebih agresif, dan jika berhasil, dapat menyebabkan peningkatan eksponensial dalam kemampuan, tetapi juga dapat lepas kendali. Rute multi-agen Anthropic lebih konservatif, mengurangi satu titik risiko dengan menyebarkan kemampuan, tetapi biaya koordinasi dapat membatasi efisiensi. Ketika AI mulai berkembang di alam liar, pertanyaan tata kelola akan bergeser dari “seberapa pintar” menjadi “bagaimana kita mengelola sistem yang terus berubah?” Dan ketika dua perusahaan AI teratas merilis model terobosan berturut-turut dalam waktu 20 menit, jendela waktu yang tersisa untuk pemikiran dan persiapan manusia menyusut dengan kecepatan yang terlihat dengan mata telanjang.

Lihat Asli
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Mastercard Memperluas Dorongan Crypto Dengan Akuisisi BVNK Senilai $1,8 Miliar

Akuisisi Mastercard terhadap BVNK senilai $1,8 miliar bertujuan untuk meningkatkan integrasi pembayaran blockchain dengan sistem fiat, menargetkan pasar aset digital yang berkembang pesat. Kesepakatan ini akan meningkatkan transaksi lintas batas dan sejalan dengan ambisi keuangan digital Mastercard yang lebih luas.

TodayqNews1jam yang lalu

Peringatan TradFi Turun: TME (Tencent Music) Turun Melebihi 22%

Gate News: Menurut data terbaru Gate TradFi, TME (Tencent Music) telah turun sebesar 22% dalam waktu singkat. Volatilitas saat ini secara signifikan lebih tinggi dibandingkan rata-rata terbaru, menunjukkan peningkatan aktivitas pasar.

GateNews1jam yang lalu

Perak spot menembus di bawah level 80 dolar

Berita Gate News, pada 17 Maret, harga perak spot (jenis perdagangan logam mulia) menembus di bawah angka 80 dolar.

GateNews2jam yang lalu

Micron Technology (MU.O) mencapai rekor tertinggi sepanjang masa, dengan kenaikan 3,5%

Berita Gate News, tanggal 17 Maret, harga saham Micron Technology (kode saham MU.O, produsen chip penyimpanan asal Amerika Serikat) mencapai rekor tertinggi, dengan kenaikan terbaru sebesar 3,5%.

GateNews2jam yang lalu

Miliarder Investor Druckenmiller Optimis tentang Stablecoin: Akan Mendominasi Pembayaran Global dalam 10 hingga 15 Tahun

Investor terkenal Stanley Druckenmiller baru-baru ini menyatakan bahwa stablecoin akan menjadi inti dari sistem pembayaran global di masa depan, memprediksi bahwa mereka akan mendominasi pasar keuangan dalam 10 hingga 15 tahun ke depan. Kapitalisasi pasar stablecoin telah melampaui $315 miliar, menunjukkan akselerasi adopsi institusional. Setelah disahkannya "GENIUS Act" di Amerika Serikat, kerangka peraturan telah disediakan untuk stablecoin, mendorong mereka maju menuju infrastruktur keuangan arus utama, dan Hong Kong juga sedang mempersiapkan lisensi. Druckenmiller tetap bersikap hati-hati terhadap pasar kripto secara keseluruhan, percaya bahwa stablecoin memiliki nilai aplikasi praktis.

区块客2jam yang lalu

ETF Bitcoin hari ini mengalami net inflow 2,955 BTC, ETF Ethereum mengalami net inflow 7,894 ETH

Gate News melaporkan bahwa pada 17 Maret, menurut pemantauan Lookonchain, hingga saat berita ini diterbitkan, Bitcoin ETF hari ini mengalami aliran masuk bersih sebesar 2,955 BTC (senilai 219 juta dolar), Ethereum ETF mengalami aliran masuk bersih sebesar 7,894 ETH (senilai 18,5 juta dolar), dan SOL ETF mengalami aliran masuk bersih sebesar 24,020 SOL (senilai 2,27 juta dolar).

GateNews2jam yang lalu
Komentar
0/400
Tidak ada komentar