Bagaimana cara menggunakan ChatGPT Images 2.0? Pengujian menu mie daging sapi, sampul majalah, efek edukasi multibahasa

robot
Pembuatan abstrak sedang berlangsung

OpenAI luncurkan alat gambar langsung ChatGPT Images 2.0, menonjolkan kemampuan penataan kompleks dan pengolahan teks multibahasa (termasuk bahasa Mandarin), artikel ini akan memperkenalkan secara menyeluruh fitur, keunggulan, fungsi paket gratis dan berbayar, serta hasil pengujian pembuatan gambar.

Apa itu ChatGPT Images 2.0? Memberi tahu Anda tentang fitur utama dan keunggulannya!

Alat gambar langsung AI yang mampu bersaing dengan Gemini Nano Banana 2 telah hadir? OpenAI mengumumkan peluncuran ChatGPT Images 2.0, didukung oleh model GPT Image 2 yang baru, menonjolkan kemampuan memilih, mengatur, dan mengungkapkan informasi dalam gambar. Berikut adalah 3 keunggulan utama ChatGPT Images 2.0:

Kemampuan penataan dan pengolahan teks multibahasa yang kuat

Pertama, fitur yang paling mencolok adalah peningkatan besar dalam kemampuan penataan dan pengolahan teks multibahasa dari ChatGPT Images 2.0.

Media luar 《Techcrunch》 menunjukkan bahwa sebelumnya, sebagian besar alat pembuatan gambar AI menggunakan model difusi, sering mengalami kesulitan dalam menulis teks, sementara ChatGPT Images 2.0 mampu menampilkan detail kecil seperti teks, ikon, dan antarmuka pengguna dengan akurat.

OpenAI menyatakan bahwa Images 2.0 menunjukkan kemajuan signifikan dalam pengolahan bahasa non-Latin, termasuk Mandarin, Jepang, Korea, Hindi, dan Bengali, semuanya dapat dihasilkan dengan kejernihan tinggi dalam gambar.

Sumber gambar: Contoh hasil generasi resmi ChatGPT Images 2.0 dari OpenAI

Kemampuan berpikir baru dan pencarian daring

Selain kemampuan penataan dan pengolahan teks multibahasa, ChatGPT Images 2.0 juga menawarkan kemampuan berpikir baru yang dapat membantu menghasilkan gambar melalui pencarian informasi secara real-time di internet. Model ini memiliki basis pengetahuan yang diperbarui hingga Desember 2025, membantu dalam menghasilkan konten terkait peristiwa terkini.

Sumber gambar: Contoh hasil generasi resmi ChatGPT Images 2.0 dari OpenAI

Mendukung resolusi 2K dan rasio aspek beragam

ChatGPT Images 2.0 mendukung pembuatan gambar hingga resolusi 2K, serta menawarkan pilihan rasio aspek yang lebih luas, mulai dari lebar 3:1 hingga panjang 1:3.

Peneliti utama OpenAI, Boyuan Chen, menyatakan bahwa arsitektur Images 2.0 telah sepenuhnya diperbarui, merupakan model serbaguna yang hanya memerlukan petunjuk teks sederhana untuk menangani konversi sudut pandang gaya 3D dan penalaran spasial yang kompleks.

Fungsi pengguna paket gratis dan berbayar ChatGPT Images 2.0

Setiap tingkat pembayaran memiliki fitur berbeda? Pengguna berbayar ChatGPT Images 2.0 dapat mengakses fitur berbeda, dirangkum sebagai berikut:

  • Pengguna gratis: Saat ini dapat menggunakan model dasar ImageGen 2.0 untuk menjalankan tugas pembuatan gambar standar. Versi dasar ini sudah mencakup banyak peningkatan inti, seperti kepatuhan instruksi yang lebih baik, efek rendering teks yang lebih kuat, dukungan multibahasa, dan pilihan rasio aspek yang lebih beragam.
  • Pengguna ChatGPT Plus, Business, dan Enterprise: Pengguna berbayar ini dapat mengaktifkan model berpikir baru. Dalam mode ini, generator gambar chatbot akan menggunakan pencarian internet untuk membantu pembuatan gambar, membuat diagram visual berdasarkan file yang diunggah pengguna, dan melakukan penalaran struktural sebelum menghasilkan gambar. Maksimal 8 gambar dapat dibuat sekaligus dalam satu waktu, dan memastikan konsistensi karakter, objek, dan gaya di setiap scene.
  • Pengguna Pro: Mereka akan mendapatkan akses ke model ImageGen Pro yang lebih canggih. Meskipun OpenAI belum merinci perbedaan pasti antara Pro dan fitur berpikir, pengguna perusahaan dapat menganggap fitur berpikir sebagai peningkatan fitur nyata, cocok untuk tugas yang membutuhkan dasar faktual, mengubah dokumen internal menjadi diagram penjelasan, atau menjaga konsistensi visual di berbagai aset.
  • Pengembang API: Kini dapat mengintegrasikan model gpt-image-2, mendukung resolusi tinggi dan pengaturan rasio aspek yang fleksibel.

Pengujian ChatGPT Images 2.0: menu, majalah, diagram penjelasan, dll

Bagaimana performa nyata ChatGPT Images 2.0, apakah sesuai dengan promosi OpenAI? Mari kita uji.

Pengujian menu restoran beef bowl

Pengujian menggunakan paket gratis dari 《Crypto City》, membuat menu masakan beef bowl Taiwan, dengan petunjuk sederhana: “Bantu saya buatkan gambar menu masakan beef bowl Taiwan, tampilkan nama, harga, dan info gambar untuk setiap hidangan dalam bahasa Mandarin tradisional.”

Berikut hasilnya:

Sumber gambar: Hasil generasi dari ChatGPT Images 2.0

Dari konten yang bisa dihasilkan dengan paket gratis, terlihat cukup bagus, namun jika diperhatikan lebih detail, Images 2.0 masih mengalami kesalahan penulisan pada karakter Mandarin tradisional yang kompleks, mungkin hasil dari paket berbayar akan lebih baik.

Selain itu, hasilnya cukup mendekati harga beef bowl di Taipei, dan juga bisa makan di tempat gratis sekali tambahan mie.

Namun, jika menu Anda akan dicetak, secara praktis, gambar yang disediakan oleh ChatGPT Images 2.0 sebaiknya diubah ke file vektor (seperti EPS, .ai dari Adobe Illustrator, PDF), dan menggunakan mode warna CMYK, agar paling cocok untuk pencetakan. Pabrik cetak mungkin juga menerima file JPG dan PNG, tetapi jika Anda memiliki standar cetak yang tinggi, akan lebih sulit menyesuaikan hasilnya sesuai keinginan.

Pengujian sampul majalah teknologi

Selanjutnya, pengujian sampul majalah fiksi ilmiah, kali ini 《Crypto City》 menguji efek penataan kompleks, petunjuknya: “Bantu saya buatkan sampul majalah teknologi dalam bahasa Mandarin tradisional, judulnya ‘Crypto City’, tema ‘Perpaduan Blockchain dan AI’, sampul ini harus ada judul, nomor edisi, barcode, dan tanggal tenggat di atasnya, semua teks harus tampil jelas dan rapi.”

Berikut hasilnya:

Sumber gambar: Hasil generasi dari ChatGPT Images 2.0

Hasil pengujian ini mirip dengan sebelumnya, terlihat bagus dari jauh, tetapi saat diperhatikan lebih detail, masih ada kekurangan saat mengolah karakter Mandarin yang kompleks. Font di sampul ini juga mirip dengan font “Jin Xuan” dari Justfont, toko font Taiwan, entah apakah sudah mendapatkan lisensi.

Kekhawatiran semacam ini, 《Crypto City》 juga pernah mengangkat saat peluncuran Nano Banana Pro.

  • **Laporan terkait:**Pengujian Nano Banana Pro: Perbaikan karakter Mandarin! Tapi kekhawatiran hak cipta animasi dan font juga muncul

Pengujian diagram penjelasan multibahasa

《Crypto City》 menguji sebuah diagram penyebab gempa dalam bahasa Mandarin tradisional, Jepang, dan Korea, dengan teks multibahasa yang cukup kompleks berhasil dirender secara umum. Dalam penataan, digunakan warna berbeda sesuai bahasa, meskipun saat diperhatikan lebih detail, beberapa karakter Mandarin yang kompleks dan Korea masih mengalami kabur.

Berikut hasilnya:

Sumber gambar: Hasil generasi dari ChatGPT Images 2.0

Images 2.0 mampu menjaga konsistensi karakter dan objek, menyelesaikan proses yang rumit

Selain itu, Images 2.0 juga seperti Nano Banana 2, memiliki fitur yang dapat diedit. Cukup klik “Edit” di kiri bawah gambar yang dihasilkan untuk mulai mengoperasikan, menjaga konsistensi karakter dan objek, sehingga pembuatan halaman komik, seri gambar media sosial, atau desain denah ruangan menjadi lebih mudah.

Manajer produk ChatGPT Images, Adele Li, menyatakan bahwa fitur ini menyelesaikan proses rumit sebelumnya di mana pengguna harus membuat satu gambar satu per satu dan menyusun secara manual, memungkinkan kreator dengan mudah membuat buku gambar anak-anak yang memiliki identitas visual yang sama atau materi promosi merek.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan