ค้นพบ SCENE
Google ได้เปิดตัว Gemini 3 Pro ในการแสดงตัวอย่างสาธารณะในวันนี้ โดยเรียกมันว่าโมเดล AI ที่มีความสามารถมากที่สุดของบริษัทจนถึงปัจจุบัน ระบบนี้สามารถจัดการข้อความ รูปภาพ เสียง และวิดีโอในเวลาเดียวกัน ขณะที่ประมวลผลบริบทได้สูงสุดถึง 1 ล้านโทเคน ซึ่งเท่ากับประมาณ 700,000 คำ หรือประมาณ 10 นวนิยายขนาดเต็ม
โมเดลตัวอย่างมีให้ใช้ฟรีสำหรับทุกคนที่ต้องการลองที่นี่
Google กล่าวว่าโมเดลนี้มีประสิทธิภาพดีกว่าโมเดลก่อนหน้า Gemini 2.5 Pro ในการทดสอบเกือบทุกแบบที่บริษัทได้ทำการทดสอบ บน Humanity's Last Exam ซึ่งเป็นการทดสอบการวิเคราะห์เชิงวิชาการ Gemini 3 Pro ได้คะแนน 37.5% เมื่อเปรียบเทียบกับ 2.5 Pro ที่ได้ 21.6% ใน ARC-AGI-2 ซึ่งเป็นการทดสอบปัญหาการคิดเชิงภาพ คะแนนห่างยิ่งขึ้น: 31.1% เทียบกับ 4.9%.
แน่นอน ความท้าทายที่แท้จริงในจุดนี้ของการแข่งขัน AI ไม่ได้อยู่ที่ด้านเทคนิคมากนัก แต่เป็นการแย่งชิงส่วนแบ่งการตลาดเชิงพาณิชย์มากกว่า
Google ซึ่งเคยดูเหมือนไม่มีใครสามารถเอาชนะในพื้นที่การค้นหา ได้เสียพื้นที่จำนวนมากให้กับ OpenAI ซึ่งอ้างว่ามีผู้ใช้ประมาณ 800 ล้านคนต่อสัปดาห์ สำหรับ ChatGPT เทียบกับ Gemini ซึ่งรายงานว่ามีผู้ใช้ประมาณ 650 ล้านคน ต่อเดือน Google ยังไม่ได้กล่าวว่ามีจำนวนผู้ใช้ต่อสัปดาห์เท่าใด แต่จะต้องน้อยกว่าจำนวนผู้ใช้ต่อเดือนอย่างแน่นอน.
อย่างไรก็ตาม ความสำเร็จทางเทคนิคของ Gemini 3 นั้นน่าประทับใจ
แนะนำ Gemini 3 — โมเดลที่ชาญฉลาดที่สุดของเราที่ช่วยให้คุณทำให้ความคิดใด ๆ เป็นจริง
Gemini 3 เป็นขั้นตอนถัดไปของเราในเส้นทางสู่ AGI และมี:
🧠 การให้เหตุผลที่ทันสมัย
🖼️ ความเข้าใจหลายรูปแบบอย่างลึกซึ้ง
💻 การเขียนโค้ดที่ทรงพลังเพื่อให้คุณสามารถเปลี่ยนจากคำสั่งไปเป็นแอปในครั้งเดียว… pic.twitter.com/zG8r95pGcS
— Google (@Google) 18 พฤศจิกายน 2025
Gemini 3 Pro ใช้สถาปัตยกรรมที่ Google เรียกว่า sparse mixture-of-experts แทนที่จะเปิดใช้งานพารามิเตอร์ทั้งหมดกว่า 1 ล้านล้านสำหรับทุกคำถาม ระบบจะส่งข้อมูลแต่ละชุดไปยังซับเน็ตเวิร์กที่เชี่ยวชาญ โดยมีเพียงส่วนเล็กน้อยของโมเดล—ผู้เชี่ยวชาญในงานเฉพาะที่—ทำงานในเวลาใดเวลาหนึ่ง ช่วยลดค่าใช้จ่ายในการคำนวณขณะรักษาประสิทธิภาพไว้
แตกต่างจาก GPT และ Claude ซึ่งเป็นโมเดลขนาดใหญ่ที่มีความหนาแน่น (ซึ่งมีความสามารถหลายด้าน) วิธีการของ Google ทำงานเหมือนองค์กรขนาดใหญ่ บริษัทที่มีพนักงาน 1,000 คนจะไม่เรียกทุกคนไปที่การประชุมทุกครั้ง ทีมเฉพาะจะจัดการกับปัญหาเฉพาะ Gemini 3 Pro ทำงานในลักษณะเดียวกัน โดยมอบหมายคำถามไปยังเครือข่ายผู้เชี่ยวชาญที่เหมาะสม
Google ได้ฝึกโมเดลจากเอกสารในเว็บ, โค้ดรีโพสิตอรี, รูปภาพ, ไฟล์เสียง, และวิดีโอ—รวมถึงข้อมูลสังเคราะห์ที่สร้างโดยระบบ AI อื่น ๆ บริษัทได้กรองข้อมูลการฝึกฝนเพื่อคุณภาพและความปลอดภัย โดยการลบเนื้อหาที่เป็นอนาจาร, สื่อที่มีความรุนแรง, และสิ่งใดที่ละเมิดกฎหมายความปลอดภัยของเด็ก การฝึกฝนเกิดขึ้นบน Tensor Processing Units ของ Google โดยใช้ซอฟต์แวร์ JAX และ ML Pathways.
การทดสอบอย่างรวดเร็วของโมเดลแสดงให้เห็นว่ามันมีความสามารถมาก ในการทดสอบการเขียนโค้ดตามปกติของเรา ซึ่งขอให้สร้างเกมลอบเร้น โมเดลนี้เป็นโมเดลแรกที่สร้างเกม 3D แทนที่จะเป็นประสบการณ์ 2D การรันอื่นๆ ให้เวอร์ชัน 2D แต่ทั้งหมดก็ยังใช้งานได้และรวดเร็ว
วิธีการนี้ติดตามสไตล์ของ ChatGPT หรือ Perplexity ซึ่งส่งเสริมการมีปฏิสัมพันธ์เพิ่มเติมโดยการแชร์คำถามและข้อเสนอแนะที่ตามมา แต่การนำไปใช้ของ Google นั้นสะอาดและมีประโยชน์มากกว่า
ในขณะที่สร้างโค้ด อินเทอร์เฟซจะให้คำแนะนำเพื่อช่วยในคำสั่งถัดไป ดังนั้นผู้ใช้จึงสามารถชี้นำโมเดลในการสร้างโค้ดที่ดีกว่า แก้ไขข้อบกพร่อง และปรับปรุงตรรกะของแอป UI เป็นต้น นอกจากนี้ยังให้ผู้ใช้มีตัวเลือกในการปรับใช้โค้ดและแอปที่ขับเคลื่อนด้วย Gemini.
โดยรวมแล้ว โมเดลนี้ดูเหมือนจะมุ่งเน้นไปที่งานเขียนโค้ดเป็นพิเศษ ความคิดสร้างสรรค์ไม่ใช่จุดแข็งของมัน แต่สามารถชี้นำได้ง่ายด้วยการตั้งคำถามในระบบที่ดีและตัวอย่าง เนื่องจากมันมีหน้าต่างบริบทของโทเค็นที่กว้างมาก
เวอร์ชันที่เก็บถาวรของการ์ดโมเดลของ Gemini 3—เอกสารที่ให้ข้อมูลสำคัญเกี่ยวกับการออกแบบ การใช้งานที่ตั้งใจ ประสิทธิภาพ และข้อจำกัดของโมเดล—ที่เผยแพร่โดย Google DeepMind แสดงให้เห็นว่า Gemini 3 Pro สามารถสร้างผลลัพธ์ได้สูงสุดถึง 64,000 โทเค็น และมีการตัดความรู้ในเดือนมกราคม 2025 Google ยอมรับว่าโมเดลอาจมีการหลงผิดและบางครั้งอาจประสบปัญหาความช้า หรือหมดเวลา.
โมเดลการ์ดทางการยังไม่สามารถใช้งานได้ในขณะนี้.
ตามที่กล่าวไว้ Google AI Studio กำลังเสนอการเข้าถึง Gemini 3 Pro ฟรีให้กับทุกคนในขณะนี้ Vertex AI และ Gemini API ก็สนับสนุนโมเดลนี้เช่นกัน Gemini 3 Pro ยังไม่สามารถใช้งานได้ผ่านแอป Gemini แม้แต่สำหรับสมาชิก Gemini Pro ที่ชำระเงิน
การปล่อยในเดือนพฤศจิกายนทำให้ Google อยู่ในตำแหน่งที่ต้องแข่งขันกับ Claude Sonnet 4.5 ของ Anthropic, Grok 4.1 และแม้แต่ GPT-5.1 ของ OpenAI คะแนนมาตรฐานแนะนำว่า Gemini 3 Pro นำในด้านการให้เหตุผลและงานหลายรูปแบบ แม้ว่าประสิทธิภาพในโลกจริงจะแตกต่างกันไปตามกรณีการใช้งาน.
Google ได้แจกจ่าย Gemini 3 Pro ผ่านแพลตฟอร์มคลาวด์ของตน โดยมีข้อกำหนดบริการที่มีอยู่เป็นเงื่อนไข นโยบายการห้ามใช้งาน AI ที่สร้างขึ้นของบริษัทจะถูกนำมาใช้ ซึ่งห้ามการใช้งานในกิจกรรมที่อันตราย, การละเมิดความปลอดภัย, เนื้อหาที่มีลักษณะทางเพศที่ชัดเจน, ความรุนแรง, การพูดจาเกลียดชัง, และข้อมูลที่บิดเบือน.