บทสนทนาเจ้าของ OpenClaw: AI เป็นเครื่องมือเสริมไม่ใช่สิ่งทดแทน, 80% ของแอปจะถูกแทนที่

PANews

ผู้เขียน: 宝玉

นี่คือการสัมภาษณ์อีก 40 นาทีของผู้เขียน ClawdBot/OpenClaw คือ Peter Steinberger โดยดำเนินรายการโดย Peter Yang

Peter เป็นผู้ก่อตั้ง PSPDFKit ซึ่งมีประสบการณ์พัฒนาบน iOS เกือบ 20 ปี หลังจากบริษัทได้รับการลงทุนเชิงกลยุทธ์จาก Insight Partners มูลค่า 1 พันล้านยูโรในปี 2021 เขาเลือก “เกษียณ” ขณะนี้ Clawdbot ซึ่งตอนนี้เปลี่ยนชื่อเป็น OpenClaw ของเขากำลังเป็นที่นิยมอย่างมาก Clawbot เป็นผู้ช่วย AI ที่สามารถคุยกับคุณผ่าน WhatsApp, Telegram, iMessage ซึ่งเชื่อมต่อกับแอปพลิเคชันต่าง ๆ บนคอมพิวเตอร์ของคุณ

Peter อธิบายเกี่ยวกับ Clawbot ว่า:

“มันเหมือนเพื่อนที่อาศัยอยู่ในคอมพิวเตอร์ของคุณ บางทีอาจแปลกหน่อย แต่ฉลาดจนตกใจ

ในสัมภาษณ์นี้ เขาแบ่งปันมุมมองที่น่าสนใจหลายอย่าง: ทำไมระบบจัดการตัวแทน (Agent) ที่ซับซ้อนถึงเป็น “เครื่องสร้าง slop”, ทำไม “ให้ AI ทำงาน 24 ชั่วโมง” ถึงเป็นตัวชี้วัดความโอ้อวด และทำไมภาษาโปรแกรมเมอร์ไม่สำคัญอีกต่อไป

โปรโตไทป์หนึ่งชั่วโมง, 30,000 บรรทัดโค้ด

Peter Yang ถามว่า Clawbot คืออะไร ทำไมโลโก้เป็นกุ้งล็อบสเตอร์

Peter Steinberger ไม่ได้ตอบคำถามเรื่องกุ้งล็อบสเตอร์โดยตรง แต่เล่าเรื่องราวว่า หลังจาก “เกษียณ” เขาทุ่มเทเต็มที่กับการเขียนโปรแกรมตามความรู้สึก (vibe coding) — คือวิธีการให้ AI ตัวแทนช่วยเขียนโค้ด ปัญหาคือ ตัวแทนอาจทำงานครึ่งชั่วโมง หรืออาจหยุดถามคำถามภายในสองนาที คุณกลับมาทานอาหารแล้วพบว่ามันค้างไปแล้ว ก็รำคาญ

เขาต้องการอะไรสักอย่างที่สามารถดูสถานะคอมพิวเตอร์บนมือถือได้ตลอดเวลา แต่เขาไม่ได้ลงมือทำเอง เพราะคิดว่านี่เป็นสิ่งที่ชัดเจนมากอยู่แล้ว บริษัทใหญ่แน่นอนต้องทำ

“จนถึงพฤศจิกายนปีที่แล้ว ยังไม่มีใครทำ ผมก็คิดว่าเอาเถอะ ผมจะทำเอง

เวอร์ชันแรกง่ายมาก: เชื่อม WhatsApp เข้ากับ Claude Code ส่งข้อความเดียว มันจะเรียก AI แล้วส่งผลลัพธ์กลับมา ใช้เวลาแค่ชั่วโมงเดียวก็เสร็จแล้ว

จากนั้นมันก็ “มีชีวิตขึ้นมา” ตอนนี้ Clawbot มีโค้ดประมาณ 30,000 บรรทัด รองรับแพลตฟอร์มส่งข้อความหลักเกือบทั้งหมด

“ผมคิดว่านี่คืออนาคต ทุกคนจะมี AI ที่ทรงพลังมาก คอยเดินตามคุณไปตลอดชีวิต

เขาบอกว่า, “เมื่อคุณให้ AI เข้าถึงสิทธิ์บนคอมพิวเตอร์ของคุณ มันก็สามารถทำทุกอย่างที่คุณทำได้”

เช้าวันนั้นในโมร็อกโก

Peter Yang เล่าว่า ตอนนี้คุณไม่จำเป็นต้องนั่งอยู่หน้าเครื่องคอมพิวเตอร์เพื่อคอยดูแล มอบคำสั่งให้มันก็พอ

Peter Steinberger พยักหน้า แต่เขาอยากเล่าเรื่องอีกเรื่องหนึ่ง

ครั้งหนึ่งเขาไปฉลองวันเกิดเพื่อนที่โมร็อกโก แล้วพบว่าเขาใช้ Clawbot อยู่ตลอดเวลา ถามทาง หารีวิวร้านอาหาร สิ่งเหล่านี้เป็นเรื่องเล็ก แต่สิ่งที่ทำให้เขาประหลาดใจที่สุดคือเช้าวันนั้น: มีคนทวีตข้อความว่าเจอบัคในไลบรารีโอเพ่นซอร์สของเขา

“ผมถ่ายรูปทวีตนั้น ส่งเข้า WhatsApp

AI อ่านเข้าใจเนื้อหาทวีต รู้ว่านี่คือรายงานบัค มันเช็คเอาท์โค้ดจาก Git ที่เกี่ยวข้อง แก้ไขปัญหา ส่งโค้ดเข้าไป แล้วตอบกลับบน Twitter ว่าแก้ไขเสร็จแล้ว

“ตอนนั้นผมก็คิดว่า มันทำได้ด้วยเหรอ?

มีอีกเหตุการณ์หนึ่งที่เจ๋งมาก เขาเดินอยู่บนถนน แล้วไม่อยากพิมพ์ ก็ส่งเสียงเป็นข้อความ ปัญหาคือ เขาไม่ได้เขียนโปรแกรมให้ Clawbot รองรับการส่งเสียงมาก่อน

“ผมเห็นมันแสดงคำว่า ‘กำลังพิมพ์’ ผมก็คิดว่าแย่แล้ว แต่ผลลัพธ์คือ มันตอบกลับมาได้ปกติ

ต่อมาผมถาม AI ว่าทำได้ยังไง AI ตอบว่า: “ผมได้รับไฟล์โดยไม่มีนามสกุล ผมดูหัวไฟล์พบว่าเป็น Ogg Opus ผมมี ffmpeg อยู่บนคอมพิวเตอร์ ก็ใช้มันแปลงเป็น WAV แล้วก็หา whisper.cpp แต่คุณไม่ได้ติดตั้งไว้ ผมก็เจอคีย์ API ของ OpenAI ของคุณ แล้วใช้ curl ส่งไฟล์เสียงไปทำการถอดเสียง”

Peter Yang ฟังแล้วพูดว่า: “ของพวกนี้มันจริงจังมาก แม้จะน่ากลัวก็ตาม”

"มันเหนือกว่า ChatGPT เวอร์ชันเว็บมาก มันเหมือนเป็น ChatGPT ที่ปลดปล่อยจากพันธนาการ หลายคนไม่รู้ว่าเครื่องมืออย่าง Claude Code ไม่ใช่แค่เก่งด้านการเขียนโปรแกรม แต่สามารถแก้ปัญหาได้ทุกเรื่อง

กลุ่มเครื่องมือบรรทัดคำสั่ง (CLI)

Peter Yang ถามว่าเครื่องมืออัตโนมัติพวกนี้สร้างขึ้นอย่างไร เขียนเองหรือให้ AI เขียน

Peter Steinberger หัวเราะ

ช่วงไม่กี่เดือนที่ผ่านมา เขาขยายกลุ่ม CLI ของตัวเองอย่างต่อเนื่อง ตัวแทน AI เก่งที่สุดในด้านไหน? ก็การเรียกใช้คำสั่งในบรรทัดคำสั่ง เพราะข้อมูลฝึกสอนในชุดข้อมูลเต็มไปด้วยสิ่งนี้

เขาสร้าง CLI สำหรับเข้าถึงบริการของ Google ทั้งหมด รวมถึง Places API สร้างเครื่องมือสำหรับค้นหาอีโมจิและ GIF เพื่อให้ AI ส่ง meme ได้ตอนตอบข้อความ เขายังทำเครื่องมือแสดงเสียงเป็นภาพ เพื่อให้ AI “สัมผัส” กับดนตรี

“ผมแฮก API ของแพลตฟอร์มเดลิเวอรี่ในพื้นที่ของตัวเอง ตอนนี้ AI บอกผมได้ว่าอาหารจะมาถึงเมื่อไหร่ อีกทั้งยังย้อนรอย API ของ Eight Sleep ซึ่งเป็นเตียงอัจฉริยะที่ปรับอุณหภูมิได้ แต่ทางผู้ผลิตไม่ได้เปิด API ให้ใช้

【หมายเหตุ: Eight Sleep เป็นเตียงอัจฉริยะที่สามารถปรับอุณหภูมิเตียงได้ ทางผู้ผลิตไม่ได้เปิด API อย่างเป็นทางการ】

Peter Yang ถามต่อ: “พวกนี้คุณให้ AI ช่วยสร้างเองใช่ไหม?”

“สิ่งที่สนุกที่สุดคือ ผมเคยทำงานใน PSPDFKit มานาน 20 ปี พัฒนาบนระบบนิเวศของ Apple ด้วย Swift, Objective-C ซึ่งเชี่ยวชาญมาก แต่พอผมเปลี่ยนสายอาชีพ เพราะเบื่อที่ Apple ควบคุมทุกอย่าง และการทำ Mac app ก็กลุ่มเป้าหมายแคบ

ปัญหาคือ การเปลี่ยนจากเทคโนโลยีที่เชี่ยวชาญ ไปสู่เทคโนโลยีใหม่ มันเจ็บปวดมาก คุณเข้าใจแนวคิด แต่ไม่รู้ไวยากรณ์ คำว่า prop คืออะไร? จัดการกับ array ยังไง? ทุกคำถามเล็ก ๆ ต้องไปค้นหา คุณก็รู้สึกเหมือนเป็นคนโง่

“แต่พอมี AI ทุกอย่างก็หายไป ระบบคิดระดับระบบ สถาปัตยกรรม ความชอบ การตัดสินใจเกี่ยวกับ dependencies สิ่งเหล่านี้คือสิ่งที่มีคุณค่า และตอนนี้ก็สามารถย้ายไปสู่ทุกสาขาได้อย่างง่ายดาย

เขาหยุดพักสักครู่:

"จู่ ๆ ผมก็รู้สึกว่าสามารถสร้างอะไรได้ทุกอย่าง ภาษาไม่สำคัญแล้ว สิ่งสำคัญคือความคิดเชิงวิศวกรรมของผม

ควบคุมโลกแห่งความเป็นจริง

Peter Steinberger เริ่มสาธิตการตั้งค่าของเขา เขาให้สิทธิ์ AI อย่างน่าทึ่ง:

อีเมล, ปฏิทิน, เอกสารทั้งหมด, โคมไฟ Philips Hue, ลำโพง Sonos เขาสามารถให้ AI ปลุกตอนเช้า ค่อย ๆ เพิ่มระดับเสียงได้

AI ยังสามารถเข้าถึงกล้องวงจรปิดของเขาได้ด้วย

“มีครั้งหนึ่งผมให้มันดูว่ามีคนแปลกหน้ามาไหม เช้าวันรุ่งขึ้นมันบอกผมว่า: ‘Peter มีคนอยู่’ ผมดูวิดีโอ พบว่ามันถ่ายภาพหน้าจอของโซฟาตลอดคืน เพราะกล้องคุณภาพไม่ดี มันเลยดูเหมือนมีคนนั่งอยู่บนโซฟา

ในอพาร์ตเมนต์ที่เวียนนา AI ยังควบคุมระบบบ้านอัจฉริยะ KNX

“มันสามารถล็อคผมไว้ข้างนอกบ้านได้จริง ๆ

Peter Yang ถาม: “แล้วพวกนี้เชื่อมต่อกันยังไง?”

“ก็แค่บอกมันตรง ๆ สิ่งเหล่านี้ทำได้ มันจะหา API เอง ค้น Google เอง หรือหาคีย์ในระบบของคุณเอง

ผู้ใช้หลายคนก็เล่นสนุกกันมากขึ้น:

  • ให้มันซื้อของใน Tesco ออนไลน์
  • ให้มันสั่งของใน Amazon
  • ให้มันตอบข้อความอัตโนมัติทั้งหมด
  • ให้มันเข้าร่วมกลุ่มครอบครัวเป็น “สมาชิกในครอบครัว”

“ผมให้มันช่วยเช็คอินบนเว็บไซต์ British Airways ก็ได้ นี่คือการทดสอบ Turing เลยนะ การควบคุมเบราว์เซอร์บนเว็บไซต์สายการบิน ซึ่งเป็นอินเทอร์เฟซที่แสนจะต่อต้านมนุษย์

ใช้เวลาประมาณ 20 นาทีในครั้งแรก เพราะระบบยังหยาบอยู่ AI ต้องหาเอกสารใน Dropbox ของเขา ดึงข้อมูล กรอกแบบฟอร์ม ผ่านการตรวจสอบด้วยมนุษย์-คอมพิวเตอร์

“ตอนนี้ใช้เวลาแค่ไม่กี่นาที มันสามารถกดปุ่ม ‘ฉันเป็นมนุษย์’ ได้ เพราะมันควบคุมเบราว์เซอร์จริง ๆ พฤติกรรมก็เหมือนคน

80% ของแอปจะหายไป

Peter Yang ถาม: สำหรับผู้ใช้ทั่วไปที่เพิ่งดาวน์โหลด มีวิธีเริ่มต้นปลอดภัยอย่างไร?

Peter Steinberger กล่าวว่าแต่ละคนมีเส้นทางแตกต่างกัน บางคนติดตั้งแล้วเริ่มเขียนแอป iOS บางคนจัดการ Cloudflare ทันที มีคนติดตั้งให้ตัวเองในสัปดาห์แรก แล้วในสัปดาห์ที่สองให้ครอบครัว แล้วในสัปดาห์ที่สามก็ทำเวอร์ชันองค์กรให้บริษัท

“ผมติดตั้งให้เพื่อนที่ไม่ใช่เทคนิค แล้วเขาก็เริ่มส่ง pull request ให้ผม ซึ่งเขาไม่เคยส่งมาก่อนในชีวิต

แต่สิ่งที่เขาต้องการสื่อคือภาพรวมที่ใหญ่ขึ้น:

“ถ้าคุณคิดดู นี่อาจจะมาแทนที่ 80% ของแอปบนมือถือคุณ

ทำไมยังต้องใช้ MyFitnessPal บันทึกอาหาร?

“ผมมีผู้ช่วยที่เต็มไปด้วย resource แล้ว เขารู้แล้วว่าผมทำผิดพลาดอะไรใน KFC ผมส่งรูปภาพ มันก็เก็บลงฐานข้อมูล คำนวณแคลอรี่ แล้วเตือนให้ไปฟิตเนส

ทำไมยังต้องใช้แอปตั้งอุณหภูมิ Eight Sleep? AI มี API สิทธิ์ ก็ปรับให้เองได้ ทำไมยังต้องใช้แอปจัดการงาน? AI จดจำให้เอง ทำไมยังต้องเช็คอินเที่ยวบินด้วยแอป? AI จัดการให้ทั้งหมด ทำไมยังต้องใช้แอปช็อปปิ้ง? AI ก็แนะนำ สั่งซื้อ ติดตามได้

“จะมีชั้นของแอปที่ค่อย ๆ หายไป เพราะถ้ามี API ก็แค่บริการที่ AI จะเรียกใช้เท่านั้น

เขาทำนายว่าในปี 2026 จะเป็นปีที่หลายคนเริ่มสำรวจผู้ช่วย AI ส่วนตัว และบริษัทยักษ์ใหญ่ก็จะเข้ามา

"Clawbot อาจไม่ใช่ผู้ชนะสุดท้าย แต่เส้นทางนี้คือทางที่ถูกต้อง

แค่พูดคุยกับมัน

เปลี่ยนหัวข้อเป็นแนวทางการเขียนโปรแกรม AI Peter Yang บอกว่าเขาเคยเขียนบทความที่ได้รับความนิยมชื่อ “Just Talk to It” อยากให้เล่าให้ฟัง

Peter Steinberger แนวคิดหลักคือ: อย่าตกหลุมกับ “กับดักตัวแทน” (agentic trap)

“ผมเห็นคนจำนวนมากบน Twitter ค้นพบว่า AI เก่ง แล้วอยากให้มันเก่งขึ้น แล้วก็หลงทาง เขาสร้างเครื่องมือซับซ้อนเพื่อเร่งกระบวนการทำงาน สุดท้ายก็แค่สร้างเครื่องมือ ไม่ได้สร้างสิ่งที่มีคุณค่าแท้จริง

ตัวเขาเองก็เคยหลงทางเช่นกัน ในช่วงแรกเขาใช้เวลาสองเดือนสร้าง VPN tunnel เพื่อเข้าถึงเทอร์มินัลบนมือถือ ทำได้ดีมาก จนวันหนึ่งเขานั่งกินข้าวกับเพื่อน แล้วเขาก็ vibe coding บนมือถือทั้งที่ไม่ได้สนใจบทสนทนา

“ผมต้องหยุดพัก เพื่อสุขภาพจิต

Slop Town

เขาเพิ่งโมโหกับระบบจัดการตัวแทนชื่อ Gastown

“เป็นตัวจัดการ (orchestrator) ที่ซับซ้ามาก รันตัวแทนหลายสิบตัว สื่อสารกันเอง มี watcher, overseer, mayor, แล้วก็ pcat (อาจหมายถึงพลเมืองธรรมดาหรือแมวเหมียว) ผมไม่รู้ว่ามีอะไรอีกบ้าง

Peter Yang: แล้วมี mayor ด้วยเหรอ?

“ใช่ ในโปรเจกต์ Gastown มี mayor ผมเรียกโปรเจกต์นี้ว่า ‘Slop Town’ (เมืองโคลน)

ยังมีโหมด RALPH (เป็นโหมดวนรอบแบบ “ใช้แล้วทิ้ง” ให้ AI ทำงานเล็ก ๆ แล้วล้างข้อมูลทุกอย่างแล้วเริ่มใหม่)…

“นี่คือเครื่องเผา Token ขั้นสุดยอด คุณปล่อยให้มันรันทั้งคืน ตื่นเช้ามาจะได้แต่ขยะ (slop)

ปัญหาหลักคือ: ตัวแทนเหล่านี้ยังไม่มีรสนิยม มันฉลาดในบางด้าน แต่ถ้าไม่ชี้นำ ไม่บอกว่าคุณต้องการอะไร ผลลัพธ์ก็เป็นขยะ

“ผมไม่รู้ว่าคนอื่นทำงานยังไง แต่ตอนเริ่มโปรเจกต์ ผมมีแนวคิดคร่าว ๆ เท่านั้น ในระหว่างสร้าง เล่น ทดลอง ความรู้สึกของผมจะค่อย ๆ ชัดเจนขึ้น ผมลองอะไรไปบ้าง บางอย่างก็ไม่เวิร์ค แล้วความคิดของผมก็วิวัฒนาการเป็นรูปร่างสุดท้าย คำสั่ง (prompt) ต่อไปของผมจะขึ้นอยู่กับสิ่งที่ผมเห็น สัมผัส และคิดในขณะนั้น

ถ้าคุณพยายามเขียนทุกอย่างไว้ในข้อกำหนดเบื้องต้น คุณจะพลาดวงจรมนุษย์-เครื่องจักรนี้ไป

“ผมไม่รู้ว่าจะสร้างของดีได้อย่างไร ถ้าไม่มีความรู้สึกและรสนิยมเข้ามามีส่วนร่วม”

มีคนทวีตโชว์แอปจดบันทึกที่สร้างด้วย RALPH ทั้งหมด Peter ตอบว่า: “ใช่ มันดูเหมือนสร้างด้วย RALPH จริง ๆ ไม่มีใครออกแบบแบบนี้ได้ปกติ”

Peter Yang สรุปว่า: หลายคนใช้ AI ตลอด 24 ชั่วโมง ไม่ใช่เพื่อสร้างแอป แต่เพื่อพิสูจน์ว่าตัวเองทำได้

“มันก็เหมือนการแข่งเปรียบเทียบโดยไม่มีจุดอ้างอิง ผมก็เคยปล่อยให้รัน 26 ชั่วโมง ตอนนั้นภูมิใจมาก แต่มันเป็นแค่ความโอ้อวด ไม่มีความหมาย การสร้างทุกอย่างไม่ได้แปลว่าควรสร้างทุกอย่าง หรือมันจะดีเสมอไป

โหมดแผน (Plan Mode) เป็นแค่การแฮ็ก (Hack)

Peter Yang ถามว่าเขาจัดการบริบทอย่างไร ถ้าการสนทนายาวขึ้น AI จะสับสน ต้องบีบอัดหรือสรุปเองไหม?

Peter Steinberger ตอบว่านี่เป็น “ปัญหาแบบเก่า”

“Claude Code ก็ยังมีปัญหานี้ แต่ Codex ดีกว่ามาก ในเชิงความรู้สึก เหมือนมีบริบทเพิ่มขึ้น 2-3 เท่า ทั้งที่ในเอกสารอาจเพิ่มแค่ 30% ผมคิดว่านี่เกี่ยวกับกลไกการคิดภายใน ตอนนี้ผมพัฒนาฟังก์ชันต่าง ๆ ในบริบทเดียวกันได้หมด การพูดคุยและสร้างไปพร้อมกัน

ผมไม่ใช้ worktrees เพราะมันซับซ้อนเกินไป ผมแค่เช็คเอาท์หลาย ๆ โฟลเดอร์ เช่น clawbot-1, clawbot-2, clawbot-3, clawbot-4, clawbot-5 แล้วใช้ตัวไหนว่างก็ใช้งาน ทำเสร็จทดสอบ push ไป main แล้ว sync

“มันก็เหมือนโรงงาน ถ้าทำงานพร้อมกันหมดก็โอเค แต่ถ้าเปิดทีละตัว รอคอยนานเกินไป ก็ไม่สามารถเข้าสู่ flow ได้

Peter Yang บอกว่านี่เหมือนเกมวางแผนแบบเรียลไทม์ คุณมีทีมรุกและต้องบริหารจัดการ

เกี่ยวกับโหมดแผน (plan mode) Peter Steinberger มีความเห็นที่เป็นข้อถกเถียง:

“Plan mode เป็นแค่การแฮ็กที่ Anthropic ต้องใส่เข้าไป เพราะโมเดลมันใจร้อนมาก พอเริ่มก็รีบเขียนโค้ดเลย ถ้าใช้โมเดลล่าสุด เช่น GPT 5.2 ก็แค่คุยกับมัน ‘อยากสร้างฟีเจอร์นี้ ควรทำแบบนี้ ชอบดีไซน์นี้ ให้ตัวเลือกหลาย ๆ แบบ แล้วคุยกันก่อน’ แล้วมันก็เสนอแนวทางให้ คุยกันจนได้ข้อสรุป แล้วค่อยลงมือ

ผมไม่พิมพ์ ผมพูด

“ส่วนใหญ่ผมก็พูดคุยกับมัน”

การพัฒนาด้วย Discord

Peter Yang ถามว่าเขาทำฟีเจอร์ใหม่อย่างไร เริ่มจากสำรวจปัญหา? วางแผนก่อน?

Peter Steinberger เล่าว่าเขาทำอะไรที่อาจเป็นสิ่งที่เขาทำมากที่สุด: เขาเชื่อม Clawbot เข้ากับเซิร์ฟเวอร์ Discord สาธารณะ ให้ทุกคนคุยกับ AI ส่วนตัวของเขา พร้อมความทรงจำส่วนตัวในที่สาธารณะ

“โปรเจกต์นี้ยากจะอธิบายด้วยคำพูด เหมือนเป็นการผสมผสานระหว่าง Jarvis (ผู้ช่วย AI ใน Iron Man) กับภาพยนตร์เรื่อง ‘Her’ คนที่ได้ดูจะตื่นเต้นมาก แต่การโพสต์ภาพพร้อมคำอธิบายบน Twitter ก็ไม่เป็นที่นิยม ผมก็เลยคิดว่าให้ทุกคนได้สัมผัสเองดีกว่า

ผู้ใช้ถามคำถาม รายงานบัค เสนอความต้องการ เขาใช้วิธีถ่ายภาพสนทนาใน Discord แล้วลากเข้าเทอร์มินัล บอก AI ว่า “คุยเรื่องนี้กันเถอะ”

“ผมไม่อยากพิมพ์ ใครถามว่า ‘สนับสนุนอะไรบ้าง’ ผมก็ให้ AI อ่านโค้ด แล้วเขียน FAQ ให้

เขายังเขียน web crawler ที่สแกนช่อง help ของ Discord อย่างน้อยวันละครั้ง เพื่อให้ AI สรุปปัญหาที่ใหญ่ที่สุด แล้วก็แก้ไข

ไม่มี MCP ไม่มีการจัดการแบบซับซ้อน

Peter Yang ถาม: คุณใช้เครื่องมือสุดหรูเหล่านั้นไหม? ตัวแทนหลายตัว, skill ซับซ้อน, MCP (Model Context Protocol) หรืออะไรทำนองนั้น?

“skill ส่วนใหญ่ของผมเป็นทักษะในชีวิต เช่น การบันทึกอาหาร การซื้อของ ฯลฯ ด้านการเขียนโปรแกรมน้อยมาก เพราะไม่จำเป็น ผมไม่ใช้ MCP ไม่ใช้ของพวกนั้นเลย

เขาไม่เชื่อในระบบการจัดการตัวแทนแบบซับซ้อน

“ผมอยู่ในวงจร ผมสามารถสร้างผลิตภัณฑ์ที่รู้สึกดีขึ้นได้ อาจมีวิธีที่เร็วกว่า แต่ตอนนี้ผมใกล้ถึงขีดจำกัดแล้ว ไม่ใช่เพราะ AI แต่เป็นเพราะความเร็วในการคิดของตัวเอง บางทีรอ Codex ก็เป็นข้อจำกัด

เขาบอกว่า AI ทำให้ทุกอย่างหายไป สิ่งที่สำคัญคือความคิดเชิงระบบ สถาปัตยกรรม รสนิยม การตัดสินใจเกี่ยวกับ dependencies สิ่งเหล่านี้คือสิ่งที่มีคุณค่า และตอนนี้สามารถย้ายไปสู่ทุกสาขาได้ง่ายขึ้น

เขาหยุดพักสักครู่:

"จู่ ๆ ผมก็รู้สึกว่าสามารถสร้างอะไรได้ทุกอย่าง ภาษาไม่สำคัญแล้ว สิ่งสำคัญคือความคิดเชิงวิศวกรรมของผม

ควบคุมโลกแห่งความเป็นจริง

Peter Steinberger เริ่มสาธิตการตั้งค่าของเขา เขาให้สิทธิ์ AI อย่างน่าทึ่ง:

อีเมล, ปฏิทิน, เอกสารทั้งหมด, โคมไฟ Philips Hue, ลำโพง Sonos เขาสามารถให้ AI ปลุกตอนเช้า ค่อย ๆ เพิ่มระดับเสียงได้

AI ยังสามารถเข้าถึงกล้องวงจรปิดของเขาได้ด้วย

“มีครั้งหนึ่งผมให้มันดูว่ามีคนแปลกหน้ามาไหม เช้าวันรุ่งขึ้นมันบอกผมว่า: ‘Peter มีคนอยู่’ ผมดูวิดีโอ พบว่ามันถ่ายภาพหน้าจอของโซฟาตลอดคืน เพราะกล้องคุณภาพไม่ดี มันเลยดูเหมือนมีคนนั่งอยู่บนโซฟา

ในอพาร์ตเมนต์ที่เวียนนา AI ยังควบคุมระบบบ้านอัจฉริยะ KNX

“มันสามารถล็อคผมไว้ข้างนอกบ้านได้จริง ๆ

Peter Yang ถาม: “แล้วพวกนี้เชื่อมต่อกันยังไง?”

“ก็แค่บอกมันตรง ๆ สิ่งเหล่านี้ทำได้ มันจะหา API เอง ค้น Google เอง หรือหาคีย์ในระบบของคุณเอง

ผู้ใช้หลายคนก็เล่นสนุกกันมากขึ้น:

  • ให้มันซื้อของใน Tesco ออนไลน์
  • ให้มันสั่งของใน Amazon
  • ให้มันตอบข้อความอัตโนมัติทั้งหมด
  • ให้มันเข้าร่วมกลุ่มครอบครัวเป็น “สมาชิกในครอบครัว”

“ผมให้มันช่วยเช็คอินบนเว็บไซต์ British Airways ก็ได้ นี่คือการทดสอบ Turing เลยนะ การควบคุมเบราว์เซอร์บนเว็บไซต์สายการบิน ซึ่งเป็นอินเทอร์เฟซที่แสนจะต่อต้านมนุษย์

ใช้เวลาประมาณ 20 นาทีในครั้งแรก เพราะระบบยังหยาบอยู่ AI ต้องหาเอกสารใน Dropbox ของเขา ดึงข้อมูล กรอกแบบฟอร์ม ผ่านการตรวจสอบด้วยมนุษย์-คอมพิวเตอร์

"ตอนนี้ใช้เวลาแค่ไม่กี่นาที มันสามารถกดปุ่ม ‘ฉันเป็นมนุษย์’ ได้ เพราะมันควบคุมเบราว์เซอร์จริง ๆ พฤติกรรมก็เหมือนคน

80% ของแอปจะหายไป

Peter Yang ถาม: สำหรับผู้ใช้ทั่วไปที่เพิ่งดาวน์โหลด มีวิธีเริ่มต้นปลอดภัยอย่างไร?

Peter Steinberger กล่าวว่าแต่ละคนมีเส้นทางแตกต่างกัน บางคนติดตั้งแล้วเริ่มเขียนแอป iOS บางคนจัดการ Cloudflare ทันที มีคนติดตั้งให้ตัวเองในสัปดาห์แรก แล้วในสัปดาห์ที่สองให้ครอบครัว แล้วในสัปดาห์ที่สามก็ทำเวอร์ชันองค์กรให้บริษัท

“ผมติดตั้งให้เพื่อนที่ไม่ใช่เทคนิค แล้วเขาก็เริ่มส่ง pull request ให้ผม ซึ่งเขาไม่เคยส่งมาก่อนในชีวิต

แต่สิ่งที่เขาต้องการสื่อคือภาพรวมที่ใหญ่ขึ้น:

“ถ้าคุณคิดดู นี่อาจจะมาแทนที่ 80% ของแอปบนมือถือคุณ

ทำไมยังต้องใช้ MyFitnessPal บันทึกอาหาร?

“ผมมีผู้ช่วยที่เต็มไปด้วย resource แล้ว เขารู้แล้วว่าผมทำผิดพลาดอะไรใน KFC ผมส่งรูปภาพ มันก็เก็บลงฐานข้อมูล คำนวณแคลอรี่ แล้วเตือนให้ไปฟิตเนส

ทำไมยังต้องใช้แอปตั้งอุณหภูมิ Eight Sleep? AI มี API สิทธิ์ ก็ปรับให้เองได้ ทำไมยังต้องใช้แอปจัดการงาน? AI จดจำให้เอง ทำไมยังต้องเช็คอินเที่ยวบินด้วยแอป? AI จัดการให้ทั้งหมด ทำไมยังต้องใช้แอปช็อปปิ้ง? AI ก็แนะนำ สั่งซื้อ ติดตามได้

“จะมีชั้นของแอปที่ค่อย ๆ หายไป เพราะถ้ามี API ก็แค่บริการที่ AI จะเรียกใช้เท่านั้น

เขาทำนายว่าในปี 2026 จะเป็นปีที่หลายคนเริ่มสำรวจผู้ช่วย AI ส่วนตัว และบริษัทยักษ์ใหญ่ก็จะเข้ามา

"Clawbot อาจไม่ใช่ผู้ชนะสุดท้าย แต่เส้นทางนี้คือทางที่ถูกต้อง

แค่พูดคุยกับมัน

เปลี่ยนหัวข้อเป็นแนวทางการเขียนโปรแกรม AI Peter Yang บอกว่าเขาเคยเขียนบทความที่ได้รับความนิยมชื่อ “Just Talk to It” อยากให้เล่าให้ฟัง

Peter Steinberger แนวคิดหลักคือ: อย่าตกหลุมกับ “กับดักตัวแทน” (agentic trap)

“ผมเห็นคนจำนวนมากบน Twitter ค้นพบว่า AI เก่ง แล้วอยากให้มันเก่งขึ้น แล้วก็หลงทาง เขาสร้างเครื่องมือซับซ้อนเพื่อเร่งกระบวนการทำงาน สุดท้ายก็แค่สร้างเครื่องมือ ไม่ได้สร้างสิ่งที่มีคุณค่าแท้จริง

ตัวเขาเองก็เคยหลงทางเช่นกัน ในช่วงแรกเขาใช้เวลาสองเดือนสร้าง VPN tunnel เพื่อเข้าถึงเทอร์มินัลบนมือถือ ทำได้ดีมาก จนวันหนึ่งเขานั่งกินข้าวกับเพื่อน แล้วเขาก็ vibe coding บนมือถือทั้งที่ไม่ได้สนใจบทสนทนา

“ผมต้องหยุดพัก เพื่อสุขภาพจิต

Slop Town

เขาเพิ่งโมโหกับระบบจัดการตัวแทนชื่อ Gastown

“เป็นตัวจัดการ (orchestrator) ที่ซับซ้ามาก รันตัวแทนหลายสิบตัว สื่อสารกันเอง มี watcher, overseer, mayor, แล้วก็ pcat (อาจหมายถึงพลเมืองธรรมดาหรือแมวเหมียว) ผมไม่รู้ว่ามีอะไรอีกบ้าง

Peter Yang: แล้วมี mayor ด้วยเหรอ?

“ใช่ ในโปรเจกต์ Gastown มี mayor ผมเรียกโปรเจกต์นี้ว่า ‘Slop Town’ (เมืองโคลน)

ยังมีโหมด RALPH (เป็นโหมดวนรอบแบบ “ใช้แล้วทิ้ง” ให้ AI ทำงานเล็ก ๆ แล้วล้างข้อมูลทุกอย่างแล้วเริ่มใหม่)…

“นี่คือเครื่องเผา Token ขั้นสุดยอด คุณปล่อยให้มันรันทั้งคืน ตื่นเช้ามาจะได้แต่ขยะ (slop)

ปัญหาหลักคือ: ตัวแทนเหล่านี้ยังไม่มีรสนิยม มันฉลาดในบางด้าน แต่ถ้าไม่ชี้นำ ไม่บอกว่าคุณต้องการอะไร ผลลัพธ์ก็เป็นขยะ

“ผมไม่รู้ว่าคนอื่นทำงานยังไง แต่ตอนเริ่มโปรเจกต์ ผมมีแนวคิดคร่าว ๆ เท่านั้น ในระหว่างสร้าง เล่น ทดลอง ความรู้สึกของผมจะค่อย ๆ ชัดเจนขึ้น ผมลองอะไรไปบ้าง บางอย่างก็ไม่เวิร์ค แล้วความคิดของผมก็วิวัฒนาการเป็นรูปร่างสุดท้าย คำสั่ง (prompt) ต่อไปของผมจะขึ้นอยู่กับสิ่งที่ผมเห็น สัมผัส และคิดในขณะนั้น

ถ้าคุณพยายามเขียนทุกอย่างไว้ในข้อกำหนดเบื้องต้น คุณจะพลาดวงจรมนุษย์-เครื่องจักรนี้ไป

“ผมไม่รู้ว่าจะสร้างของดีได้อย่างไร ถ้าไม่มีความรู้สึกและรสนิยมเข้ามามีส่วนร่วม”

มีคนทวีตโชว์แอปจดบันทึกที่สร้างด้วย RALPH ทั้งหมด Peter ตอบว่า: “ใช่ มันดูเหมือนสร้างด้วย RALPH จริง ๆ ไม่มีใครออกแบบแบบนี้ได้ปกติ”

Peter Yang สรุปว่า: หลายคนใช้ AI ตลอด 24 ชั่วโมง ไม่ใช่เพื่อสร้างแอป แต่เพื่อพิสูจน์ว่าตัวเองทำได้

"มันก็เหมือนการแข่งเปรียบเทียบโดยไม่มีจุดอ้างอิง ผมก็เคยปล่อยให้รัน 26 ชั่วโมง ตอนนั้นภูมิใจมาก แต่มันเป็นแค่ความโอ้อวด ไม่มีความหมาย การสร้างทุกอย่างไม่ได้แปลว่าควรสร้างทุกอย่าง หรือมันจะดีเสมอไป

โหมดแผน (Plan Mode) เป็นแค่การแฮ็ก (Hack)

Peter Yang ถามว่าเขาจัดการบริบทอย่างไร ถ้าการสนทนายาวขึ้น AI จะสับสน ต้องบีบอัดหรือสรุปเองไหม?

Peter Steinberger ตอบว่านี่เป็น “ปัญหาแบบเก่า”

“Claude Code ก็ยังมีปัญหานี้ แต่ Codex ดีกว่ามาก ในเชิงความรู้สึก เหมือนมีบริบทเพิ่มขึ้น 2-3 เท่า ทั้งที่ในเอกสารอาจเพิ่มแค่ 30% ผมคิดว่านี่เกี่ยวกับกลไกการคิดภายใน ตอนนี้ผมพัฒนาฟังก์ชันต่าง ๆ ในบริบทเดียวกันได้หมด การพูดคุยและสร้างไปพร้อมกัน

ผมไม่ใช้ worktrees เพราะมันซับซ้อนเกินไป ผมแค่เช็คเอาท์หลาย ๆ โฟลเดอร์ เช่น clawbot-1, clawbot-2, clawbot-3, clawbot-4, clawbot-5 แล้วใช้ตัวไหนว่างก็ใช้งาน ทำเสร็จทดสอบ push ไป main แล้ว sync

“มันก็เหมือนโรงงาน ถ้าทำงานพร้อมกันหมดก็โอเค แต่ถ้าเปิดทีละตัว รอคอยนานเกินไป ก็ไม่สามารถเข้าสู่ flow ได้

Peter Yang บอกว่านี่เหมือนเกมวางแผนแบบเรียลไทม์ คุณมีทีมรุกและต้องบริหารจัดการ

เกี่ยวกับโหมดแผน (plan mode) Peter Steinberger มีความเห็นที่เป็นข้อถกเถียง:

“Plan mode เป็นแค่การแฮ็กที่ Anthropic ต้องใส่เข้าไป เพราะโมเดลมันใจร้อนมาก พอเริ่มก็รีบเขียนโค้ดเลย ถ้าใช้โมเดลล่าสุด เช่น GPT 5.2 ก็แค่คุยกับมัน ‘อยากสร้างฟีเจอร์นี้ ควรทำแบบนี้ ชอบดีไซน์นี้ ให้ตัวเลือกหลาย ๆ แบบ แล้วคุยกันก่อน’ แล้วมันก็เสนอแนวทางให้ คุยกันจนได้ข้อสรุป แล้วค่อยลงมือ

ผมไม่พิมพ์ ผมพูด

“ส่วนใหญ่ผมก็พูดคุยกับมัน”

การพัฒนาด้วย Discord

Peter Yang ถามว่าเขาทำฟีเจอร์ใหม่อย่างไร เริ่มจากสำรวจปัญหา? วางแผนก่อน?

Peter Steinberger เล่าว่าเขาทำอะไรที่อาจเป็นสิ่งที่เขาทำมากที่สุด: เขาเชื่อม Clawbot เข้ากับเซิร์ฟเวอร์ Discord สาธารณะ ให้ทุกคนคุยกับ AI ส่วนตัวของเขา พร้อมความทรงจำส่วนตัวในที่สาธารณะ

“โปรเจกต์นี้ยากจะอธิบายด้วยคำพูด เหมือนเป็นการผสมผสานระหว่าง Jarvis (ผู้ช่วย AI ใน Iron Man) กับภาพยนตร์เรื่อง ‘Her’ คนที่ได้ดูจะตื่นเต้นมาก แต่การโพสต์ภาพพร้อมคำอธิบายบน Twitter ก็ไม่เป็นที่นิยม ผมก็เลยคิดว่าให้ทุกคนได้สัมผัสเองดีกว่า

ผู้ใช้ถามคำถาม รายงานบัค เสนอความต้องการ เขาใช้วิธีถ่ายภาพสนทนาใน Discord แล้วลากเข้าเทอร์มินัล บอก AI ว่า “คุยเรื่องนี้กันเถอะ”

“ผมไม่อยากพิมพ์ ใครถามว่า ‘สนับสนุนอะไรบ้าง’ ผมก็ให้ AI อ่านโค้ด แล้วเขียน FAQ ให้

เขายังเขียน web crawler ที่สแกนช่อง help ของ Discord อย่างน้อยวันละครั้ง เพื่อให้ AI สรุปปัญหาที่ใหญ่ที่สุด แล้วก็แก้ไข

ไม่มี MCP ไม่มีการจัดการแบบซับซ้อน

Peter Yang ถาม: คุณใช้เครื่องมือสุดหรูเหล่านั้นไหม? ตัวแทนหลายตัว, skill ซับซ้อน, MCP (Model Context Protocol) หรืออะไรทำนองนั้น?

“skill ส่วนใหญ่ของผมเป็นทักษะในชีวิต เช่น การบันทึกอาหาร การซื้อของ ฯลฯ ด้านการเขียนโปรแกรมน้อยมาก เพราะไม่จำเป็น ผมไม่ใช้ MCP ไม่ใช้ของพวกนั้นเลย

เขาไม่เชื่อในระบบการจัดการตัวแทนแบบซับซ้อน

“ผมอยู่ในวงจร ผมสามารถสร้างผลิตภัณฑ์ที่รู้สึกดีขึ้นได้ อาจมีวิธีที่เร็วกว่า แต่ตอนนี้ผมใกล้ถึงขีดจำกัดแล้ว ไม่ใช่เพราะ AI แต่เป็นเพราะความเร็วในการคิดของตัวเอง บางทีรอ Codex ก็เป็นข้อจำกัด

เขาบอกว่า AI ทำให้ทุกอย่างหายไป สิ่งที่สำคัญคือความคิดเชิงระบบ สถาปัตยกรรม รสนิยม การตัดสินใจเกี่ยวกับ dependencies สิ่งเหล่านี้คือสิ่งที่มีคุณค่า และตอนนี้สามารถย้ายไปสู่ทุกสาขาได้ง่ายขึ้น

เขาหยุดพักสักครู่:

"จู่ ๆ ผมก็รู้สึกว่าสามารถสร้างอะไรได้ทุกอย่าง ภาษาไม่สำคัญแล้ว สิ่งสำคัญคือความคิดเชิงวิศวกรรมของผม

ควบคุมโลกแห่งความเป็นจริง

Peter Steinberger เริ่มสาธิตการตั้งค่าของเขา เขาให้สิทธิ์ AI อย่างน่าทึ่ง:

อีเมล, ปฏิทิน, เอกสารทั้งหมด, โคมไฟ Philips Hue, ลำโพง Sonos เขาสามารถให้ AI ปลุกตอนเช้า ค่อย ๆ เพิ่มระดับเสียงได้

AI ยังสามารถเข้าถึงกล้องวงจรปิดของเขาได้ด้วย

“มีครั้งหนึ่งผมให้มันดูว่ามีคนแปลกหน้ามาไหม เช้าวันรุ่งขึ้นมันบอกผมว่า: ‘Peter มีคนอยู่’ ผมดูวิดีโอ พบว่ามันถ่ายภาพหน้าจอของโซฟาตลอดคืน เพราะกล้องคุณภาพไม่

ดูต้นฉบับ
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น