Open AI และ Anthropic ปล่อย AI agent โมเดลล่าสุด พัฒนาและแก้ไขบั๊กตัวเองได้ 

เป็นความเคลื่อนไหวสำคัญอีกหนึ่งอย่างในวงการ AI agent เมื่อ Open AI และ Claude ปล่อยโมเดล AI agent เวอร์ชั่นล่าสุดออกมาพร้อมกัน ประสิทธิภาพโหดทั้งคู่ นอกจากเขียนโค้ดเองแล้ว ยังแก้บั๊ก หรือปรับปรุงแก้ไขข้อผิดพลาดของตัวเองได้ 

Open AI เปิดตัว GPT‑5.3-Codex ทำงานเร็วขึ้นกว่าเวอร์ชั่น 5.2 ราว 25% ทำงานใน task ที่ยาวนานได้โดยไม่ล้มเหลวระหว่างทางหรือ lose context 

Open AI บอกว่า GPT-5.3-Codex คือโมเดลแรกของบริษัทที่สามารถสร้างและพัฒนาตัวเองได้ (Self-Creation) ก่อนหน้านี้ทีม Codex ของ Open AI ใช้ Codex เวอร์ชั่นแรกๆ ในงาน debug เทรนโมเดล ตรวจสอบและประเมินผล ซึ่งสามารถทำได้ดีและพัฒนาตัวเองไปอย่างรวดเร็ว แต่พอมาในเวอร์ชั่น GPT-5.3-Codex  มันสามารถเปลี่ยน agent ที่เขียนและตรวจสอบโค้ด ไปเป็นนักพัฒนาซอฟต์แวร์คนหนึ่งที่เก่ง และทำงานโค้ดได้ทุกอย่างที่สามารถทำได้บนคอมพิวเตอร์

GPT-5.3-Codex ยังมีเบนช์มาร์คด้านการใช้โทเค็นน้อยกว่าเวอร์ชั่นก่อนๆ นักพัฒนาลองให้ GPT-5.3-Codex สร้างเกมรถแข่งและเกมดำน้ำ และใช้ prompt ทั่วไปอย่าง “fix the bug” or “improve the game ตัวโมเดล Codex ก็จะทำงานปรับปรุงโค้ดเอง แก้ปัญหาเอง จนออกมาเป็นเกมแข่งรถและเกมดำน้ำที่สมบูรณ์มากขึ้น สะท้อนให้เห็นว่า GPT-5.3-Codex เข้าใจด้านการลดความซับซ้อน UI การใช้งานและเข้าใจความลื่นไหลและความสวยงามของตัวเกม 

ส่วน Anthropic ก็ปล่อยโมเดล Claude Opus 4.6 ผู้ช่วย AI agent ด้านงานโค้ดที่ปรับปรุงและแก้ไขบั๊กตัวเองได้ รองรับได้ 1 ล้านโทเค็น การันตีการทำงานใน task ยาวๆ ซับซ้อนได้ และแน่นอนว่าทำงานโค้ดแทนคนได้จริง 

วิศวกรของ Anthropic ทดสอบ Opus 4.6 พบว่าโมเดลสามารถโฟกัสงานส่วนที่ท้าทายที่สุดได้โดยไม่ต้องสั่งการ จัดการงานทั่วไปได้เร็ว จัดการกับปัญหาที่คลุมเครือได้ดีขึ้น และยังคงมีประสิทธิภาพในการทำงานที่ยาวนานขึ้น 

การรองรับ 1 ล้านโทเค็น ยังช่วยให้ Opus 4.6 มีประสิทธิภาพในการดึงข้อมูลจากชุดข้อมูลขนาดใหญ่ จัดเก็บและติดตามข้อมูลได้มากกว่าหลายแสนโทเค็นโดยมีการคลาดเคลื่อนน้อยกว่า และยังสามารถดึงรายละเอียดที่ซ่อนอยู่ซึ่งแม้แต่ Opus 4.5 ก็อาจพลาดไปได้

ที่มา : Open AI, Anthropic