Open AI เปิดตัว AI agent ในความสามารถใหม่คือ Operator AI สามารถทำงานบางอย่างบนเว็บไซต์แทนเราได้ ไม่ว่าจะเป็น คลิกเข้าเว็บไซต์ การเลื่อนหน้าจอขึ้นลง การพิมพ์ หรือแม้แต่การหยิบสินค้าใส่ตะกร้าออนไลน์

เบื้องหลังการทำงานของ Operator AI คือ Computer-Using Agent (CUA) โมเดลที่ผสมผสานความสามารถในการมองเห็นหรือ visual ของ GPT-4o เข้ากับการเข้าใจบริบท advanced reasoning ถูกเทรนมาให้เรียนรู้อินเทอร์เฟซ UI ที่คนคุ้นเคย ไม่ว่าจะเป็น ช่องค้นหา ปุ่มเมนูต่างๆ ช่องใส่ข้อความค้นหา
วิธีการทำงาน เมื่อดูจากเดโม่ของบริษัทคือเราสั่งงาน Operator AI ไว้ล่วงหน้า เช่น ให้ไปหาสูตรอาหาร และหาวัตถุดิบ 1 2 3 และใส่ในตะกร้าซื้อของ Operator AI ก็จะเลื่อนเมาส์พิมพ์ค้นหา เข้า Instacart ให้เอง
เรายังให้ Operator AI ทำงานหลายอย่างพร้อมกันได้ เช่น สั่งซื้อแก้วเคลือบอีนาเมลบน Etsy จองพื้นที่ตั้งแคมป์บน Hipcamp ซึ่งไม่ต่างอะไรจากตอนที่เราทำธุระหลายๆ แท็บพร้อมกัน
Open AI บอกว่า Operator AI ได้รับการฝึกให้คอยขอให้คนทำงานแทน สำหรับงานละเอียดอ่อน เช่นการยืนยันตัวตน การเข้าสู่ระบบ จ่ายเงิน การแก้ไข CAPTCHA
Open AI ยังบอกด้วยว่าได้ร่วมมือกับบริษัทต่างๆ เช่น DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber ฯลฯ เพื่อให้แน่ใจว่า Operator AI สามารถตอบสนองความต้องการในโลกแห่งความเป็นจริงได้
Operator AI ยังเป็นเวอร์ชั่นพรีวิวหรืออยู่ในช่วงวิจัยเท่านั้น แต่เริ่มใช้งานเฉพาะสหรัฐฯ ในผู้ใช้งานกลุ่ม ChatGPT Pro ที่มีราคาถึงเดือนละ 200 ดอลลาร์
ที่มา : Open AI