Google เข้าสู่ยุค AI agent หรือผู้ช่วย AI ที่ช่วยเราทำงานในระดับที่สามารถทำงานแทนเราได้ในหลายๆ อย่าง ด้วยการเปิดตัวโมเดลใหม่ Gemini 2.0 ซึ่ง Google บอกว่า หาก Gemini 1.0 สามารถทำความเข้าใจและจัดการข้อมูลได้ Gemini 2.0 คือสามารถทำได้มากกว่าและเป็นประโยชน์มากกว่า และจะเพิ่มประสิทธิภาพในโปรดักต์ต่างๆ ทั้ง AI Overviews ใน Search และ Workspace
Google จะเริ่มปล่อย Gemini 2.0 Flash ให้ทดสอบในกลุ่มนักพัฒนา เป็นการต่อยอดจากเวอร์ชั่น 1.5 ที่เน้นความเร็ว โดย Gemini 2.0 Flash นอกจากรองรับอินพุตหลากหลายแล้ว ยังรองรับเอาท์พุตหลากหลายทั้งภาพ ข้อความ และยังสามารถสร้าง text-to-speech ได้หลายภาษา เรียกใช้เครื่องมือต่างๆ เช่น Google Search, การรันโค้ด
ผู้ใช้ Gemini ทั่วโลกสามารถเข้าถึงเวอร์ชัน 2.0 Flash โดยเลือกจากเมนูแบบดรอปดาวน์บนเดสก์ท็อปและเว็บ และจะพร้อมใช้งานในแอป Gemini เร็วๆ นี้
Google จะใช้ความสามารถของ Gemini 2.0 ในโปรเจกต์งานวิจัย ทั้ง Project Astra ที่สามารถทำความเข้าใจสิ่งต่างๆ รอบตัวที่ Google เผยโฉมเมื่อกลางปีที่ผ่านมา รวมถึงโปรเจกต์ใหม่ Project Mariner ผู้ช่วย AI ที่ทำงานคู่กับเราระหว่างที่เราใช้งาน Chrome
ในวิดีโอตัวอย่าง นักวิจัย prompt ไว้ก่อนว่าเราต้องหาข้อมูลบริษัท 5 รายการ และระหว่างที่เรากดค้นหา scroll สลับหน้าเว็บไปเรื่อยๆ นั้น AI ก็จะจดจำและแสดงให้เราเห็นอยู่ในแท็บข้างๆ ตลอดการทำงานของเรา จนกระทั้งเราหาครบ AI ก็จะสรุปรายการที่เราต้องการค้นหามาให้
Project Mariner มีประสิทธิภาพการทพงานอยู่ที่ 83.5% ยังอยู่ในขั้นเริ่มต้นและยังไม่ดีเท่าที่ควร ซึ่ง Google บอกว่า Project Mariner จะสามารถพัฒนาได้เร็วขึ้นในอนาคต
อีกหนึ่งโปรเจกต์ที่ Google เปิดเผยใน Gemini 2.0 คือผู้ช่วย AI เล่นเกมคือ Genie 2 ในระหว่างเล่นเกมเราสามารถคุยกับ AI ด้วยเสียง เช่นให้ AI เตือนด้วยว่าต้องเก็บเพชรใช้ทำภารกิจ ขอคำแนะนำเมื่อต้องสร้างกองทัพโจมตีคู่ต่อสู้ ให้ AI ไปหาข้อมูลว่าคาร์แรกเตอร์นี้มีที่มาและเรื่องราวอย่างไรบ้าง ซึ่ง AI จะรับรู้ข้อมูลจากเสียงและหน้าจอเกมอยู่แล้ว
เบื้องต้น Google ทำวิจัย Genie 2 ในการเล่นเกม Clash of Clans, Hay Day