ทีม Robotics ของ Google DeepMind นำหุ่นยนต์ช่วยนำทางในออฟฟิศ รันด้วยความสามารถ Gemini 1.5 Pro ใช้ความสามารถ LLM ในการตอบโต้กับคน และใช้วิดีโอสถานที่เป็นแหล่งข้อมูลให้หุ่นยนต์เรียนรู้
ในตัวอย่างพนักงานของ Google ขอให้หุ่นยนต์พาไปที่ที่เขาจะสามารถวาดรูปจากนั้นหุ่นยนต์ที่สวมเน็คไทสีเหลืองสดใส ก็พามนุษย์ไปที่กระดานไวท์บอร์ดขนาดเท่าผนังติดตั้งอยู่ รวมถึงการให้หุ่นยนต์พาไปยังสถานที่ต่างๆ ในออฟฟิศ หุ่นยนต์อาจมีประโยชน์ในแง่การนำทางในสถานที่จัดงานใหญ่ หรือสนามบิน
นักวิจัย DeepMind กล่าวว่าหุ่นยนต์ที่ขับเคลื่อนด้วย Gemini มีอัตราความสำเร็จในการทำตามคำสั่ง 90% จากคำสั่งมากกว่า 50 คำสั่ง ในระยะพื้นที่ 9,000 ตารางฟุตของพื้นที่ออฟฟิศ Google
แต่จากวิดีโอ หุ่นยนต์ยังใช้เวลาหลายวินาทีในการทบทวนคำสั่ง ซึ่งอาจไม่เร็วทันใจมากพอ ซึ่งต้องพัฒนาและเรียนรู้ต่อไป
ที่มา : https://www.instagram.com/p/C9SN9uToGHR/?utm_source=ig_embed&utm_campaign=embed_video_watch_again