Google DeepMind เปิดตัวเครื่องมือใหม่ ใช้ AI สร้างซาวด์แทร็คให้วิดีโอ

Jun 19, 2024

มีเครื่องมือ Generative AI หลายตัวที่สร้างวิดีโอสมจริงได้ แต่ส่วนใหญ่ยังเป็นวิดีโอเงียบ และมีความยาวจำกัด หากอยากสร้างเพลงหรือซาวด์แทร็คต้องใช้เครื่องมืออีกตัวมาช่วย Google DeepMind ก็เลยเปิดตัวเครื่องมือใหม่มาช่วยสร้างเสียงประกอบซาวด์แทร็คให้วิดีโอ AI เหล่านี้

Google อธิบายเทคโนโลยีเบื้องหลังว่าเป็น video-to-audio หรือ V2A เป็นการผสมผสานพิกเซลวิดีโอ เข้ากับข้อความเพื่อสร้างทัศนียภาพเสียงสำหรับฉากแอ็คชันบนหน้าจอ

V2A ใช้งานคู่กับ Veo เครื่องมือสร้างวิดีโอที่ Google เผยโฉมครั้งแรกในงาน Google I/O ที่ผ่านมา สร้างเสียงประกอบที่แมทช์เข้ากันกับสิ่งที่เกิดขึ้นบนวิดีโอ เช่นเสียงคันเร่งรถซิ่งไปตามถนน เสียงร้องของไดโนเสาร์แรกเกิด

ส่วนการ Prompt สามารถกำหนดได้ว่าต้องการเสียงแบบไหนแต่ต้องระบุให้ละเอียด เช่น Cinematic, thriller, horror film, music, tension, ambience, footsteps on concrete ระบบก็จะสร้างเสียงที่ตรงตามความต้องการมาให้

ตัว V2A ของ DeepMind สร้างเสียงพูดได้ด้วย แต่ยังมีปัญหาเรื่องการซิงค์เสียงให้ตรงกับการขยับริมฝีปากซึ่งเป็นเรื่องท้าทายสำหรับเครื่องมือ gen AI นอกจากนี้ V2A จะทำงานได้ดีต่อเมื่อได้อินพุตเป็นวิดีโอที่มีความชัดเจน ถ้าวิดีโอเบลอ ผิดเพี้ยน ก็ส่งผลต่อคุณภาพเสียงด้วยเช่นกัน

Google DeepMind ยังไม่เปิดให้คนทั่วไปใช้งาน เพียงแต่มาโชว์ศักยภาพว่า AI ตอนนี้ ทำได้ถึงขนาดนี้แล้ว

ในเว็บไซต์ https://deepmind.google/discover/blog/generating-audio-for-video/ มีตัวอย่างวิดีโอและ Prompt เสียงให้ดูด้วย

News Update, tech

Generative AI Google Google DeepMind video-to-audio

Content Editor

เนื้อหาที่เกี่ยวข้อง

HONOR X9d 5G คว้ารางวัล สินค้านวัตกรรมยอดเยี่ยมแห่งปี

เปิดตัว realme 16 Series 5G รุ่นกลางต่ำ 20,000 ได้กล้อง 200MP

Jensen Huang ตอบกระแสดราม่า DLSS 5 เรนเดอร์หน้าคนจนดูเป็นหน้า AI

Google อัปเกรด Stitch เครื่องมือออกแบบ UI ได้แบบ vibe design

หุ่นยนต์ Olaf ความก้าวหน้าครั้งใหม่ของ Physical AI

เปิด 5 ไฮไลต์ของ HONOR Magic8 Pro