อาลีบาบาได้เปิดให้ดาวน์โหลดโมเดล AI ที่พัฒนาเองโดยเปิดโอเพ่นซอร์สโมเดล Wan2.1 ไปแล้ว 4 โมเดลเมื่อเดือนกุมภาพันธ์ที่ผ่านมาและเปิดโอเพ่นซอร์สโมเดลสร้างวิดีโอที่รองรับการสร้างวิดีโอด้วยเฟรมเริ่มต้นและเฟรมสิ้นสุด เมื่อเดือนที่ผ่านมา

ล่าสุด อาลีบาบา เดินหน้าเปิดโอเพ่นซอร์ส Wan2.1-VACE โดยเปิดให้ดาวน์โหลดฟรี 2 เวอร์ชัน (14B และ 1.3B พารามิเตอร์) บน Hugging Face, GitHub และ ModelScope
Wan2.1-VACE มีจุดเด่นคือ
- อินเทอร์เฟซ Video Condition Unit (VCU) รองรับการประมวลผลอินพุตต่อเนื่องหลายรูปแบบได้อย่างครบถ้วนผ่านอินเทอร์เฟซเดียว ไม่ว่าจะเป็นข้อความ ภาพ วิดีโอ และมาสก์ต่าง ๆ
- สามารถอ้างอิงภาพหรือเฟรม การปรับวิดีโอใหม่ (video repainting) การแก้ไขวิดีโอบางส่วนที่เลือกไว้ และการขยายพื้นที่และเวลา
- มีฟังก์ชันการสร้างภาพโดยใช้ท่าทางที่ต้องการโดยนำมาจากภาพอีกภาพหนึ่งของบุคคลนั้นที่มีการแสดงท่าทางที่ต้องการ (pose transfer) การควบคุมการเคลื่อนไหว (motion control) การควบคุมระยะชัดลึก (depth control) และการให้สีใหม่ (recolorization)
- รองรับการเพิ่ม แก้ไข หรือลบเนื้อหาส่วนที่เลือก โดยไม่กระทบต่อเนื้อหาที่แวดล้อมอยู่
อาลีบาบา ได้เปิดโอเพ่นซอร์สโมเดล Wan2.1-VACE สองเวอร์ชัน คือ ขนาด 14-billion(B)-parameter และ ขนาด1.3-billion(B)-parameter โดยเปิดให้ดาวน์โหลดฟรีบน Hugging Face, GitHub และบน ModelScope