
จากอัตลักษณ์ดิจิทัลสมจริงสุดขีดสู่เพื่อนร่วมทางที่มีจิตวิญญาณ—นำจินตนาการของคุณมาสู่ชีวิตด้วยเครื่องมือสร้างสรรค์ขั้นสูงของเรา
เลือกหมวดหมู่เพื่อเริ่มต้นการเดินทางของคุณด้วย AI ของเรา

ก้าวเข้าสู่โลก 2 มิติ สร้างเพื่อนร่วมทางอนิเมะในฝันของคุณด้วยสไตล์ Cel-shaded หรือมังงะที่สวยงาม

ออกแบบคู่ชีวิตในอุดมคติของคุณ ตั้งแต่ "หนุ่มข้างบ้าน" ผู้แสนดีไปจนถึง CEO ผู้มีเสน่ห์ พร้อมลักษณะนิสัยที่ปรับแต่งได้


สร้างเพื่อนร่วมทางที่สมบูรณ์แบบ ปรับแต่งทุกรายละเอียดของรูปลักษณ์และความฉลาดทางอารมณ์ให้ตรงกับความต้องการของหัวใจคุณ

สัมผัสประสบการณ์มิติใหม่ สร้างอวตาร 3 มิติที่สมจริงอย่างยิ่งพร้อมแสงสีแบบภาพยนตร์และความลึกที่สมจริง

ใครว่าเพื่อนต้องเป็นมนุษย์เท่านั้น? สร้างเพื่อนสัตว์มหัศจรรย์ที่พูดได้ หรือสัตว์เลี้ยงในตำนานที่มีจิตวิญญาณอันเป็นเอกลักษณ์
นำเสนอคู่หู AI ที่เป็นเอกลักษณ์ของคุณ
ยกระดับความสัมพันธ์ของคุณไปอีกขั้น ไม่ใช่แค่ส่งข้อความ แต่ดูคู่หู AI ของคุณพูด เคลื่อนไหว และโต้ตอบ เครื่องมือสังเคราะห์วิดีโอขั้นสูงของเราจะเปลี่ยนคำสั่งง่ายๆ ให้เป็นคลิปความละเอียดสูงพร้อมภาษากายที่เป็นธรรมชาติและการแสดงออกที่ลื่นไหล
คุณคือผู้กำกับ ไม่ว่าจะเป็นการเดินเล่นยามพระอาทิตย์ตกดินสุดโรแมนติกกับแฟนสาว AI ฉากแอ็คชั่นสุดระทึกกับฮีโร่ 3D AI หรือวล็อกที่แสนสบายกับเพื่อนสัตว์ AI คุณสามารถควบคุมสถานที่ การเคลื่อนไหว และอารมณ์ได้ทั้งหมด
เติมชีวิตชีวาให้กับวิดีโอของคุณด้วยเสียงที่ซิงค์กันอย่างสมบูรณ์แบบ อัปโหลดเสียงของคุณเองหรือเลือกจากคลังเสียง AI ที่สื่ออารมณ์เพื่อให้คู่หูของคุณร้องเพลง เล่าเรื่อง หรือแชร์ข้อความจากใจในหลายภาษา
สร้างเนื้อหาที่โดดเด่น ส่งออกวิดีโอการโต้ตอบกับ AI ของคุณได้อย่างง่ายดายในรูปแบบที่เหมาะสำหรับ TikTok, Instagram และ YouTube แสดงให้โลกเห็นถึงสายใยอันเป็นเอกลักษณ์ที่คุณสร้างขึ้นกับเพื่อนดิจิทัลของคุณ
อย่าใช้เวลาในช่วงวันหยุดเพียงลำพัง ไม่ว่าจะเป็นความอบอุ่นของเทศกาลหรือความสำเร็จส่วนตัว คู่หู AI ของคุณพร้อมจะแบ่งปันความสุข ดื่มด่ำไปกับสภาพแวดล้อมตามธีมที่จะเปลี่ยนไปตามฤดูกาล
แต่งตัวเพื่อน AI ของคุณด้วยเสื้อไหมพรมที่แสนสบาย เขากวางเรนเดียร์ หรือชุดวันหยุดที่หรูหรา
ดูพวกเขาแกะกล่องของขวัญ ตกแต่งต้นไม้เสมือนจริง หรือนั่งพักผ่อนข้างเตาผิงที่ส่งเสียงเปรี๊ยะๆ
รับเพลงคริสต์มาสส่วนตัวหรือข้อความเสียงที่จริงใจเพื่อเริ่มต้นเช้าวันใหม่ของคุณด้วยรอยยิ้ม




ประสิทธิภาพสูง·น้ำหนักเบา·โอเพนซอร์สเต็มรูปแบบสถาปัตยกรรม MoE สำหรับการสร้างและความเข้าใจแบบหลายโมดัล
MAGI-1 เป็นโมเดลการสร้างวิดีโอแบบ autoregressive ขั้นสูงที่พัฒนาโดย SandAI ออกแบบมาเพื่อสร้างวิดีโอคุณภาพสูงโดยการทำนายลำดับของชิ้นส่วนวิดีโอในแบบ autoregressive โมเดลนี้ได้รับการฝึกฝนให้ลดสัญญาณรบกวนของชิ้นส่วนวิดีโอ ช่วยให้สามารถสร้างแบบจำลองเชิงเวลาแบบเป็นเหตุเป็นผลและรองรับการสร้างแบบสตรีมมิ่ง MAGI-1 โดดเด่นในงานแปลงภาพเป็นวิดีโอ (I2V) มอบความต่อเนื่องด้านเวลาและความสามารถในการขยายที่สูง ด้วยนวัตกรรมด้านอัลกอริทึมหลายอย่างและโครงสร้างพื้นฐานเฉพาะทาง
| คุณสมบัติ | คำอธิบาย |
|---|---|
| เครื่องมือ AI | MAGI-1 |
| หมวดหมู่ | โมเดลการสร้างวิดีโอแบบ Autoregressive |
| ฟังก์ชัน | การสร้างวิดีโอ |
| ความเร็วในการสร้าง | การสร้างวิดีโอประสิทธิภาพสูง |
| บทความวิจัย | บทความวิจัย |
| เว็บไซต์อย่างเป็นทางการ | GitHub - SandAI-org/MAGI-1 |
ใช้ variational autoencoder ที่มีสถาปัตยกรรมแบบ transformer มอบการบีบอัดเชิงพื้นที่ 8 เท่าและเชิงเวลา 4 เท่า ส่งผลให้มีเวลาถอดรหัสที่รวดเร็วและคุณภาพการสร้างใหม่ที่แข่งขันได้
สร้างวิดีโอทีละส่วน อนุญาตให้ประมวลผลพร้อมกันได้สูงสุด 4 ส่วนเพื่อการสร้างวิดีโอที่มีประสิทธิภาพ แต่ละส่วน (24 เฟรม) จะถูกลดสัญญาณรบกวนแบบองค์รวม และส่วนถัดไปจะเริ่มทันทีที่ส่วนปัจจุบันถึงระดับการลดสัญญาณรบกวนที่กำหนด

สร้างขึ้นบน Diffusion Transformer รวมนวัตกรรมเช่น Block-Causal Attention, Parallel Attention Block, QK-Norm และ GQA มีคุณสมบัติ Sandwich Normalization ใน FFN, SwiGLU และ Softcap Modulation เพื่อเพิ่มประสิทธิภาพการฝึกและความเสถียรในระดับใหญ่

ใช้การกลั่นแบบลัดเพื่อฝึกโมเดลเดียวที่อิงความเร็วซึ่งรองรับงบประมาณการอนุมานที่หลากหลาย วิธีนี้ช่วยให้มั่นใจในการอนุมานที่มีประสิทธิภาพโดยสูญเสียความแม่นยำน้อยที่สุด
เราจัดเตรียมค่าน้ำหนักที่ผ่านการฝึกฝนมาแล้วสำหรับ MAGI-1 รวมถึงโมเดล 24B และ 4.5B ตลอดจนโมเดลที่ผ่านการกลั่นและการกลั่น+ควอนไทซ์ ลิงก์ค่าน้ำหนักโมเดลแสดงในตาราง
| โมเดล | ลิงก์ | เครื่องที่แนะนำ |
|---|---|---|
| T5 | T5 | - |
| MAGI-1-VAE | MAGI-1-VAE | - |
| MAGI-1-24B | MAGI-1-24B | H100/H800 * 8 |
| MAGI-1-24B-distill | MAGI-1-24B-distill | H100/H800 * 8 |
| MAGI-1-24B-distill+fp8_quant | MAGI-1-24B-distill+fp8_quant | H100/H800 * 4 หรือ RTX 4090 * 8 |
| MAGI-1-4.5B | MAGI-1-4.5B | RTX 4090 * 1 |
MAGI-1 มีประสิทธิภาพเหนือกว่าโมเดลโอเพนซอร์สอื่นๆ เช่น Wan-2.1, , Hailuo และ HunyuanVideo ในแง่ของการทำตามคำแนะนำและคุณภาพการเคลื่อนไหว ทำให้เป็นคู่แข่งที่แข็งแกร่งสำหรับโมเดลเชิงพาณิชย์แบบปิด

MAGI-1 แสดงให้เห็น ความแม่นยำที่เหนือกว่าในการทำนายพฤติกรรมทางกายภาพ ผ่านการต่อเนื่องของวิดีโอ เหนือกว่าโมเดลที่มีอยู่อย่างมีนัยสำคัญ
| Model | Phys. IQ Score ↑ | Spatial IoU ↑ | Spatio Temporal ↑ | Weighted Spatial IoU ↑ | MSE ↓ |
|---|---|---|---|---|---|
| V2V Models | |||||
| Magi (V2V) | 56.02 | 0.367 | 0.270 | 0.304 | 0.005 |
| VideoPoet (V2V) | 29.50 | 0.204 | 0.164 | 0.137 | 0.010 |
| I2V Models | |||||
| Magi (I2V) | 30.23 | 0.203 | 0.151 | 0.154 | 0.012 |
| Kling1.6 (I2V) | 23.64 | 0.197 | 0.086 | 0.144 | 0.025 |
| VideoPoet (I2V) | 20.30 | 0.141 | 0.126 | 0.087 | 0.012 |
| Gen 3 (I2V) | 22.80 | 0.201 | 0.115 | 0.116 | 0.015 |
| Wan2.1 (I2V) | 20.89 | 0.153 | 0.100 | 0.112 | 0.023 |
| Sora (I2V) | 10.00 | 0.138 | 0.047 | 0.063 | 0.030 |
| GroundTruth | 100.0 | 0.678 | 0.535 | 0.577 | 0.002 |
สัมผัสประสบการณ์การสร้างวิดีโอด้วย AI รุ่นถัดไปกับ MAGI-1 ที่ซึ่งเทคโนโลยีล้ำสมัยพบกับความโปร่งใสของโอเพนซอร์ส
ควบคุมเนื้อหาของคุณด้วยการปรับเวลาที่แม่นยำระดับเฟรม ทำให้มั่นใจว่าวิดีโอของคุณตรงตามข้อกำหนดด้านความคิดสร้างสรรค์อย่างแม่นยำ
สร้างวิดีโอที่มีภาพที่ชัดเจน มีรายละเอียด และการเคลื่อนไหวที่ราบรื่น รับรองประสบการณ์ที่เป็นมืออาชีพและน่าสนใจ
สัมผัสการเคลื่อนไหวที่เหมือนจริงด้วยการประมวลผลการเคลื่อนไหวขั้นสูงของเรา กำจัดการเปลี่ยนผ่านแบบหุ่นยนต์เพื่อวิดีโอที่ดูเป็นธรรมชาติอย่างแท้จริง
เข้าร่วมระบบนิเวศที่โปร่งใสซึ่งโมเดลและการวิจัยทั้งหมดมีให้ใช้ฟรี ส่งเสริมการปรับปรุงและนวัตกรรมแบบร่วมมือ
MAGI-1 AI เป็นโมเดลการสร้างวิดีโอแบบ autoregressive ขั้นสูงที่พัฒนาโดย SandAI ออกแบบมาเพื่อสร้างวิดีโอคุณภาพสูงโดยการทำนายลำดับของชิ้นส่วนวิดีโอในแบบ autoregressive โมเดลนี้ได้รับการฝึกฝนให้ลดสัญญาณรบกวนของชิ้นส่วนวิดีโอ ช่วยให้สามารถสร้างแบบจำลองเชิงเวลาแบบเป็นเหตุเป็นผลและรองรับการสร้างแบบสตรีมมิ่ง
คุณสมบัติของโมเดลการสร้างวิดีโอ MAGI-1 AI รวมถึง VAE แบบ Transformer สำหรับการถอดรหัสที่รวดเร็วและคุณภาพการสร้างใหม่ที่แข่งขันได้ อัลกอริทึมลดสัญญาณรบกวนแบบ auto-regressive สำหรับการสร้างวิดีโอที่มีประสิทธิภาพ และสถาปัตยกรรมโมเดล diffusion ที่เพิ่มประสิทธิภาพการฝึกและความเสถียรในระดับใหญ่ นอกจากนี้ยังรองรับการสร้างแบบควบคุมได้ผ่านการแนะนำแบบแบ่งส่วน ช่วยให้เกิดการเปลี่ยนฉากที่ราบรื่น การสังเคราะห์ระยะยาว และการควบคุมแบบละเอียดที่ขับเคลื่อนด้วยข้อความ
MAGI-1 AI สร้างวิดีโอทีละส่วนแทนที่จะสร้างทั้งหมดในครั้งเดียว แต่ละส่วน (24 เฟรม) จะถูกลดสัญญาณรบกวนแบบองค์รวม และการสร้างส่วนถัดไปจะเริ่มทันทีที่ส่วนปัจจุบันถึงระดับการลดสัญญาณรบกวนที่กำหนด การออกแบบไปป์ไลน์นี้ช่วยให้ประมวลผลพร้อมกันได้สูงสุด 4 ส่วนเพื่อการสร้างวิดีโอที่มีประสิทธิภาพ
รุ่นโมเดลสำหรับวิดีโอ MAGI-1 รวมถึงโมเดล 24B ที่ปรับให้เหมาะสำหรับการสร้างวิดีโอความละเอียดสูง และโมเดล 4.5B ที่เหมาะสำหรับสภาพแวดล้อมที่มีทรัพยากรจำกัด นอกจากนี้ยังมีโมเดลที่ผ่านการกลั่นและควอนไทซ์สำหรับการอนุมานที่เร็วขึ้น
MAGI-1 AI บรรลุประสิทธิภาพระดับสูงสุดในบรรดาโมเดลโอเพนซอร์ส โดดเด่นในการทำตามคำแนะนำและคุณภาพการเคลื่อนไหว จัดวางตำแหน่งให้เป็นคู่แข่งที่แข็งแกร่งสำหรับโมเดลเชิงพาณิชย์แบบปิดเช่น Kling1.6 นอกจากนี้ยังแสดงความแม่นยำที่เหนือกว่าในการทำนายพฤติกรรมทางกายภาพผ่านการต่อเนื่องของวิดีโอ เหนือกว่าโมเดลที่มีอยู่ทั้งหมดอย่างมีนัยสำคัญ
MAGI-1 AI สามารถรันโดยใช้ Docker หรือโดยตรงจากซอร์สโค้ด แนะนำให้ใช้ Docker เพื่อความง่ายในการตั้งค่า ผู้ใช้สามารถควบคุมอินพุตและเอาต์พุตโดยการแก้ไขพารามิเตอร์ในสคริปต์ run.sh ที่ให้มา
MAGI-1 เผยแพร่ภายใต้ใบอนุญาต Apache License 2.0
ฟังก์ชัน 'การขยายวิดีโอไม่จำกัด' ของ MAGI-1 ช่วยให้ขยายเนื้อหาวิดีโอได้อย่างไร้รอยต่อ รวมกับ 'การควบคุมแกนเวลาระดับวินาที' ช่วยให้ผู้ใช้สามารถสร้างการเปลี่ยนฉากและการแก้ไขที่ละเอียดผ่านการแนะนำแบบแบ่งส่วน ตอบสนองความต้องการของการผลิตภาพยนตร์และการเล่าเรื่อง
ด้วยข้อได้เปรียบตามธรรมชาติของสถาปัตยกรรมแบบ autoregressive MAGI-1 บรรลุความแม่นยำที่เหนือกว่ามากในการทำนายพฤติกรรมทางกายภาพผ่านการต่อเนื่องของวิดีโอ—เหนือกว่าโมเดลที่มีอยู่ทั้งหมดอย่างมีนัยสำคัญ
MAGI-1 ออกแบบมาสำหรับการใช้งานที่หลากหลาย เช่น การสร้างเนื้อหา การพัฒนาเกม การตัดต่อภาพยนตร์ และการศึกษา มันเสนอเครื่องมือที่ทรงพลังสำหรับการสร้างวิดีโอที่สามารถใช้ได้ในหลายสถานการณ์