2024/09/23 16:44

美图奇想大模型全新升级：生成能力、生成效率、模型性能实现三重进阶

9月23日，美图公司宣布美图奇想大模型（MiracleVision）视频生成能力完成全面升级，在实现生成能力、生成效率以及模型性能的三重进阶基础上，结合美图在计算机视觉领域的多项自研技术优势，视频生成时长与画质、流畅性、真实性及可信度等方面提升显著。

目前，美图奇想大模型（MiracleVision）的单次文生视频时长、单次图生视频时长均达5秒，已支持1分钟、帧率24FPS、分辨率1080P的超长视频生成，可以任意视频尺寸输出。

文生视频3

基于美图公司在影像领域的长期深厚积累，全新升级的美图奇想大模型（MiracleVision）结合对特征的大范围提取，实现了在艺术风格、细腻画风、细节把控之间的高度平衡，并针对人像、动漫、国潮、商业设计等领域进行优化，具备强大的风格泛化力与兼具艺术审美的视觉表现力。此外，在复杂3D时空精准重构基础上，视频生成能够重现真实物理规律，支持大幅度流畅运动。

美图奇想大模型（MiracleVision）于2023年6月上线，2024年1月通过国家备案，2024年6月迭代至V5版本并升级为Diffusion与Transformer模型结合的全新技术路线，采用DiT视频生成架构。

在新的技术路线下，相较业界先头兵，美图奇想大模型（MiracleVision）选择优先攻克更具挑战性的问题。此次升级，美图奇想大模型（MiracleVision）在技术层面上解决了主体一致性、运动连贯性、物理逻辑合理性等视频生成能力落地的核心问题。

目前，美图奇想大模型（MiracleVision）全新视频生成能力已应用于美图旗下部分产品，凭借高度可复用的模块化能力，升级优势将逐步覆盖美图秀秀、美颜相机、Wink、开拍、美图设计室、WHEE、MOKI等产品，进一步深化美图在视频工具赛道的应用深度与广度。

作为美图AI产品生态的基石，美图奇想大模型（MiracleVision）坚持以用户需求场景驱动技术研发模式，追求用户体验和技术进步的平衡。本次升级完成后，美图奇想大模型的架构进一步完善，从AI图像、AI视频、AI设计三个维度，全方位支持美图AI产品生态的丰富与进步，切实提升用户的体验与效率，深化美图公司在电商、广告、游戏、动漫、影视领域的应用实践。

产业