Meta 的 Movie Gen 在基准测试中表现优于领先模型,在各种编辑任务中都能保持视频结构和真实感。
Meta推出了Movie Gen,这是一种强大的 AI 模型,旨在制作带有同步音频的 1080p 视频。该系统可以根据指令编辑视频,允许使用用户提供的图像创建个性化内容。
Movie Gen 拥有一个包含 300 亿个参数的 Transformer 模型,能够以每秒 16 帧的速度生成 16 秒的视频。该模型的先进技术提高了视频运动的真实感,经过了超过 1 亿个视频文本对和 10 亿个图像文本对的训练。
Movie Gen 的表现优于之前的模型,包括 Runway Gen3 和 OpenAI Sora,尤其是在视频编辑和文本转视频任务方面。基准测试表明它在保持视频结构和精细细节方面具有优势,尤其是在 TGVE+ 测试中。
Movie Gen 的未来发展包括提高场景理解能力、防止误用以及使系统更易于访问。Meta 设想将其应用于社交媒体、电影制作和营销活动。
评论