Sora到底懂不懂物理世界? Sora开启更多可能

2024-02-20

OpenAI的视频生成模型Sora持续引发关注,而围绕Sora到底懂不懂物理世界?这个讨论越发火热,甚至是在讨论Sora 到底是不是物理引擎甚至世界模型?,当然Sora 目前看起来似乎还微有瑕疵,但是视频效果已经足以震撼人心,而且OpenAI自己也认为确实还是有很多问题,比如Sora可能会混淆左右,比如Sora难以准确体现随时间推移而发生的事件,但是这些问题似乎都不会是Sora改进的阻碍。
业界当然还有多种声音,比如英伟达高级研究科学家Jim Fan 认为Sora 是一个数据驱动的物理引擎,是一个可学习的模拟器,或者可以说是一个世界模型。
还有图灵奖得主Yann LeCun则认为仅仅根据 prompt 生成逼真视频并不能代表一个模型理解了物理世界,生成视频的过程与基于世界模型的因果预测完全不同。
还有观点认为Sora可以说确实是已经嵌入了物理模型,但问题是这个物理模型是否已经就是准确的?逻辑能力依然不行。
不管大牛们怎么看,Sora的能力确实很强大,Sora 生成的视频能够展现出精细的场景,还有生动的角色表情和复杂的镜头动态。文本转视频模型似乎已经非常完美。
有网友评论称“首个大型视频生成模型”的名号肯定没跑了,期待国产大模型反超。
当然未来Sora落地应用,克服算力需求也是一大问题。
这一次Sora 让大家看到了AI的技术已经扩展到了视频领域;Sora的强大令人震惊,业界多认为Sora展示了人工智能在理解真实世界场景并与之互动的能力,这被认为是朝着实现通用人工智能的重要一步。未来Sora会将在更多领域得到推广应用。
尽管目前Sora尚未对外开放公测,也未提供内部测试的申请途径。还只是在内部测试,但是全球都充满了期待。

文章推荐

相关推荐