行业报告详情 - 行业报告数据库

行业分类

找到报告 1 篇当前为第 1 页共 1 页

Transformer扩展优势凸显，视频理解与生成能力提升

加工时间：2024-03-08 信息来源：EMIS

关键词：Sora；视频模型；扩散模型
摘要：

2024年2月16日，OpenAI发布文生视频模型——Sora及其技术报告《Video generation models as world simulators》。从Sora模型看文生视频的技术路径：技术路径尚未收敛，Transformer扩展特性优势凸显。市场大多认为扩散模型是图像和视频生成领域的主流路径，但没有重视Transformer架构scale up的能力。OpenAI技术报告指出，Sora是基于扩散模型，但更强调，Sora是一个基于Transformer架构的扩散模型，其优秀的生成能力离不开Transformer架构优秀的scaling特性。当前，为构建性能更优、效率更高的视频生成模型，已出现多种结合Diffusion Model和Transformer架构的构建方式。

目录：

行业分类

友情链接

联系我们

QQ咨询

电话咨询

微信公众号

感谢访问