欢迎访问行业研究报告数据库

行业分类

当前位置:首页 > 报告详细信息

找到报告 1 篇 当前为第 1 页 共 1

计算机行业:更多应用场景出现,中国公司得到更大机会-AIGC系列之五,跨模态

加工时间:2023-04-01 信息来源:EMIS 索取原文[19 页]
关键词:计算机行业;应用场景;AIGC;跨模态
摘 要:

“模态”是指数据的存在形式,比如文本、音频、图像、视频等文件格式。多模态是一种全 新的交互、生成模式,集合了图像、语音、文本等方式。我们认为,多模态/跨模态AI 大 模型将得到相比ChatGPT 等NLP 大模型更大的应用。


目 录:

1、文生图:最先成熟的跨模态应用 ........................................ 5

1.1 DALL-E:初代爆款文生图应用,贡献了CLIP 工具..............................5

1.2 从DALL-E 到Stable Diffusion:4 倍分辨率,背后是Diffusion ...7

2、CV 大模型:transformer 取代CNN,参数已到百亿级别8

2.1 CV+大模型的难度为何相比NLP 更高....................................................9

2.2 学界尝试将transformer 应用于CV 大模型 .........................................9

2.3 百亿参数级别的CV 大模型有“涌现”能力了吗?CV 大模型会大幅

提升标注数据需求吗?.................................................................................. 11

3、跨模态:更多应用可能性,中国AI 公司参与热情暴增.. 13

3.1 Google: 视觉语言模型大模型PaLM-E ........................................... 13

3.2 微软和OPEN AI:下一代GPT 可能也是多模态 ............................... 15

3.3 视觉/跨模态大模型是国内AI 公司更擅长的 ....................................... 16

4、推荐标的: ....................................................................... 18


© 2016 武汉世讯达文化传播有限责任公司 版权所有 技术支持:武汉中网维优
客服中心

QQ咨询


点击这里给我发消息 客服员


电话咨询


027-87841330


微信公众号




展开客服