关键词:扩散模型;食谱;图像生成
摘 要:食物图像生成主要研究从一组特定的配料中生成膳食图像,该任务属于文本到图像任务的范畴。但由于与膳食图像相关的因素较复杂,生成逼真食品图像的类似工作迄今未能完全实现。现有的方法基于配料和烹饪信息利用生成对抗网络逐步产生高质量的样本,但不能覆盖整个分布,因此很难达到条件生成高质量图像的目的。扩散模型是一类基于似然性的模型,最近已被证明可以产生高质量的图像,同时提供理想的特性,如分布覆盖、固定训练目标和易于扩展。通过跨模态信息关联并引导扩散模型根据类别信息生成高质量食物图片。在Recipe1M数据集上的结果表明,模型性能比基线方法有显著的提升。
内 容:原文可通过湖北省科技资源共享服务平台(https://www.hbsts.org.cn/)获取