文本直接生成多视角3D图像，Meta推出创新模型

首页
活动
资讯
最新资讯文章专题 7x24快讯
报告
数据报告报告专题
付费专栏
短剧精选快问快答合集出海年鉴合集 iOS、GP上下架避坑指南
商务通
服务大厅企业会员
合作
人脉
出海人脉 VIP社群
出海数据库
出海企业库出海产品库月出海榜单海外产品榜单创投联盟
全球产品与增长展会
PAGC 2024 PAGC 2023 PAGC 2022 PAGC 2021

企业管理

扬帆创投微信小程序

更聚焦的出海投融资平台
精准高效领先的融资对接服务

微信扫一扫进入小程序

随着扩散模型的不断创新，文生图领域出现了Midjourney、Stable Diffusion、DALL-E 3等一系列知名产品。

随着扩散模型的不断创新，文生图领域出现了Midjourney、Stable Diffusion、DALL-E 3等一系列知名产品。

但在文本生成多视角3D图像方面一直存在诸多技术难点，Meta和德国慕尼黑工业大学的研究人员联合开发了创新模型——ViewDiff。

用户通过文本、图像或二者结合使用，就能生成高质量多视角3D图像，可帮助游戏开发、元宇宙等行业快速构建模型。

根据测试数据显示，ViewDiff生成的图像在一致性和视觉质量方面非常出色，并将FID、KID的数据，分别提升了30%和37%。

论文地址：https://arxiv.org/abs/2403.01807

项目地址：https://lukashoel.github.io/ViewDiff/

目前，文本生成一致性、多视角3D图像主要有三大难点：通常无法生成真实的背景环境，大多数只能在简单或纯色背景上渲染3D物体模型,缺乏与自然环境的融合；

生成图像的质量和多样性不理想，由于受限于训练数据的规模,一些方法只能产生质量有限、风格单一的输出；

缺乏多视角和一致性，大多数方法都是独立生成单一视角,无法确保同一物体在不同视角下的几何和外观的一致性,这极大限制了3D图像的实用性。

而ViewDiff使用了一种创新架构，先使用文生图模型作为先验知识和图像流生成器，然后通过显式的3D建模为图像赋予生成一致性、多视角3D图像的能力。

增强U-Net架构

为了使文生图模型能够有效捕获3D几何和全局风格,研究人员对原有U-Net架构进行了创新,添加了两种新的层:跨帧注意力层和投影层。

1）跨帧注意力层：主要替换了U-Net中的标准自注意力层。不同于只关注单个图像内部的特征,跨帧注意力层将每个图像的特征与其他所有图像的特征进行交互,实现了跨图像的风格匹配。

2）投影层：虽然跨帧注意力层能协调全局风格,但它无法显式地对3D几何知识进行建模。

因此,研究人员又开发了投影层,将多视图2D特征集成为一个显式的3D体素特征,再将其渲染回2D特征,保证了输出图像的3D几何一致性。

原U-Net架构在跨帧注意力层和投影层的增强下,使得ViewDiff能够在各个尺度上对2D特征进行3D感知建模,并实现多视图图像的风格协调,最终生成一致性、高质量的3D图像。

自回归生成

为了在任意视角上生成更多的3D一致性图像，ViewDiff开发了自回归生成模块，将允许从已生成的图像继续生成更多的图像，以呈现不同的视角。

首先，给定一个初始图像，可以是输入的多视角生成的图像中的任意一个。这个初始图像将作为生成过程的起点。

然后初始图像通过编码器网络，提取出特征表示。编码器网络通常由卷积层和池化层组成，用于逐渐减小特征图的尺寸和提取高级语义特征。

接着编码器的特征表示被送入解码器网络，解码器网络的结构与编码器相反。解码器逐渐增加特征图的尺寸，并通过反卷积等操作生成更高分辨率的图像。

解码器的每个步骤都会生成一个新的图像，并将其与之前生成的图像进行叠加，形成一个新的输入。

这个新的输入将作为下一个步骤的输入，以生成下一个新的图像。通过不断迭代生成新的图像，使得ViewDiff能够在任意视角上生成更多的3D一致性图像。

原文链接：点击前往 >

文章作者：AIGC开放社区

版权申明：文章来源于AIGC开放社区。该文观点仅代表作者本人，扬帆出海平台仅提供信息存储空间服务，不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任，如若转载请联系原文作者。更多资讯关注扬帆出海官网：https://www.yfchuhai.com/

{{likeNum}}

好文章，需要你的鼓励

相关阅读

热门活动

更多

线上分享会《小众玩法，开拓差异化出海新钱景》——Global Day出海趋势观察系列活动·01期

PAGC 2025|全球产品与增长展会合作席位预定

广东省 · 广州市

文章热榜

更多

一周要闻NO.128丨《黑神话：悟空》获年度最佳动作游戏；英伟达涉嫌违反反垄断法被立案调查；TikTok杀向欧洲

微软、IDC联合发布：企业级生成式AI，5大应用趋势

2024-12-25 11:12

网易关闭樱花工作室官网，工作室已传闻解散

2024-12-27 11:12

不到1年做出两款出圈AI小游戏，这个小团队就想做“一波流”？

2024-12-30 11:12

2024年，跨境“内容电商”之年

2024-12-31 12:12

热门报告

更多

《2024全球化新品牌洞察报告》

《2024年微信小游戏买量获客报告》

请前往扬帆出海小程序完成个人认证

认证通过后即可申请入驻

扫码添加小助手

微信扫描二维码，添加小助手
微信号：yfch24

扫码添加小助手

微信扫描二维码，添加小助手
微信号：yfch24

APP
小程序

微信公众号

微信小程序

扬帆出海APP

扬帆出海APP

微信
公众号

微信公众号

关注扬帆出海

专注服务互联网出海！

出海人
社群

微信公众号

扫码进群

与10万+出海人同行！