官方微信
手机客户端
设为首页
收藏本站
扫一扫,关注我们
QQ登录
微信登录
登录
注册
我的空间
我的消息
我的积分
我的收藏
我的好友
我的相册
我的道具
帐号设置
退出登录
免费发布信息
首页
Portal
新闻资讯
论坛
BBS
城事杂谈
求职招聘
房屋出租
织里跳蚤
房产资讯
关于我们
导读
首页
房产
装修
亲子
婚嫁
美食
汽车
旅游
娱乐
信息
求职
租房
二手房
招聘
拼车
二手车
服务
生活服务
城事杂谈
跳蚤市场
便民服务
社区
城事杂谈
情感天空
户外旅游
房产楼市
装修装饰
美食天地
当前位置:
»
论坛
›
城市生活
›
织里跳蚤
›
帖子
@所有织里人,这份国庆假期安全提
节前这场新闻发布会聚焦治安与共富
师傅,不好了!“二师兄”掉在高速
[ 理财 ]
老渔民吃海螺吃出直径5毫米珠子
[ 汽车天地 ]
70万的雷克萨斯质量堪忧?3点实证揭秘,
[ 电脑维修 ]
既然蜇人后一定会死掉,为什么蜜蜂还要进
[ 理财 ]
证监会发布8项金融行业标准
[ 电脑维修 ]
我们为何会死:抗衰新科学和永生之路
返回列表
发帖
回复
发表帖子
查看:
704
|
回复:
0
古典人像秒变3D,视角还能随意切,华为&上交联手出品
[复制链接]
崖余
崖余
当前离线
积分
1415
关注TA
发消息
发表于 2021-10-31 11:22:40
|
来自:中国
|
显示全部楼层
|
阅读模式
如果让GAN天生的传神人像酿成3D版,会怎样?
仿佛有摄像机对着人像直拍,正面、侧面、瞻仰、俯视差别角度都能显现。
真的有种人要从画中走出来那味儿了。
而且,这些效果都是由静态单视角图片天生的!
甚至能让卡通人像立体起来。
这就是上海交通大学和华为的最新研究:
CIPS-3D
。
它是一种基于GAN的3D感知天生器,只用原始单视角图像,无需任何上采样,就能天生分辨率256×256的清晰图像。
并且创下3D感知图像合成的新记录,FID仅为6.97。
现在,这个项目在GitHub上已有200+星,作者已将源代码开源,训练配置文件将在后续发布。
搞定镜像对称
在高清人脸数据集FFHQ上,CIPS-3D的表现可以说非常nice,连古典画都能酿创建体版。
当然也能搞定差别动物的face。
看到图像从2D直接酿成3D,可能有人已经想到了谷歌台甫鼎鼎的NeRF。
它只必要输入少量静态图片,就能做到多视角的传神3D效果。
而这次的CIPS-3D,也是基于NeRF开辟。
它主要用到了两个网络:NeRF和INR(隐式神经表示法,Implicit Neural Representations)。
浅层是
NeRF
,它主要负责把人像从2D变为3D。
它将场景的体积表示优化为向量函数,输入为3D位置坐标和视图方向。
具体而言,就是沿相机射线采样信息,来合成图像。
然后,将如许的场景表示参数化为一个
完全毗连深度网络
(MLP),输出对应的颜色和体积密度值。
为了得到更为准确的3D图像,每每必要对每条光线上多点采样,这也就造成NeRF所需的内存非常大。
因此,如果神经网络中只用NeRF,就会限制网络的深度,导致天生图像模糊、缺乏细节。
△第一列为NeRF天生,第二列为INR天生
所以在CIFS-3D中,研究职员将深层网络设置为
INR
,让它负责合成高保真的图像。
这种方法也能将各种信号参数化,输出RGB值。
而且由于不再与空间分辨率耦合,它可以对任意空间分辨率进行采样。
论文中也提到,该方法也没有任何上采样。
但是受限于CPU内存,如果直接训练高分辨率图像会有肯定难度,为此研究职员提出了一种部分梯度反向传播的方法。
在训练时,该方法仅对随机采样中的绿色光线进行
梯度反向传播计算
,别的光线则不计算。
解决了3D化题目,还能保证高保真,你以为这就结束了?
NO、NO、NO
在研究过程中,工作职员发现CIPS-3D还存在
镜像对称
题目。
这种征象实在在很多3D GAN中都存在,比如GIRAFFE、StyleNeRF。
比如在下面这个案例中,初始单角度图像的刘海是偏左的,但是天生的差别角度图像中,刘海会随着视角的变革而变革,就像是镜像一样。
出现如许的题目,是因为NeRF网络输入的坐标就有存在镜像对称。
比如图中a、c两点的坐标就是完全镜像对称的关系。
这对于天生完全对称的物体而言没什么题目。
但是放在只给侧面角度的人像上来说,可能就是一场灾难。
为此,研究职员在神经网络中添加了一个
辨别器
(discriminator),让它来辅助辨别这种题目。
末了结果表明,与其他可天生3D人像的方法相比,FID、KID值显着降低,这两个值越低意味着天生图像质量越好。
团队先容
值得一提的是,该论文通讯作者为
田奇
。
2010-2015年于美国伊利诺伊大学香槟分校新加坡高等研究院担任研究科学家。
发表文章约550余篇,包罗250+ IEEE TPAMI、IJCV、CVPR/ICCV/ECCV、NeurIPS等国际顶级期刊和会议。
2018年到场华为云,研究主要方向为计算机视觉、自然语言处置惩罚和语音交互。
华为
谢凌曦
博士、上海交通大学
倪冰冰
教授也到场了此次研究。
谢凌曦,本科博士均毕业于清华大学计算机专业,专长计算机视觉、主动机器学习。目前为华为高级研究员。
倪冰冰,现为上海交通大学电子系特别研究员/长聘教轨副教授,博士生导师。
本科毕业于上海交通大学电子工程系,之后赴新加坡国立大学攻读博士。
博士期间,先后在微软亚洲研究院和谷歌公司美国总部工作,担任算法科学家。
2010-2015年于美国伊利诺伊大学香槟分校新加坡高等研究院担任研究科学家。
研究方向为计算机视觉、机器学习等。
本项研究已经由论文一作
Peng Zhou
(上海交通大学)上传至其GitHub主页,感爱好的童鞋可以前去围观~
论文地点:
https://arxiv.org/abs/2110.09788
GitHub地点:
https://github.com/PeterouZh/CIPS-3D
post_newreply
回复
使用道具
举报
返回列表
发帖
回复
发表回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点击附件文件名添加到帖子内容中
描述
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
精选推荐
@所有织里人,这份国庆假期安全
名单公布!
首个全国生态日主场活动在湖州举
2023绿色低碳创新大会在湖州举行
《焦点访谈》关注湖州!
市共同富裕领导小组召开第五次会
织里镇家园志愿广场本周活动预告
防诈骗小课堂,提高警惕!
7天1检!常态化核酸检测提醒!
友情链接
浙沪导航
网站目录
关闭
站长推荐
/1
关注织里资讯微信公众号
关注织里资讯微信公众号
查看 »
浙江网络警察报警平台
经营性网站备案信息
湖州市公安局网监备案
不良信息举报中心
联系客服
关注微信
下载APP
返回顶部
返回列表
点击联系客服
在线时间:8:30-17:00
客服电话
13362228119
电子邮件
511400718@qq.com
扫一扫,关注我们
下载APP客户端