Google是如何把Pixel 5上的人像光效做出来的

相信很多朋友都遇到过以下问题,就是Google是如何把Pixel 5上的人像光效做出来的。。针对这个问题,今天小编就搜集了网上的相关信息,给大家做个Google是如何把Pixel 5上的人像光效做出来的。的解答。希望看完这个教程之后能够解决大家Google是如何把Pixel 5上的人像光效做出来的。的相关问题。

这一两年来,计算摄影这个词我们听到太多次了。

提到计算摄影,自然而然的就会让人想到 Google 的 Pxiel 系列手机,这个系列可以说是开创了计算摄影的先河,它为我们揭示了计算摄影的威力和魅力所在。

也正是因为计算摄影带来的威力如此惊人,这两年逐渐回过味的手机厂商们才终于一股脑扎了进去。而 Google 这时候已经在玩更多的花活了。

‘人像光效’的最初是随着今年十月份 Google 发布 Pixel 4a&Pixel 5 上,这一代 Pixel 独占的功能。但是在前几天,Google 对相机和相册应用进行了一次更新,将这个功能下放给了 Pixel 2 之后的用户。

受到肖像摄影师使用的摄影灯启发,‘人像光效’能够对光源进行重新定位和建模,然后将新的光源添加到照片的场景中去。并且还能够识别初始照明的方向和强度,然后对照明情况自动进行补充。

这样强悍的计算摄影功能自然离不开神经网络的机器学习能力,通过手机人像光效模式所拍摄的照片作为数据库进行训练之后,‘人像光效’的后期能力启用了两种新的算法:

首先说第一个问题,就是确定光源位置和添加。在现实中,摄影师通常采用经验和感性的方式,通过观察光线落在被拍摄者脸上的强度和位置,然后去确定如何去打光。但是对于 AI 来说,如何确定已有光源的方向位置是并不容易。

为此,Google 采用了一种全新的机器训练模型——全方向照明轮廓。这种全新的照明计算模型可以将人脸当做光线探测器,从而推断出来自所有照射的光源方向、相对强度和颜色,而且还能通过另一种面部算法来估计照片中头部的姿势。

虽然听起来很高大上,但是实际训练模型的呈现效果还是挺可爱的,它会把人的脑袋看做三个圆圆的银色球形物体,顶部的球‘质地’是最粗糙的,用来模拟光线的漫反射。中间的球也是磨砂的,它用来模拟较为聚集的光源。而最底下的球则是镜面‘材质’,用来模拟较为光滑的镜面反光。

另外每个球体都能根据自身发的特点反映环境照明的颜色,强度和方向性。

这样,Google 就能得到后期合成光源的方向应该在哪里,比如经典的人像光源是位于视线上方 30°,与摄像机轴成 30° 至 60° 之间,Google 也遵循了这一经典规则。

在学会了给人像添加光源的方向之后,那接下来要做的就是如何让添加的光源变得更加自然。

前一个问题有点像‘独孤九剑’的剑谱,学会了之后就会做固定的一些题目了。而解决后一个问题则需要让‘独孤九剑’尽可能多的实战,将不同的实际情况融会贯通,再学会破解世间万般武学。

为了解决这个问题,Google 又研发了另一个新的训练模型,用来确定自定向光源添加到原始的照片中。正常情况下是无法用已有的数据训练这个模型的,因为无法面对近乎无穷的光线照射情况,并且还要与人脸完美的匹配起来。

为此 Google 打造了一个很特殊的用于训练机器学习的装置——一个球形的‘笼子’。在这个装置里面具有 64 个具有不同视角的摄像机和 331 个可单独编程的 LED 光源。

如果你去过杜比影院,在杜比影院的映前秀中有一个环节是声音在一个半球型的穹顶中移动来模拟真实中近乎无限的方向。Google 这个装置其实也是类似的原理。

通过不停地改变照射的方向和强度并模拟复杂的光源,然后可以得到人的头发、皮肤、衣服反射光的数据,从而获得在复杂光源下的照明应该是怎样的。

Google 一共请了 70 位不同的人,用不同的脸型、发型、肤色、衣服、配件等特质训练这个模型。这样确保能够最大限度让合成的光源与现实相匹配。

此外,Google 并非直接通过神经网络模输出最后的图像,而是让神经网络模型输出一个较低分辨率的商图像。

这里解释一下什么是商图像,一张图片我们可以分解为两层:底层和细节层。底层包含图像的低频信息,反映了图像在大尺度上的强度变化;细节层包含图像的高频信息,反映了图像在小尺度上的细节。底层乘以细节层即为源图像,而细节层则又可以称为商图像。

然后通过原始图像的底层,采样时输入商图像的数据添加额外的光源,就能得到一个最终输出的图像。

最后的流程就是这样,先给定一张图片,然后计算图片中人物的表面法线,紧接着计算图片中的可见光源,通过神经网络模型模拟额外光源输出较低分辨率的商图像,然后作为细节层与原始照片底层相乘计算,最终得到一张添加了额外光源的人像照片。

Google 还对管线进行了大量的优化,让模拟的光效能够在手机上实时交互,而整个模型的大小却仅有 10MB 左右。

Pixel 5 的人像光效可以说是 Google 计算摄影中的一个典型案例,通过不断训练神经网络模型让手机得以模拟现实中的人像打光。完成了计算摄影一次新应用场景。

有些人说摄影本是门艺术,计算摄影在根本上是对摄影的侮辱,但自从 1839 年法国人达盖尔做出了第一台具备实用性的相机以来,一百多年来相机一直在由小众走向大众,直到手机摄像头的诞生,让每个人都有了近乎平等的拍照机会。而人们的内心的表达也让摄影这门艺术得以逐渐丰富起来。

没错,计算摄影在‘摄影’的同时也在‘算影’,但算法早已是手机摄影中不可分割的一部分,所追求的仍然是模拟现实中所能实现的效果,毕竟没人会把‘魔法换天’叫做计算摄影吧。

而当苹果和 Google 在计算摄影上走的越来越远时,我们才发现,算法其实是比硬件更强的壁垒。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


我们在使用网页进行一些文件的查找的时候都会遇到需要翻译的情况,这个时候为了方便我们就可以使用一个沙拉查词这个插件来帮助你进行页面的翻译和阅读,如果在使用的时候遇到了下面的问题,可以直接点击对应的问题来查看各种问题的使用教程和方法
imageusb是一款十分好用的u盘读取软件,我们可以在软件中进行使用,下面我们一起来看一下imageusb的具体使用方法吧,还是十分简单的。
这款插件就可以很好地帮助用户查看Axure R原型hTML的Chr ome扩展程序,如果你没有这个插件的话,可以选择下载安装一个Axure RPExtensi on插件,不知道怎么安装可以根据下文的方法来操作,十分简单
想必很多的用户都在使用Editplus这个软件吧,有部分的用户在保存文本之后,突然想起来自己没有区分大小写或者标点符号错误,但是不知道怎么批量替换,那就一起来文中看看替换的快捷键是哪个吧。
很多的用户应该都知道editplus和notepad这两个软件吧,这两个软件都是方便编程类的软件,于是就有用户想要了解一下这两个软件之间的区别,那就一起来看看内容吧。
5G通信技术大幅度提升网络的速度,在不同环境下都拥有极好的下载效果,而随着华为p60pro的消息透漏,支不支持5G也成为了用户们关注的重点,不过遗憾的是目前透漏的信息中没有表示会搭载5G技术。
很多的米粉都已经看到了自己手机即将迎来miui12,心里已经迫不及待的想要先体验内测版,但是不知道该怎么得到内测资格试题的答案,下面就给带来miui12稳定版内测答题答案大全。
xpath helper是一款非常好用的浏览器插件,我们可以在这里观看各种程序软件的代码,让我们从中学习到更多的知识,下面我们就一起来看一下软件是如何安装的吧。
沙拉查词可能是目前最好用的翻译工具了,有很多小伙伴还不知道其实沙拉查词在浏览器外也能够使用,今天小编为大家带来在浏览器外使用沙拉查词的方法。
沙拉查词作为一个非常权威的词典翻译软件,功能性非常强大,因此有很多用户想要在手机上使用,是翻译学习更加方便,那么沙拉查词有手机版吗?赶紧来看看吧。
由于跟多外语资料是以pdf格式传输的,因此有很多用户在安装完沙拉查词后不会使用它在pdf文件中查词,这时候只需要下载crx插件就能够解决这个问题了。
相比较于电脑上,手机上的沙拉查词由于更加方便携带,使学习翻译更加快捷,因此有很多用户想要在手机上安装沙拉查词,今天小编为大家带手机上安装沙拉查词方法。
用户们在浏览chrome浏览器的时候会不会遇到很多不方便的时候呢?这个时候有插件的话,会让你的体验得到极大地提升,小编也是为大家整理好了相关的插件crx离线包,下载即可使用哦。
在使用浏览器的时候,为了让浏览器功能更加强大,用户往往会选择安装插件,沙拉查词插件就是当中必不可少的存在,今天小编帮助大家安装沙拉查词插件。
xpath helper是一款很好用的网页插件,我们可以在这里进行查看网页的代码,只需要按下shift键,然后位移到想要查看的数据旁边,就可以看到代码了,下面一起来看一下吧。
沙拉查词自带的划词翻译功能非常好用,但有很多用户在使用时发现有情况下没有翻译弹窗,非常影响使用体验,今天小编帮助大家解决这个问题。
最近有很多小伙伴们在使用deepl翻译以后发现翻译后的文档变成了加密的,但是却又不知道如何解开,其实这个问题想要解决十分的简单,我们只需要按照固定的步骤来即可。
Fatkun图片批量下载插件是一款很好用的图片下载插件,我们需要在谷歌浏览器中进行下载添加,当然也是可以直接在本站进行下载的,下面一起来看一下吧。
Fatkun图片是一款十分好用的插件,我们可以使用这款软件进行各种各样的图片下载,只需要选择自己喜欢的图片,然后在使用插件即可完成,还是十分简单的。
翻译是一个不论什么时候都不会无用的东西,因为我们不管是在交流还是在上网都会碰到一些中文以外的语言这个时候翻译就十分的有作用了,很多小伙伴们在使用deepl时不知道如何进入网页版其实很简单。