为什么手机能认出戴口罩的你

相信很多朋友都遇到过以下问题,就是为什么手机能认出戴口罩的你。。针对这个问题,今天小编就搜集了网上的相关信息,给大家做个为什么手机能认出戴口罩的你。的解答。希望看完这个教程之后能够解决大家为什么手机能认出戴口罩的你。的相关问题。

疫情的到来,让人脸解锁功能低下了高贵的头颅。

当口罩成为我们出街必备的单品,在解锁手机时,我们总要经历‘人脸识别失败’—‘输入密码’的繁琐过程。这不由得让人怀念起指纹识别的好。

为了优化人脸解锁的体验,今年早些时候国外创业者 Danielle Baskin 推出了一款带有面部信息的口罩。该产品通过提取用户的面部信息,然后印在口罩外侧,用户戴上口罩后就可以拼凑成完整的脸部。

▲ 实际上有点惊悚。 图片来自:djbaskin

不过这个产品的解锁成功率尚不明确,并且没有大量的样本验证。那么如何让人脸识别系统,不再被口罩困扰呢?

一些网友渐渐发现,随着戴口罩的时间越来越久,手机似乎在一次次人脸解锁失败中找到了‘经验’,逐渐能够识别成功戴着口罩的自己。

靠着这个思路,一些科技博主也分享了更高效的教程,比如戴着口罩反复解锁,人脸识别不成功就立即输入密码,循环这个动作 30 分钟左右,手机便能识别出戴着口罩的自己了。

▲ 戴口罩成功人脸解锁。 图片来自:Farhad Usmanoff

不过在实践的过程中,网友们表示不同机型的‘学习’速度不一。有人将上述动作重复了 20 分钟便已成功,但有的人重复了上千次,手机仍然无法识别戴着口罩的自己。

为什么会出现这种情况呢?其实答案关乎手机的 AI 学习能力。

▲  图片来自:thenextweb

深度学习利器——NPU

如果你有请关注近两年的手机发布会,你一定发现了手机厂商们在介绍 SoC 芯片时,都会重点提到 NPU 的升级。

所谓 NPU,就是指神经网络处理器。在一个手机芯片中,一般会分为几个功能区,发布会常提的有三个:一是擅长处理繁复任务和发号指令的 CPU,二是擅长图形处理的 GPU,再者就是擅长处理人工智能任务的 NPU。

虽然 NPU‘占地’没有 CPU 和 GPU 大,但其能力却不容忽视,一台手机的智慧程度,主要依赖它。

▲ 拥有 NPU 的芯片往往被称作‘AI 芯片’、‘仿生芯片’图片来自:泪雪网

上文提到的训练手机识别戴口罩的自己,便主要归功于 NPU 的能力。摄像头捕捉到人脸画面后,CPU 和 GPU 会在极短的时间内对图片进行预处理,然后 NPU、GPU 来检测、提取特征,最后 CPU、GPU 和 NPU 共同完成人脸的识别和分类。

得益于日益强大的算力,整个过程已经能够做到‘无感’的程度。在我们拿起手机的一瞬间,上述流程便已处理完毕。

而 NPU 的加入,让手机可以认识不同状态的你。早上刚醒时,即便面部浮肿,手机也知道这就是你。甚至被马蜂蛰了,嘴巴肿成‘香肠’,手机依然能够识别出来。

▲ 图片来自:韩船长漂流记

所以经过一定量的训练后,手机便可以‘无惧口罩’并认出你了。

实际上,如果只依靠算法,CPU 和 GPU 也可以配合完成学习。但缺点是效率低,且功耗大。据《汽车电子与软件》介绍,CPU 和 GPU 需要用到数千条指令完成的神经元处理,NPU 只需要一条或几条就能完成。

▲ NPU 的学习效率颇高。 图片来自:androidauthority

另外在同等功耗下,NPU 的性能是 GPU 的 18 倍。可以看出 NPU 在深度学习的处理效率方面优势明显。

说到这不得不提一下 NPU 的工作原理。之所以 NPU 的学习效率高,不是因为它喝了‘六个核桃’,而是它在电路层模拟人类神经元和突触。并且用深度学习指令集,直接处理大规模的神经元和突触。通过突出权重实现储存和计算一体化,NPU 的一条指令,便能胜任以往 CPU 和 GPU 的上千条指令。

▲  图片来自:forbes

打个不那么恰当的比喻,这就像京东物流实现的仓储、物流一体化一样,极大地提高了送货效率,当天买甚至当天就能送到。

NPU 并不鸡肋

国内最早研究 NPU 的企业当属寒武纪。2017 年发布的麒麟 970 芯片,就曾采用寒武纪的 NPU 架构。麒麟 970 也成为世界首款移动端 AI 芯片。

据华为介绍,集成 NPU 单元的麒麟 970,相较于四个 Cortex-A73 核心,在处理同样的 AI 应用任务时,拥有大约 50 倍能效和 25 倍性能优势。例如在图像识别速度上,可达到约 2000 张/分钟,远高于业界同期水平。

▲麒麟 970。 图片来自:电子工程专辑

11 天后,iPhone 8/8 Plus、iPhone X 携带着 A11 仿生芯片面世,苹果在发布会上表示这是其有史以来最强大、最智能的芯片。

A11 Bionic 是苹果首款以‘仿生’命名的处理器,也是苹果第一款支持 AI 加速的处理器。比如在人脸识别的功能上,其神经网络引擎,让 A11 支持速度高达每秒 6000 亿次运算识别。

▲ 图片来自:stealthsettings

也是从这一年开始,越来越多的厂商开始重视手机 AI 能力的宣传。比如华为主打的 AI 摄影、超级夜景、隔空手势等功能;iPhone 引以为傲的 Face ID、人像虚化、Deep Fusion(深度融合)等功能,都紧紧依赖着 NPU 的能力。

▲ 华为 AI 手势操控

自 2019 年 6 月开始,随着麒麟 810 的发布,华为开始使用自研达芬奇架构的手机 AI 芯片。达芬奇架构的巧妙之处在于各单元分工清晰,可以实现更高效的 AI 计算。

据《电子产品世界》介绍,达芬奇架构核心的 3D Cube、Vector 向量计算单元、Scalar 标量计算单元等,都各自负责不同的运算任务实现并行化计算模型,共同保障 AI 计算的高效处理。实现高算力、高能效、灵活可裁剪的特性。

在刚结束不久的 Mate 40 系列发布会上,华为强调麒麟 9000 芯片的 NPU 升级到达芬奇架构 2.0 版本,算力翻番。AI 计算能力更强的同时,能效提升了 15%,网络运行性能也提升了 20%。

苏黎世联邦理工学院推出的 AI Benchmark 榜单中,麒麟 9000 摘得安卓阵营的桂冠,分数是高通骁龙 865+的两倍多。

▲AI Benchmark 榜单

还记得上文提到的麒麟 970 每分钟可识别 2000 张图像的能力吗?麒麟 9000 已经进化到 2000 张/秒的速度。另外,发布会重点展示的 AI 隔空手势、AI 灵动熄屏、AI 字幕等,也都是其 NPU 能力的显现。

让我印象尤为深刻的是‘智感支付’功能,当手机感知到靠近扫码盒时,便会自动弹出付款码页面,一气呵成完成支付。这代表着理想的智能终端的方向:向‘知你’、‘懂你’、‘帮你’的方向迈进。

▲华为智感支付。 图片来自:VDGER

而第四代 iPad Air 在发布之时,苹果也着重强调了其 NPU 能力的精进。相比 A12 仿生处理器,A14 仿生新一代神经网络引擎让机器学习性能快达两倍。

超高的机器学习速度,让 A14 仿生芯片可以实现超级像素功能,搭配 pixelmator 使用,放大裁切后的照片,像素会自动增补,让照片更清晰。

反映到 iPhone 12 系列上,计算摄影能力也得到了空前改进。举个小例子,在延时摄影时,手机会自动计算被摄物体,如果是在拍车流,那么手机便会自动降低快门速度,让车灯呈现拖影的感觉,画面流动感更强。

新一代的 iPhone 在 Deep Fusion、HDR 视频等方面,与 iPhone 11 相比都有着肉眼可见的变化。这都得益于 A14 强大的 AI 计算能力。

我们可以对 NPU 期待什么?

虽然移动端 NPU 在近两、三年才开始被厂商宣传,实际上和它相关的概念在 2013 年就已出现。

当时,高通希望通过一种模仿人脑的计算结构,缩小普通机器运算与人脑之间的差距,这种通过模拟神经元的运算处理器,被高通称之为‘Zeroth’。

▲ 高通对 Zeroth 的介绍

高通的 Zeroth 芯片,运算结构模仿了人类生物神经细胞的运作模式,是从大脑结构层面模仿的。而 NPU 则是在大脑功能层面模仿的,两者的方向并不一致。而高通也一直坚持了自己的方向,没有加入独立 NPU 的大军,而是坚持着人工智能引擎 AI Engine 的方向。

据‘芯智讯’报道,在高通骁龙 845 发布之时,一些外界声音批评高通没有顺应 NPU 的趋势,以至于在 AI 能力上落后。而高通高级副总裁兼移动业务总经理 Alex Katouzian 回应称,高通虽然没有独立的神经网络引擎单元,但是采用了更为弹性的机器学习架构(AI Engine),在通用平台内做内核优化,分布在 CPU、GPU、DSP 等每个单元上,从而可以针对不同移动终端提供弹性调用各个处理单元。

你可以这样理解:NPU 的方向是分工明确,每个单元的集约化程度较高;而高通 AI Engine 的方向是‘有活大家一起干’。

直到采用第五代多核人工智能引擎 AI Engine 的骁龙 865 系芯片发布时,高通依旧没有踏入 NPU 的道路。

▲ 高通在图片的左下方强调了 AI 能力

不过实际使用中,高通骁龙 865 的学习能力依然值得肯定。比如我在近半个月使用搭载高通骁龙 865+的 vivo X50 Pro+时,每天解锁十次左右,它现在已经能成功识别出戴口罩的我了。

但从数据上看,其 AI 学习能力,已落后麒麟 9000 和 A14 仿生不少。NPU 一次次用数据证明了自己的 AI 实力,高通下一代 AI Engine 能否力挽狂澜,我们还需等待 875 系列芯片的面世才能知道。

人工智能时代,我希望看到的场景是,手机不再是被动响应用户需求的终端,而是能够主动分析、感知用户当下的需求,并可以预先提供相关服务的智慧终端。

▲ Mate40 系列 AI 能力展示

在这方面,各家厂商还都处在起步阶段。比如在应用建议上,目前做的最好的个人认为是小米。通过时间和场景等因素的分析,每次它都能‘猜到’我想打开的软件,并智能排序在最显眼的位置。而 Mate40 系列支持的‘智感支付’更无疑在 AI 道路上走在了前列,也给了我们更多的想象空间。

值得注意的是,除了手机,NPU 也逐渐应用到平板电脑、笔记本电脑等移动端上。苹果近日发布的 M1 芯片,就拥有 16 核的 NPU,每秒可以执行 11 万亿次运算,将机器学习的速度提升至 11 倍,这是传统 PC 难以企及和比拟的。

而搭载 M1 芯片的 MacBook 系列、Mac mini 将带来哪些使用体验上的变化,相信令人期待。

在当前的软件生态下,移动端 CPU 和 GPU 的提升,对于用户日常使用来说已经感知不强了。比如一台 iPhone XS 和一台 iPhone 12 相比,在应用的流畅性上几近一致。更加影响用户体验的,是机器学习能力的变化。这也是为什么我们要请关注 NPU 的发展。

或许再过十年,当 AI 技术发展地更为成熟,‘智能’手机是时候改名为‘智慧’手机了。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


我们在使用网页进行一些文件的查找的时候都会遇到需要翻译的情况,这个时候为了方便我们就可以使用一个沙拉查词这个插件来帮助你进行页面的翻译和阅读,如果在使用的时候遇到了下面的问题,可以直接点击对应的问题来查看各种问题的使用教程和方法
imageusb是一款十分好用的u盘读取软件,我们可以在软件中进行使用,下面我们一起来看一下imageusb的具体使用方法吧,还是十分简单的。
这款插件就可以很好地帮助用户查看Axure R原型hTML的Chr ome扩展程序,如果你没有这个插件的话,可以选择下载安装一个Axure RPExtensi on插件,不知道怎么安装可以根据下文的方法来操作,十分简单
想必很多的用户都在使用Editplus这个软件吧,有部分的用户在保存文本之后,突然想起来自己没有区分大小写或者标点符号错误,但是不知道怎么批量替换,那就一起来文中看看替换的快捷键是哪个吧。
很多的用户应该都知道editplus和notepad这两个软件吧,这两个软件都是方便编程类的软件,于是就有用户想要了解一下这两个软件之间的区别,那就一起来看看内容吧。
5G通信技术大幅度提升网络的速度,在不同环境下都拥有极好的下载效果,而随着华为p60pro的消息透漏,支不支持5G也成为了用户们关注的重点,不过遗憾的是目前透漏的信息中没有表示会搭载5G技术。
很多的米粉都已经看到了自己手机即将迎来miui12,心里已经迫不及待的想要先体验内测版,但是不知道该怎么得到内测资格试题的答案,下面就给带来miui12稳定版内测答题答案大全。
xpath helper是一款非常好用的浏览器插件,我们可以在这里观看各种程序软件的代码,让我们从中学习到更多的知识,下面我们就一起来看一下软件是如何安装的吧。
沙拉查词可能是目前最好用的翻译工具了,有很多小伙伴还不知道其实沙拉查词在浏览器外也能够使用,今天小编为大家带来在浏览器外使用沙拉查词的方法。
沙拉查词作为一个非常权威的词典翻译软件,功能性非常强大,因此有很多用户想要在手机上使用,是翻译学习更加方便,那么沙拉查词有手机版吗?赶紧来看看吧。
由于跟多外语资料是以pdf格式传输的,因此有很多用户在安装完沙拉查词后不会使用它在pdf文件中查词,这时候只需要下载crx插件就能够解决这个问题了。
相比较于电脑上,手机上的沙拉查词由于更加方便携带,使学习翻译更加快捷,因此有很多用户想要在手机上安装沙拉查词,今天小编为大家带手机上安装沙拉查词方法。
用户们在浏览chrome浏览器的时候会不会遇到很多不方便的时候呢?这个时候有插件的话,会让你的体验得到极大地提升,小编也是为大家整理好了相关的插件crx离线包,下载即可使用哦。
在使用浏览器的时候,为了让浏览器功能更加强大,用户往往会选择安装插件,沙拉查词插件就是当中必不可少的存在,今天小编帮助大家安装沙拉查词插件。
xpath helper是一款很好用的网页插件,我们可以在这里进行查看网页的代码,只需要按下shift键,然后位移到想要查看的数据旁边,就可以看到代码了,下面一起来看一下吧。
沙拉查词自带的划词翻译功能非常好用,但有很多用户在使用时发现有情况下没有翻译弹窗,非常影响使用体验,今天小编帮助大家解决这个问题。
最近有很多小伙伴们在使用deepl翻译以后发现翻译后的文档变成了加密的,但是却又不知道如何解开,其实这个问题想要解决十分的简单,我们只需要按照固定的步骤来即可。
Fatkun图片批量下载插件是一款很好用的图片下载插件,我们需要在谷歌浏览器中进行下载添加,当然也是可以直接在本站进行下载的,下面一起来看一下吧。
Fatkun图片是一款十分好用的插件,我们可以使用这款软件进行各种各样的图片下载,只需要选择自己喜欢的图片,然后在使用插件即可完成,还是十分简单的。
翻译是一个不论什么时候都不会无用的东西,因为我们不管是在交流还是在上网都会碰到一些中文以外的语言这个时候翻译就十分的有作用了,很多小伙伴们在使用deepl时不知道如何进入网页版其实很简单。