手机芯片制造商高通的产品管理总监加里·布洛特曼(Gary Brotman)是机器学习平台的负责人,他说:“要正确实现VR,所有东西都必须是完全实时的。你必须要能够呈现视频和音频,拥有支持眼动跟踪、头部跟踪、手势跟踪以及空间音频跟踪(以便把房间的声学效果映射到虚拟体验中)的人工智能。”
AI也将为用户提供一些非常方便的功能。里佐利说,以后的虚拟助理可能会使用手机摄像头来识别你所在的位置,比如具体是在哪条街道,哪个餐馆,并调出相关的应用。
而且这些方便的功能可能不会再有延迟。如果未来的AI并不需要云计算,那么云计算就不需要掌握你的个人信息。
“在手机上进行分析和人工智能处理有很多好处,比如保护隐私,消除延迟等等。”布洛特曼说。
是什么把AI的力量赋予了手机?是电子游戏。
“人们希望在手机或者平板电脑上玩更好的游戏,”里佐利说。 “因此,苹果变得特别擅长于提供更好的性能,高通和其他芯片厂商也是如此。”这推动了移动CPU和GPU的发展。
虽然大部分的CPU都是顺序执行任务的,GPU却可以并行执行简单但数量庞大的任务,这是快速渲染3D图形所必需的。另外,AI也需要硬件可以连着执行多个简单任务。
就拿“卷积神经网络”(当前主流图像识别技术)举例来说吧,它仿照大脑视觉皮层的工作原理,把视野划分成一个个重叠的小块,然后以一层连一层地过滤简单的细节,比如这些小块的边缘。
这些信息被传输到另一层神经元(对人类来说生物性的,对软件来说是虚拟的),它可能会把边缘合并成一条条线;另一层神经元可能会识别出原始形状。
每一层(可能有几十层)都会进一步细化对图像的感知。“你在看一张照片的时候,你会在同一时间识别出它的各种元素,”里佐利说。 “你识别出边缘,识别出形状。这一切都可以并行进行。”
━━━━━
对硬件的需求
━━━━━
早在几年前,智能手机的芯片已经准备好了迎接这种挑战。在升级iOS 10之后,即使是2013推出的iPhone 5s也足以支持新的人脸识别、场景识别,以及对象识别。
Aipoly正在制作可以在iPhone 5上,以及可以在上市已经好几年的Android手机上运行的版本。但是程序员最近才刚刚开始利用这种能力。今年6月份推出的照片特效应用Prisma就是其中的佼佼者。
这个应用是25岁的阿列克谢·莫伊申科夫(Aleksey Moiseenkov)开发的。
Prisma用户可以把智能手机上的照片用30多种艺术风格进行加工,比如“呐喊”、“蒙德里安”风格等等。加工后的效果呈现马上就可以呈现出来,用户完全不会注意到背后的计算有多么复杂。
Instagram上的那种滤镜提供的是简单的调整,比如颜色、对比度、亮度或白平衡等等基本参数的调整。但Prisma需要分析图像,识别出相似的形状、线条、色彩和阴影等等元素,然后以蒙克(Edvard Munch)或蒙德里安(Piet Mondrian)的风格进行重新绘制。即便是平淡无奇的照片,经Prisma加工之后也可以呈现出惊艳的效果。