智能语音:争夺人工智能皇冠上的“明珠”

2019-02-22 08:45 南方日报

打印 放大 缩小

吼一吼就可登App?近日,云知声声纹登录系统,成功率可达99%。与智能语音先行者科大讯飞相似,两家公司创始人师出同门。

除了专业的语音技术厂商,互联网科技巨头也纷纷涌入语音赛道中来。2月20日,在小米的新品发布上,小爱触屏音箱亮相,而在这两天前,腾讯也出面澄清,听听(音箱)一直在正常研发和销售运营,面向行业输出全栈语音人工智能解决方案能力。

智能语音被誉为人工智能皇冠上的“明珠”,近段时间以来热度不减,随着深度学习技术的突破,大数据技术以及自然语言理解能力的提升,带动了一波产业热潮,除了在教育、客服、电信等传统行业之外,还开辟出了车载、家居、医疗、智能硬件等语音技术应用新天地。

“听懂”人话,语音方案“百花齐放”

走进广州迅羽通信技术公司的客服中心,敲击键盘的声音不再此起彼伏,客服人员更多在倾听和安静地回复来电。

迅羽先后承运了香港快运、电讯盈科、和记电讯、东亚银行、亚航以及广东省12348司法、广东电力与国税热线等国内外超大型客服服务。一直以来,传统的客服呼叫中心是劳动密集型产业,由于内地人力成本优势,香港一些电信业、银行业、航空业等将呼叫中心外包,但随着人力成本的提升,呼叫中心的利润进一步被压缩。

从去年9月起,迅羽联合哈工大共同成立人工智能自动问答技术研发实验室,着手引入AI。经测算,有七成动作是可替代的——客服人员大部分时间都在文字录入和反复确认,而如今,每当客户一报完身份证号码、家庭地址等信息时,就已经自动录入系统,而客服人员则可专注听取客户的反馈。在台风等极端天气下,面对激增的订改机票业务也更从容,避免了人员配备过多。

机器能“听懂”人话,已经深入各种场景。科大讯飞与上海高院合作的刑事案件辅助办案系统投用后,目前已开始在全国范围内扩展,辅助办案系统有望在国内法院系统全面铺开,并向更多罪种、民商行政案件等方向延伸,截至今年初,审讯产品于法庭拓展迅速,已覆盖815个法院、4200个法庭。

陪你聊,陪你跳,会管家,会传情……深圳狗尾草智能科技公司不仅推出了呆萌又暖心的情感社交机器人,还打造出全球首个3D全息AI虚拟生命“琥珀”,在日趋白热化的语音市场中走出了一条差异化道路。

“帮我调下明天上午7点的闹钟。”语音识别距离大众并不遥远,在移动终端上,用户可以实现手机读短信、介绍餐厅、询问天气、语音设置闹钟等,智能音箱更被认为是控制智能家居的自然入口,从“百箱大战”到现在的语音方案“百花齐放”,互联网平台商、语音技术硬件服务商、内容和云服务商、芯片商等,都相继推出了各自支持设备智能化升级的方案。

不是替代人,而是更好发挥人的价值

通过人工智能语音交互,机器不仅能听懂人话,还能更好地发掘人的价值。

通过汇聚学生的家庭作业、课堂训练数据,科大讯飞用语音识别对内容进行语义理解分析,判断作业对错,提供改进方案。“人工智能+大数据结合因材施教,比如同一个班学生对内容接受度是不一样的,每个人的知识点情况掌握又是怎样的,单个学生上一个知识点有没有掌握,都可以有针对性地改进。”科大讯飞高级副总裁杜兰说。

杜兰说,AI赋能教育产业不是要取代老师这个职业,而是可替代批改等琐碎事务,解放老师更多时间。

迅羽副总经理黄勉超也同样认为,AI的出现,并不是要用机器人来取代人,而是与机器有更好分工,“有一半用户是带着情绪或投诉打进电话来,但如果他们面对的是一台毫无表情的机器,只会继续带着愤怒挂掉电话”。

黄勉超还发现,引入AI后,客服业务有了更多科技含量,品牌形象大为提升,公司在招人时也更有底气,“以前这行业的人会觉得,大好青春就在这1平米的格子间日复一日从事简单枯燥的事情,他们会觉得没有前途,而现在工作没有那么枯燥后,人员流动没有那么频繁,而且人员培训周期也大为缩短,新手很快就可以进入角色,在整个过程中,人的价值就发挥出来了”。

向B端发力,与产业结合构筑生态

尽管智能音箱大战火热,但不少人始终认为,目前AI产品尤其是语音产品还只是一种年轻人的科技玩具,实用性并不强。

狗尾草创始人、CEO邱楠对此表示,任何一个代表未来方向的科技类产品的流行,比如手机、电脑、智能手表等,一定是从年轻人开始。年轻人对AI有想象力,他们知道自己需要的场景是怎样的。尽管现有AI技术还不足够成熟,但这就和电脑早期发展一样,技术本身是需要时间去发展的。当年PC也同样是从最开始的性能不足到后面慢慢被消费者接受。

C端产品火过一阵后,越来越多的玩家开始深入B端,与行业相结合。黄勉超说,C端产品可以戏谑、搞笑的方式与用户沟通,当用户说我要在附近找吃时,智能音箱回答不了就会说,“哎呀,你是个吃货”,但客服语音对答就不能有丝毫调侃,用户查询明天下午3:30是否有飞往大阪的航班,有就是有,没有就是没有,不可能存在第三个答案。

不过,整体移动互联网用户增长见顶,以及BAT等行家也纷纷入局,语音技术日趋成熟,客户变对手,让科大讯飞的技术优势渐消。但杜兰认为,BAT的到来会让语音技术变得更好,这片海域是非常宽阔的,并不存在相互竞争的问题。

而科大讯飞也在加快构建一个融合共享的人工智能产业生态。有这样一个经典的故事:一位四川人石城川,11岁那年高烧因失去听觉,2015年,他发现科大讯飞有一种语音识别技术,尽管自己听不到自己的发音,但是可以通过这种技术矫正自己发音,并识别正常人的语音转换成文字,这样就可以实现自己和正常人的对话。在咿咿呀呀的发音中,他重拾语言能力。后来,他创立了“音书”App,为听障者和健听者之间建立沟通的桥梁。

目前,科大讯飞开放平台已为超过90万开发者提供服务,2018年,共有55.8%的创业团队借助科大讯飞技术实现创业梦想。

随着技术迭代更新越来越快,语音识别准确率方面的提升越来越难,在众多玩家之间,竞争差距是更大还是更小?“企业间并不存在太大的技术差距,早期都是同一个技术公司,随着技术红利和技术壁垒的下降,后期推动开源,不只是看单一的技术能力。”邱楠说,论技术,有哪一家企业能竞争过中科院?但企业是给技术找到技术场景,在此基础上不断延展,竞争的维度一定是多元的,语音技术的壁垒也不会一直持续下去。

“我把企业分成两大类,分别是技术输出型和产品创新型,前者如谷歌,输出安卓系统;后者如苹果,其技术能力是为自己定义差异化、寻找差异化服务。”邱楠说,我给我们的定位就是追求产品的差异化和创新性。

专家点评

智能语音市场整体处于启动期

广州市社会科学院产业所副研究员 陈峰

智能语音是最早落地的人工智能技术。随着行业数据资源的积累,深度学习算法的进步,以及与其他人工智能技术之间的整合,语音识别、语义理解、语音合成技术将取得进一步突破,语音交互有望成为新一代人机交互的主要方式。

目前,国内外几乎所有的科技巨头都相继进入了智能语音市场,国外有IBM的Watson、Google Now、苹果的Siri、微软的Cortana、Facebook的Message Platform、亚马逊的Aleax等,国内有阿里的天猫精灵、百度的度秘、腾讯的微信语音,以及科大讯飞、华为、小米、云知声、依图等发展的智能语音技术和产品。据《2017-2018中国智能语音产业白皮书》的数据显示,2014年至2018年,中国智能语音产业规模由30亿元增长至159.7亿元,五年间增长了五倍。虽然有这么多的科技巨头和新创AI企业进入智能语音领域,产业规模也快速增长,但智能语音市场整体依然处于启动期,智能语音产品和技术变现尚处于起步阶段,真正成熟的语音产品还需要时间的打磨。

国家高度重视新一代人工智能产业的发展,随着新一代人工智能发展规划的启动实施,加快产业化和应用是着力点。工信部将进一步推动以智能语音为代表的人工智能核心技术发展,加强技术攻关、促进行业融合应用、优化发展环境,务实推动智能语音产业规模发展。可以预见,随着行业应用和场景的大规模切入,智能语音产品将快速迭代,产品的性能和用户体验也会不断提升,智能语音的发展大有可期。

责任编辑:陶国琪(QT0003)