日前举行的苹果开发者大会上,SIRI智能音响与苹果智能家居平台Homekit深度融合带来的语音交互方面的新体验,成为业内关注的焦点。这也引发音响制造厂商、消费电子芯片商、声学元件厂商、软件平台企业、家用服务机器人公司、平台内容提供商等产业链上众多公司近期集体有所动作。业内人士表示,历经数十年发展,随着技术不断沉淀以及交互场景的不断拓展,语音技术发展即将突破大规模商用节点,行业将进入爆发期。
新一代人机交互模式
“语音交互有望成为下一代人机交互的新模式。”美国最大的风险投资基金合伙人玛丽·米克尔表示,语音是最有效的计算输入形式。语音具有快速沟通、简单方便、个性化且无需键盘等特点。随着技术不断成熟,语音交互时代即将到来。
事实上,语音交互技术已在逐步商用,如苹果手机上的Siri等应用。业内人士表示,早期苹果公司的Siri等语音助手,主要依赖脚本对话,对特定指令做出应答。但去年收购VocalIQ技术后,用户以会话方式而非过去的提示性语音与设备交互。
亚马逊的Echo音箱热卖,是语音识别技术发展的一个重要标志。该款音响可以根据语音指令回答问题、创建购物清单、播放音乐,甚至能开关电灯。自2014年发布以来,该款音响累计销量突破300万台,仅今年第一季度销量就超过100万台。同时,第三方开发服务数量近千项,有望成为亚马逊下一个10亿美元的业务。
对语音识别技术兴起的原因,业内分析师表示,智能手机在去年迎来爆发后,计算机行业需要一个新的触发点。而传统的交互方式难以全方位满足用户需求,以语音交互为基础构成包括图像、体感在内的第三代人机交互模式有望加速启动。
国泰君安分析师认为,深度学习算法大幅提升语音识别正确率。在语音识别率方面,目前百度、谷歌等主流平台在单词语音识别准确率方面都超过了90%,科大讯飞、云知声等智能语音识别企业的识别率达到96%以上。
百度首席科学家吴恩达表示,如果语音识别准确率从95%上升到99%,使用人数将大幅增加。搜索业务中,5年后至少50%为图像搜索或者语音搜索。
目前语音识别已广泛应用于智能手机。玛丽·米克尔表示,2013-2015年,美国智能手机用户使用语音助手的比例从30%上升到65%。谷歌2016年语音搜索量较2008年增加了35倍以上,较2010年增加7倍以上。百度语音从2014年第二季度起,语音输入增加4倍以上,输出增加26倍以上。
融合多种人工智能技术
智能语音技术包括识别和交互环节,融合了多种人工智能尖端技术。安信证券分析师认为,人机语音交互应用的关键是准确率与响应时间,语音识别技术日益成熟,即将突破量变到质变的临界点。随着语音识别技术和硬件发展,驱动语音交互渗透率迅速提升。
据了解,亚马逊的Echo音箱最早只是一个有趣的实验,目的是测试语音激活功能,并希望通过收集消费者的行为数据来制定可行的战略方案,吸引消费者前往购物。而Echo音箱的销售大大超出预期。目前苹果、谷歌等已经发布类似产品。科大讯飞去年与京东成立合资公司,切入点是其新推出的叮咚智能音响。
随着语音技术应用范围不断扩宽,并衍生出一系列对语音交互存在刚性需求的场景。如以可穿戴设备为代表的小型化、便携式终端交互;远距离、大屏幕终端交互,包括智能电视、智能家居、消费机器人等;汽车等不方便使用双手场景中的人机交互。
应用需求推动技术进步。智能可穿戴设备屏幕一般不大,甚至没有触控屏幕,因此使用语音更加便于人机交互。如可穿戴设备的先驱谷歌眼镜就搭载了智能语音系统。在网络环境下,可以通过语音发送短信。随着可穿戴设备渗透率不断提升,语音交互应用领域将不断拓宽。
在大屏领域的应用集中在智能电视,康佳、长虹、TCL、LG、乐视等均搭载语音交互功能,通过语音输入可实现查收影视剧、听歌、发送微博、开关电视等功能。在智能家居领域,搭载语音方案成标配。其中,苹果发布的智能家居HomeKit采取与Siri协作的方式,用户可以使用自然语句发出命令。随着家用消费市场兴起,语音技术将迎来更广阔的市场。
汽车领域则是另一争夺焦点。在驾驶汽车过程中,使用按键或触控存在安全隐患,各大车厂在前装控制系统中搭载了语音控制方案。
多路资本加快入场
随着语音交互技术的发展,促使智能家居相关产品成为焦点,多路资本纷纷加入抢占市场。如谷歌已布局声控操作智能家居入口系统,其语音助手基于人工智能和深度学习功能,可应用于多种硬件产品;声控智能硬件产品GoogleHome有望成为智能家居的控制中枢。京东发布的叮咚智能音响平台,为基于语音交互控制的智能家居产品,目标是打造家庭全数据服务分发平台。
音响的普及带动了音乐版权落地。安信证券分析师表示,全球进入数字音乐时代,智能音响满足声音的输出要求。智能语音技术逐渐成熟,信息的输入与输出在智能音响上得到完美诠释,声学将是互联网的新入口,基于声音的商业模式将得以快速发展。
“预计智能音响行业有望成为新的互联网和物联网入口,互联网厂商加速切入。”安信证券分析师表示,音乐支出占娱乐消费的18%,商业模式在数字时代正在变化,内容收费需要与硬件结合。智能音响更多的价值体现在家庭物联网的整合控制和人工智能的实际载体。
硬件将成为入口,软件平台处于产业核心地位。“未来人工智能将像水和电一样,融入人们的生活。”科大讯飞相关负责人表示,公司占据中文语音市场70%以上的份额。该公司针对人与人之间自由交流语音的正确率突破85%实用门槛,针对会议演讲等场景达到95%以上的识别率;同时布局了图像识别、大数据以及脑科学等领域。
版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“中国产业经济信息网”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场。版权事宜请联系:010-65363056。
延伸阅读

版权所有:中国产业经济信息网京ICP备11041399号-2京公网安备11010502003583