“多语种智能语音关键技术及产业化”项目获国家科技进步奖一等奖


中国产业经济信息网   时间:2024-07-01





  6月24日,2023年度国家科学技术奖在京揭晓,共评选出250个项目。其中,由科大讯飞股份有限公司牵头,联合中国科学技术大学、清华大学、华为终端有限公司、中移(杭州)信息技术有限公司等高校及行业领军企业联合完成的“多语种智能语音关键技术及产业化”项目荣获2023年度国家科技进步奖一等奖。


  据了解,多语种智能语音技术对于支撑人机交互、人类语言互通等具有重大战略意义,产业前景广阔。


  为解决语音识别研究中远场、噪声、多人语音混叠等难题,该项目提出了多通道语音信号时空分离建模方法和多维度语音属性解耦表征方法,实现语音信号中内容、噪声等高度耦合的多维属性特征解耦,使得复杂场景下语音识别准确率得到重大突破。


  为应对小语种智能语音系统构建所面临的知识匮乏、训练数据稀缺等难题,科大讯飞设计了全新的多语种通用音素体系和基本语言单元,实现多语种统一音素韵律体系的构建,又通过基于元学习的多语种预训练和基于语族分组的多语种共享建模。通俗地说,就是将不同的小语种进行分类,找到同类语种的共同规律,进行分析建模和训练,最终显著提升了小语种语音系统性能。


  同时,为解决复杂应用场景下语音交互、语音翻译面临着深层次语义理解困难、专业性不足等问题,科大讯飞提出语音语义互增强的鲁棒口语理解技术,有效提升语音交互、语音翻译等复杂场景的语义理解准确率;提出多源知识增强的可信文本生成技术,提升专有词汇及领域知识引用的准确率。


  目前,该技术成果得到广泛应用。以智能手机为例,项目支持各主流手机厂商累计激活设备超10亿台;智能汽车方面,车载智能化产品累计前装超5300万套。此外,该项目还构建了多语种智能语音技术及全球产业生态,2017年开始承建的智能语音国家新一代人工智能开放创新平台,已聚集平台开发者数700.7万,终端设备数40.5亿。(记者 郭倩)


  转自:经济参考网

  【版权及免责声明】凡本网所属版权作品,转载时须获得授权并注明来源“中国产业经济信息网”,违者本网将保留追究其相关法律责任的权力。凡转载文章及企业宣传资讯,仅代表作者个人观点,不代表本网观点和立场。版权事宜请联系:010-65363056。

延伸阅读



版权所有:中国产业经济信息网京ICP备11041399号-2京公网安备11010502035964