云知声引领未来智能交互:山海多模态大模型开启AIGC新纪元


中国产业经济信息网   时间:2024-09-13





近年来,中国AIGC(人工智能生成内容)市场呈现出爆发式增长态势。根据量子位智库数据,2023年中国AIGC市场规模已达到约170亿元,并预计在未来几年内持续保持高速增长,并在商业化应用方面拥有巨大潜力。

 多模态发展已成为大模型行业共识

 数据显示,到2025年之前,中国AIGC市场规模的增长率预计将维持在25%左右,市场规模将达到257亿元。而自2025年起,随着底层大模型的逐步对外开放,中间层及应用层将迎来爆发式增长,带动AIGC行业市场规模的快速增长。年均复合增长率将超过70%,预计到2027年,中国AIGC市场规模将超过600亿元。到2028年,AIGC产业生态将更加成熟,并在各行各业实现商业化落地应用。至2030年,市场规模更是有望突破万亿人民币大关。

 在蓬勃发展的AIGC市场中,多模态发展已成为行业共识。AI模型按照处理的数据类型数量,可以划分为单模态和多模态两类。相较于只能处理一种类型数据的单模态模型,多模态模型能够处理两种或两种以上的数据类型,从而在输入输出端展现出明显优势。不同模态的输入数据具有互补性,多元训练数据输入有助于通用大模型能力的快速扩展。同时,多模态数据输入使用门槛更低,数据损耗更少,能够大幅提升使用者的应用体验。而多模态数据的输出则省去多模型的整合,更容易实现商业落地。

 云知声布局多模态大模型

 作为深耕AI领域的独角兽企业,云知声早早布局多模态大模型。

 2023年5月,云知声发布山海大模型,这是其在AIGC领域交出的第一份答卷。自发布以来,山海大模型始终保持高速迭代,并在多个权威赛事上屡获佳绩。在SuperCLUE中文大模型基准测评、MedBench中文医疗大模型评测、CCKS 2023医疗大模型评测等赛事中,山海大模型展现出全面的通用能力和优秀的专业能力,稳居全球大模型第一梯队。

 云知声深知,推动山海大模型迈进AIGC的关键在于其多模态交互能力的发展。因此,在不断提升山海大模型自然语言处理能力的同时,云知声也在积极发展其多模态能力。时隔一年,2024年8月,云知声推出山海多模态大模型,它能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出,带来实时多模态拟人交互体验。

 山海多模态大模型,带来更智能声色体验

 在语音交互方面,山海大模型展现出色的实时响应能力,用户几乎感知不到延迟,同时支持对话随时打断,使得交互过程更加灵活不受阻碍。此外,山海还能通过语音文本判断用户情绪,并予以适当的情感反馈,提供贴心的情感支持。

 在声音方面,山海大模型能模仿人类的自然语言特征,还能根据用户个性化需求自由切换音色,增强对话的生动性和趣味性。基于云知声的声音克隆技术,山海能够全面学习用户音色、风格,实现高保真还原。

 在视觉交互方面,山海大模型通过摄像头“看见”周围环境,实现精准识别。同时,结合图像生成技术,山海能够根据用户指令快速创建视觉内容,提供符合个性化需求的定制画面。

 随着AIGC市场的不断扩大和技术的不断进步,云知声将继续深耕多模态大模型领域,推动山海大模型在更多应用场景中落地,致力于打造一个能够深入理解世界、与人类进行自然而富有洞察力的交流的智能伙伴,全方位满足人们工作、社交、娱乐等多样话需求。


  转自:中国网

  【版权及免责声明】凡本网所属版权作品,转载时须获得授权并注明来源“中国产业经济信息网”,违者本网将保留追究其相关法律责任的权力。凡转载文章及企业宣传资讯,仅代表作者个人观点,不代表本网观点和立场。版权事宜请联系:010-65363056。

延伸阅读



版权所有:中国产业经济信息网京ICP备11041399号-2京公网安备11010502035964