18910140161

解放千万智能家居,度家给出语音控制的更优解

顺晟科技

2021-06-27 09:36:34

291

什么是智力?

可以找到的答案有很多,但近几年逐渐有了统一的答案。

想知道明天的天气情况,可以直接问家里的智能音箱;当你想边开车边切换导航路线时,可以直接说新的目的地;当你觉得空调不够冷的时候,也可以直接告诉空调降温.

智能标准可能比较广泛,但语音交互是最基本的门槛。

在刚刚结束的2021云志科技论坛上,百度艾云给杜家的语音和语义整合平台留下了很大的空间。在语音能力逐渐成为“智能”的代名词,升级到物联网产品标准的大环境下,百度AI Cloud是做什么的?

01技术的幸存者偏差

与机器对话似乎不是一个新概念。

早在20世纪80年代,语音识别就开始从实验室出来进行商业应用。虽然机器只能识别一个单词,识别准确率也保持在很低的水平,但没能阻止人们的早期采用者。IBM的Via-vioce系统,微软的Whisper系统,剑桥大学的HTK系统相继诞生。

2010年是语音识别的转折点。一些学者开始将深度学习技术引入语音识别领域,语音识别的准确率不断创下新纪录。

到2015年底,百度的语音识别准确率达到90%,相当于人类在同一对话中速记的水平。谷歌在2017年6月宣布语音识别准确率达到95%,百度仅用10个月就以97%的准确率超越了它。

技术已经被证明是工业繁荣的催化剂,语音识别的商业化就是一个直接的例子。

华西证券的研究报告显示,AIoT是公众接触消费者最常见的渠道。目前,智能语音已经应用到智能手机、可穿戴设备、智能汽车、智能家居等产品中。2020年市场规模为241.1亿元,预计到2023年市场规模将达到570.3亿元。

语音技术的成熟和语音市场的持续繁荣是否预示着语音交互的用户体验已经彻底告别了早期采用者?

事实可能有些令人失望。心理学上有个概念叫幸存者偏差。如果像百度一样专注于技校,语音交互已经上了一个新台阶。但在相当比例的智能硬件产品中,唤醒率低、识别率低、答非所问等现象仍然是正常状态。像百度这样的头牌玩家还在刷新纪录,但很多主流声控产品还处于伪智能阶段。

02度族给出的更优解

对这种市场现象给出合理的解释并不难。

语音技术登陆消费类服务通常有两种方式:一是将语音技术能力打包成SDK或API,下游客户或开发者可以直接调用。优点是成本较低,但技术能力因人而异;二是提供定制的解决方案,即根据客户需求进行定制和深度合作,在一定程度上保证了终端的用户体验,但缺点是成本高。

这大概就是百度AI云推出杜家平台的原因吧。与以上两种合作模式不同的是,杜家语音语义一体化的理念让外界看到了三大优势:

首先,杜家输出一个软硬件集成解决方案,集成了百度自主研发的洪湖芯片,在性能、兼容性、可扩展性等方面突破了传统解决方案的束缚。

比如传统芯片的平均功耗往往很高,提取的语音特征在云中直接由洪钧芯片识别,既保证了语音识别的准确性,又平均功耗只有100mw;洪钧芯片支持多达六路麦克风阵列语音信号,支持deep peak、deep cnn语音唤醒和百度最新双麦克风模型波束算法,可满足设备唤醒后的360度死角识别;同时,它可以与各种Android和linux芯片集成到一个板载解决方案中。

第二,语音和语义的融合弥补了语义的不足

百度AI Cloud除了在语音识别上有流式多级截断注意力模型和端到端建模的优势外,另一个优势在于语义理解。在传统的开发模式下,开发人员需要花费大量的精力去理解意图、单词槽、模板、特征词等。家庭平台的方案是语义对象模型,开发者只需要了解设备属性、控制动作、设备状态等。并根据用户的语音指令进行简单配置以驱动设备正确响应。

最后,通过开源框架和定制的开发板产品矩阵,帮助开发者进一步降低技术落地的时间和成本,加速语音技术的大规模应用。

例如,在硬件层面,杜家和乐心共同开发了一个集成swan芯片的开发模块,采用双麦克风设计,可以准确拾取5米以内的声音。同时配备了DeepPeak唤醒引擎、端到端建模技术和流式截断多层注意模型,大大提高了语音识别的准确率,具备方言识别和中英文混合识别能力。凭借百度官方开源框架,开发者可以在极短的时间内将智能语音应用到智能家居、智能机器人等产品中。

在智能语音市场快速增长,而语音控制的用户体验却相对滞后的情况下,杜家的语音语义整合方案可以说是目前的更优方案。

一切都可以用声音来控制

百度AI云赌上他的野心并不难。

一种解释是智能语音市场的掘金空间。有人曾在2019年细分过AI市场,其中智能语音的市场份额为22%,仅次于已经大规模商业化的机器视觉。如果把自然语言理解的市场份额算在16%的话,那将是一个体积不逊于机器视觉的蓝海市场,百度AI Cloud无疑会有足够的用处。

即使在智能家居市场,该行业仍处于起步阶段。2020年空调出货量5100万台,智能语音携带率只有15%。2020年小家电市场销售额将在7000亿元左右,但智能语音的携带率不到1%。以电视市场高达70%的智能语音承载率为标准,光是智能家居行业就有不容置疑的机遇。

如果只从市场规模这个维度来看百度,可能会低估百度的战略布局,更不用说从长远角度来解释了。

根据不同研究机构的报告,中国智能音箱的月销量稳定在300万台左右,累计出货量已超过1亿台。按照我国目前的城市化水平,智能音箱在城市家庭中的普及率已经超过20%,相当于2012年左右智能手机的普及率,说明语音交互的市场教育已经有了初步的基础。

在百度的战略规划中,小系列产品起到了消费者教育的作用,小圈子的反复打破是最直接的写照。作为百度AI To B的核心渠道,百度AI云自然起到了智能语音输出到B的作用,进而加速了智能语音从B到c的市场渗透。

可以证明,都佳为TCL高端电视提供了声音唤醒和识别服务,解决了TCL原语音解决方案远场唤醒效果差、抗噪能力弱等痛点,重构了TCL高端电视的语音交互体验。未来TCL会有更多的家电来承载杜家的服务;对于扫地机器人、集成灶等工作环境复杂、语音控制难度大的产品,杜家通过端云的集成消除了技术落地的瓶颈;即使在智能风扇、咖啡机等低成本的小家电上,控制场景中的自由理论也是在天鹅芯片的赋能下实现的,不再局限于指定的指令字。

就杜家的最新行动而言,它充分利用了端云集成、开源框架和定制硬件的综合优势,给予开发人员足够的自主权,进一步降低了应用和开发成本

毕竟,语音信息每天占人脑处理信息的20%。智能语音作为人类与外界最重要的交流纽带,注定是人机交互的主流趋势之一,对一切事物的语音控制将是智能时代的鲜明特征。

04写在最后

确切的说,杜家只是百度AI Cloud在物联网领域的孩子之一。IDC发布的报告显示,在中国AI公共云服务市场,百度AI Cloud的市场份额连续四年位居中国。

正如在2021年云志科技论坛苏州站上所展示的那样,终端云的全面智能AIoT平台已经将AI能力和物联网深度融合。美信达等合作伙伴在百度AI云的赋能下实现了低碳。运营方面,AIoT视觉智能已经渗透到工业质量检测、智能制造、城市管理等场景.

让AI发挥作用的百度AI云,正在进一步释放物联网的底层能量。

相关文章
我们已经准备好了,你呢?
2024我们与您携手共赢,为您的企业形象保驾护航