18910140161

作者最新文章

2021-10-24 13:57:21

131

这篇推送是想告诉你:

我们夺冠了!世界!

近日,由小度与自然语言处理部门(NLP)组成的百度代表队,参加了全球人工智能领域竞赛 DSTC10,最终斩获了知识型任务口语对话赛道(Track2)两项任务的全部。在“任务式对话状态追踪”任务中,以 JGA(全部信息都预测正确的对话比例)46%、领先第二名10个百分点的成绩强势问鼎!在“知识对话”任务中,同样拔得头筹!中国自主对话 AI 技术再一次惊艳世界。

对话状态追踪任务榜单知识对话任务榜单

百度团队代码 A11、B10,图片来源于 DSTC10官网

参加比赛的同学非常不容易,因为,这个赛道是有史以来同类型任务中最难的!

任务难点

口语场景下模型输入包含大量语音识别错误,例如,是“Korean food(韩国料理)”,还是“currying food(咖喱食品)”?非常考验 AI 算法的推理泛化性能;

仅提供少量对话作为测试数据,不提供训练数据,非常考验参赛团队的技术积累。

大赛要求

方案能够解决多轮连续对话中的复杂语义理解问题,还要能够对语音交互和识别中的错误进行自动纠错和理解,同时需要将用户需求中的每一个部分都理解对才算通过。

小度&NLP 团队迎难而上,凭借以下方案亮点,在竞赛中脱颖而出。

基于百度 PLATO 大规模对话预训练模型,进行端到端建模;

创新性提出了多层级数据增强框架,解决数据匮乏难题;

匹配方法和生成方法结合,多视角提升效果稳定性;

层次化建模,多维度捕捉细节和全局语义信息;

创造性地在任务型对话中使用知识增强的方法强化语义表示,抵抗语音识别错误。

太深奥了!

——给大家举几个例子——

场景一:

-“小度小度,我想听大梦一场空。”

-“好的,一首徐海俏的《空》送给你。”

当你还在搜索“大梦一场空是什么歌”的时候,小度已经为你播放了出来;

场景二:

-“小度小度,周杰伦那个歌气球。”

-“好的呀,一首周杰伦的《告白气球》送给你。”

家中收音环境有时嘈杂,即使语音输入有一定误差,小度依然能准确理解语义;

场景三:

-“小度小度,小老鼠。”

-“小度为您继续播放《猫和老鼠》。”

-“小度小度,三国。”

-“小度为您继续播放《火烧赤壁》。”

常常看《猫和老鼠》动画片的小朋友,说“小老鼠”的时候,小度就能开始续播《猫和老鼠》;常常听《三国演义》评书的老爷爷,说完“三国”,小度就能准确定位到评书接之前听的《火烧赤壁》。小度的个性化知识增强了多轮理解能力,用户用得越久,小度越容易理解你的需求。

这些陪伴用户日常生活中的寻常技能,背后其实是问鼎世界的 AI 对话技术。

一个复杂的对话需求,经过前沿的技术处理,为用户带来了“开口即得”的人机交互体验。我们将不断加码科技自主创新,“用科技让复杂的世界更简单”。

相关文章
我们已经准备好了,你呢?
2024我们与您携手共赢,为您的企业形象保驾护航