百度 采访首届搜索技术创新挑战赛X冠军团队关于技术理想和对未来的期待
日前,由百度搜索联合北京大学、山东大学、湖南人工智能学会、西安电子科技大学等各地高校、学会,共同举办的「新智能·新搜索」为主题的首届搜索技术创新挑战赛(STI)圆满落幕。赛程历时 2 个月,超过 16
顺晟科技
2023-02-23 11:32:06
115
近日,由百度搜索、北京大学、山东大学、湖南人工智能学会、西安电子科技大学等地方高校和社团联合举办的以“新智能新搜索”为主题的首届搜索技术创新挑战赛(STI)圆满落下帷幕。赛事历时2个月,1600多名选手报名参赛,覆盖33个省市和海外城市。
经过四大赛区的区域赛、复赛、决赛答辩,决出了最后两条赛道的冠军队伍。其中,“搜索问答”赛道冠军团队为“四歪猪”;“搜索模型推理优化”赛道冠军队伍是“错误码114”。他们以出色的搜索技术应用和精准的算法架构获得了评审团的一致认可。
赛后,我们对两组球员进行了专访。采访中,选手们分享了比赛前后的经历,谈了自己的技术理想和对未来的期待。从他们身上,我们可以了解到新生代开发者对前沿技术的期待和热爱,以及他们的技术理想。
我们来看看采访内容(为方便阅读略作删减)
《搜索问答》赛道冠军队:四歪猪(中山大学、重庆邮电大学)
队员:(队长)、谢华军、高、孟、
“搜索模型推理优化”赛道冠军团队:错误码114(西安电子科技大学)
队员:(队长)、陈、郑宇航、詹、贾、李福(指导员)
1.参加这个活动的初衷是什么?
“四歪猪”:一是提高技术能力。本次比赛的目标是了解搜索技术,深入学习百度的PaddlePadlle框架。另外,奖金也是一个目标。
“错误代码114”——陈:我们团队有五个人对模型的加速和展开非常感兴趣,参加这个比赛就是为了提高这方面的能力。第二点,参加比赛可以丰富自己的简历,增加就业机会。
2.本次大赛的主题是“新智能新搜索”。你如何解读这个主题?
“四歪猪”:在我们团队看来,通过一些新的AI技术,搜索引擎可以更好地理解和满足用户的需求,让用户更便捷地获取世界的信息。搜索技术已经出现很多年了,它仍然是我们了解世界的主要方式。如果我们能够借助新技术改善用户的搜索体验,我们可以带来一个非常好的结果。
“错误代码114”——陈:搜索是互联网的一个基本应用。搜索作为用户主动表达需求的场景,也是技术高度密集的场景。然而,随着互联网的快速发展,互联网的内容变得多样而丰富,资源量也是数以亿计。为了应对内容的变化,提供更好的服务,搜索算法也在与时俱进。在人工智能的加持下,搜索变得更加人性化,就像百度的知识-跨模态模型在搜索场景中有着出色的表现。
本次比赛的两条赛道设置非常契合这个主题。途径一使结果更准确,途径二使结果更快。
3.可以分享一下竞赛中方案设计的思路吗?
“四歪猪”:我们的项目计划大致分为三步:任务抽取、语义推理、答案聚类。在任务抽取部分,我们使用序列标注对数据进行训练;语义推理阶段采用交互模型,通过文本的语义匹配得到最终结果;在答案聚类阶段,采用最大连通图和层次聚类方法,得到置信度最高的答案结果。
“错误代码114”——谢雨生:我们也分为三个阶段。第一阶段主要是优化图形和操作员级别;在第二阶段,使用一些机制来优化推理引擎,如TensorRT的动态推理机制、MultiProfile机制和NVIDIA的CudaGraph机制。第三阶段,我们想在优化上更进一步,所以采用NVIDIA的FasterTransformer框架来构建整个Ernie模型,最终实现推理。
4.你认为你的方案最大的优点是什么?夺冠的原因是什么?
《四歪猪》:最大的好处可能是任务提取阶段的结果更准确。我们团队在解码部分做了一些改进,这是其他团队没有想到或者做到的。在这一部分,我们的得分远高于其他队伍。
“错误代码114”——谢雨生:我们方案最大的优势应该是更好的优化。就像我们刚才说的,通过三个阶段的优化,最终取得了非常好的效果。另外,比赛中队员的默契配合和方案选择,以及赛前的调研和工作经验,让我们在解决问题时有了更多的思路。
5.比赛中最大的挑战是什么?是如何解决的?
“四歪猪”:最大的挑战是团队成员在瓶颈期会缺乏动力。这时候我们会依靠不同的视角和分工,互相讨论对方工作中有没有问题,有哪些方向可以尝试交流,互相鼓励。一个人玩一个游戏很难,因为视角不全面。只有团队齐心协力,解决问题的方案才能更加多样,才能有更多的动力和信心坚持下去。
“错误代码114”——郑宇航:比赛中最大的技术挑战是厄尼模型。它的结构相对简单整洁,baseline在PaddlePaddle的基础上进行了大幅优化。我们通过新版TensorRT、CudaGraph、算子融合对推理进行优化,然后借助FasterTransformer进一步提高推理速度,并尝试使用INT8进行推理,最终使得推理速度大大提高。
6.如果你有更多的时间和资源,你还有哪些优化或迭代的方向或思路?
《错误代码114》——陈:我们在游戏开始时尝试了INT8推理,但是思路不够清晰,很多量化问题没有及时解决,造成了准确性的极大损失。另外,如果我们有更多的时间和资源,我们会借鉴百度Paddle Slim的方法,做更好的模型剪枝工作。
7.对于大家来说,这次经历你收获了什么?你认为参加比赛最大的意义是什么?
“四歪猪”:首先,参加这次大赛让我们学习到了检索技术以及PaddlePaddle框架的相关技术和应用,进而获得了丰厚的奖金。但最大的意义是在比赛中认识了很多技术领袖,认识了很棒的队友。这段经历丰富了我的大学生活,相信对以后找工作有很大的帮助。
“错误代码114”——贾:由于研究方向不同,对百度PaddlePaddle飞桨了解不多。这次比赛让我们更加了解了百度PaddlePaddle和NVIDIA CUDA相关的编程框架,并编写了相关代码,开阔了我们的视野,也让我们更加了解了百度的技术方向。
“错误代码114”——谢雨生:这次比赛让我认识了一批优秀的选手,有机会和他们交流。比赛结束后,大家还是在选手之间分享自己的计划,互相学习。我觉得这很有意义。
8.我相信通过参加比赛,我一定对搜索引擎有了更深刻的认识和理解。你认为搜索引擎最重要的是什么?
“四歪猪”:搜索引擎的准确性。当用户进行搜索时,重要的是引擎能够准确地为用户提供想要的结果。现在,当我们搜索一个问题时,会弹出很多信息。我们如何从这些信息中得到我们想要的呢?我认为这很重要。
“错误码114”——郑宇航:我觉得是搜索的相关性,尤其是首页的相关性。当用户在搜索栏中输入关键字时,主页上显示的信息会捕获用户的大部分点击。一般来说,使用搜索引擎的用户,如果在首页找不到相关内容,往往会默认搜索引擎找不到相关内容。所以我认为首页的相关性是评价搜索引擎性能的一个标准。
9.你对技术的热爱从何而来?
《四歪猪》:我第一次接触技术竞赛是在本科的时候,通过一个学校的工作室。比赛过程中,我们接触到了来自全国各地的选手,感受到了技术竞赛的氛围,开阔了视野,开始享受到了在得分过程中的技术成就感。
《错误代码114》——贾:小时候,我喜欢玩电脑游戏。长大后,我对计算机编程有所了解,所以我选择了编程作为大学的专业。经过实践学习,对深度学习、人工智能等技术特别感兴趣,期待未来人工智能的实现。希望以后能为中国贡献自己的力量,让中华民族实现伟大复兴。
《错误代码114》——詹:我是在小学接触到软件开发的。不知道大家有没有玩过魔兽争霸3,这个游戏中的地图编辑器功能就是我第一次接触到的类似编程的思路,类似于现在流行的低代码开发。你可以通过设置一些条件和执行一些动作来制作游戏地图。也是从对游戏的兴趣发展到对编程和技术的兴趣。
10.你将来想做什么样的工作?你想做什么能改变人们生活的高科技产品吗?
“四歪猪”:我想成为一名NLP算法工程师。我今年大四,选择的研究生导师的研究方向是NLP。产品可能想做一个类似于ChatGPT的智能问答机器人,能像人一样回答问题,感觉很有趣,很神奇。
“错误代码114”——谢雨生:希望从事深度学习推理和训练平台框架的开发,特别希望加入百度做PaddlePaddle推理和部署相关的工作,比如国内一些平台的芯片上的优化。
对于高科技产品,我希望能做出一种电子眼镜,就像著名名侦探柯南李的眼镜一样。看起来普通人其实有很多高科技。现在我觉得很多公司做的VR头戴设备都有点大。希望以后能做出更轻更方便的产品。
“错误代码114”——陈:我要开发基本框架。目前嵌入式平台上有各种深度学习框架。如果有机会,我想加入一家公司,参与统一基础框架的开发。也希望在人工智能的发展上留下自己的汗水和努力。
《错误代码114》——贾:希望做人工智能管家,类似钢铁侠里的贾维斯。我觉得人工智能管家的市场前景很好,也符合现在的家庭需求。
《错误代码114》——郑宇航:我要做智能代理。比如智能假眼可以帮助盲人患者恢复视力,智能假肢可以帮助残疾人恢复行动能力。我认为它有很高的社会价值,可以改变人们的生活。
在AI技术的加持下,搜索领域的未来空间正在不断扩大。在飞速发展的时代,更多像这两组玩家这样的新技术力量正在拓宽我们生活的宽度和广度。
本次“百度搜索技术创新挑战赛”已经圆满落幕,这是百度在技术探索和人才培养领域的一次探索,实际上已经找到了一条可行的路径。也期待更多的企业、社会组织、高校、开发者、技术爱好者,携手百度,共赢智能搜索新未来,共建新型复合型人才培养生态。
23
2023-02
02
2022-11
21
2021-10
21
2021-10
18
2021-07
16
2021-07