18910140161

大模式下的乘凉梦 百度自己做试验田

顺晟科技

2023-02-22 17:21:52

169

粮下乘凉梦,是今天中国人非常熟悉的一个词。来自袁隆平院士对杂交水稻高产的理想追求,是袁隆平的中国梦。他生前多次提到,他做梦都想在粮下乘凉。在他的梦里,水稻长得像高粱一样高,谷粒像花生一样大。

或许,成千上万的行业都有这样一个“草下乘凉梦”。科技探索将给生产和创造带来不可估量的价值,极大地改变人们的生活。在AI领域,有一项技术经常让我想起“草下乘凉的梦”,那就是预训练大型模型。在袁隆平院士的梦里,杂交水稻会长得很高,带来极高的亩产量;大模型在训练数据和模型规模上也非常大,在模型能力上形成了巨大的优势。

2018年以来,大模型作为AI领域的重要技术方向受到广泛关注。多年来,我们对大模型最大的期待,可能在于它能否真正从实验室和数据集的“种子”变成赋能产业和普惠经济的稻田。

535.jpg

杂交水稻的发展离不开精心培育的试验田。要实现大模的“草下乘凉梦”,可能也需要这样的“试验田”站出来,为时代找出大模的方向。在这个节骨眼上,百度站了出来。

9月23日,2022万象百度移动生态大会在广东珠海举行。会上,百度集团高级副总裁、百度移动生态事业群(MEG)总经理何接君首次全面解读了百度移动生态战略。其中最值得关注的一点是,会议详细展示了大家熟悉的百度移动生态如何与百度打造的文心系列大模型深度融合,带来搜索、信息流、AIGC等领域的草木生长。在百度的移动生态中,文心大模的能力可以说是用尽了,也应该用尽了。

换个角度说,如果我们想知道未来成千上万的行业如何在大模型下乘凉,那么今天百度移动生态的场景坐标,可能就是指向明天智慧中国的大模型之路。

大模式3.0阶段,产业转型成为核心。

在讨论百度移动对文心模式生态整合的重要性之前,首先要了解其背后的技术和产业背景。百度移动生态和大模型的融合之所以重要,是因为大模型本身的技术正处于一个非常重要的发展节点。

从发展历程来看,从2018年开始被业界关注开始,前期培训大模式的发展可以总结为三个阶段。第一阶段是所谓的“提炼模型”。传统的深度模型一直是行业的主旋律,预训练模型作为一种新的技术思路也开始进入萌芽阶段。接下来,在第二阶段,大模式的价值得到了各界的广泛认可。随着资本的广泛注入和社会的关注,谈论AI已经成为一种时尚,各行各业都进入了从“大炼模式”向“大炼模式”的转变。在这个阶段,各种大模型层出不穷,训练数据参数的扩大和技术思想的发展带来了大模型技术的繁荣。

536.jpg

当大模型的技术研发到一定阶段,新的挑战随之而来:这样的大模型应该如何与工业应用相结合?如果不能妥善解决这个问题,那么大型号的繁荣发展终究是空中楼阁。所以大模型的3.0阶段是从“提炼大模型”到“运用大模型”的过渡。如何实现有效的产业转型,已经成为目前大模型领域的核心任务。

要想用好大模型,从技术到产业的转化逻辑来看,需要具备三个前提:过硬的技术,完备的平台和工具,清晰明确的场景价值作为示范。一直深耕文心系列模式的百度,在前两种能力上显然具有先发优势。

2019年以来,百度深度参与预训练模型的研发,发布了一系列知识增强的ERNIE模型。2021年12月,百度与鹏程实验室联合发布了全球首个千亿级知识增强模型“鹏程-百度文心”,参数规模达到2600亿,在60多个NLP任务中取得了最好成绩。在2022年5月的Wave Summit深度学习开发者峰会上,百度发布了集成学习任务知识的知识增强千亿模型、多任务统一学习的可视化模型、跨模态模型、生物计算模型、行业模型等10大模型,并提出了支持大模型行业落地的三大关键路径:构建更适合场景需求的大模型体系,提供工具、平台和方法支持全流程应用落地,构建开放生态激发创新。

537.jpg

至此,文新大模型已经不仅包含了基础的通用大模型,还包含了面向重点任务领域的行业大模型,还拥有丰富的工具平台。从技术过硬的角度来看,文心大模型具有知识增强的差异化优势,可以从大规模知识图谱和海量非结构化数据中学习,从而实现更高的效率、更好的效果和模型良好的可解释性。从平台建设和产业转型的角度来看,文新大模型具有产业级特征,提供工具和方法支持全流程应用,营造开放生态激发创新。

换句话说,清晰的场景示范值是文新大模型将大模型推向3.0阶段的“最后一公里”。此时,百度丰富的产业生态布局体现了关键价值。

百度移动生态,大模式时代的“试验田”。

科技领域有句话叫“自己的降落伞先跳”。对于想要率先探索大模型应用和产业转化的百度来说,也必须“先用好自己的大模型”。

可喜的是,百度丰富的移动生态布局,不仅是大模型应用的沃土,更以其苛刻的技术要求、清晰的能力和代表性的应用场景,成为更多开发者和企业的“试验田”。

在2022万象百度移动生态大会中,我们看到了百度移动生态与文心大模式的丰富多样融合。百度移动生态一直是百度AI技术的“第一站”,长期坚持AI技术可穷尽可穷尽的原则。

538.jpg

在与大模型的结合上,我们首先可以看到百度最近发布了一个针对搜索场景的跨模态大模型“智易”。可以理解全网不同形态的文字、图片、视频、结构化信息等资源,从而打破资源形态的界限,将最符合用户需求的结果呈现给用户,真正实现大模型技术与搜索、信息流等百度核心业务的深度融合。

对于百度移动生态中更多的开发者和创作者来说,基于文心大模型的“创作者AI助手团”可以带来划时代的AIGC体验。在这个AI团队里,有文案,有插画,有视频制作。在这些“助手”齐新的努力下,创作者可以实现“一个人成为一个团队”。

539.png

基于百度文心模型,“AI文案助手”可以根据创作者的需求,快速制作不同风格的文章标题和内容段落,“AI插画助手”可以根据关键词自动“画”出十余幅不同风格的画作,让创作者实现“画的自由”。相关能力现在可以在百度APP中体验,效果非常突出。

“AI视频制作助手”基于文心模型的自然语言处理和跨模态AI技术,让创作者的图文以“分钟”的速度自动生成视频。这项技术将从图文到视频的创作周期缩短了三倍以上,也给创作者带来了“一个内容,两个收益”的效果。

“AI助手创作者群”可以说是大模型的一个应用价值的全景展示,——AIGC(AI生成内容)。基于大模型打造的AIGC能力,可以实现各种AI自主创作和丰富的创作辅助功能,实现文案自动制作、图片自动制作、图片转换成视频等一系列技术飞跃。目前“创作者AI助理组”已经开始邀请内测,将从今年第四季度开始向更多创作者开放。

由此我们不难看出,文新大模式给百度移动生态带来的能力,不是简单的锦上添花的能力升级,而是真正的跨越式创新。甚至可以说,它解决了移动开发者和创作者长期以来的核心创作门槛,让创作者专注于创作的核心部分。

这样的能力升级对于百度移动生态未来的发展当然至关重要。但更重要的是,可能这种结合显示了一种可能性,一种大模型走向深度工业应用的可能性。

AIGC收割时,行业深度转型:文新大模草下乘凉的梦想

不久前,科技部发布《关于支持建设新一代人工智能示范应用场景的通知》(以下简称《通知》),指出要充分发挥人工智能对经济社会发展的赋能作用,打造一批可复制、可推广的标杆示范应用场景。

不难看出,以场景为导向,快速实现AI技术的产业落地和规模化辅助,正成为当前AI产业发展的主要任务。大型号也是如此。为了真正理解大模型的价值和应用大模型的能力,所有行业都需要以场景为导向,以演示为坐标。

百度移动生态对大模型的深入应用,恰好可以构成这种时代急需的场景演示。从大模式到产业转型的路径,百度移动首先证明了AIGC的可用性。作为大模型走向产业的重要一站,更多的产业可以从百度的经验中消化吸收AIGC的价值,从而实现自己的大模型落地。其次,百度移动生态系统与大模型的融合,也用行业需求和行业真实情况证明了大模型的融合价值。百度的移动生态有着巨大的流量和多样化的服务,这些都是对大模式可用性的考验。

著名经济学家任泽平在万象会议期间也表示:“在AIGC时代,百度APP作为前哨和基地,是AIGC使用最广泛的世界,也将成为一个人人可用的新AI基础设施。这种“百度搭台,大家唱”的模式,会激发全民更大的创造力,会有很多新的模式和应用破土而出。”

从文心大模型与百度移动生态的结合,到AIGC行业实践的探索,再到大模型在更多行业应用的可能性,可以看到这条路径为大模型的3.0阶段带来了三重价值。

1.修身自证:大模的技术能力已经趋于丰满。

百度移动生态对文新大模型的应用,首先向各行业开发者展示了大模型能做什么,有什么样的想象空间,这来自于文新大模型的技术能力。大模式的种子需要在土壤中证明自己的价值,而AIGC和百度移动生态提供了这样的土壤。以AI智能写作为例,ERNIE 3.0 Zeus是最新的千亿级模型,集成了任务相关知识。厄尼3.0宙斯在学习海量数据和知识的基础上,进一步学习100多种不同形态的任务知识,在各种任务中表现出更强的创造能力。从财经、体育新闻到诗歌、小说等文学创作,AI写作涵盖的领域越来越广,创作形式和内容也越来越丰富多彩。

540.jpg

今年高考期间,被厄尼3.0宙斯加持的AI数字人杜潇潇挑战写高考作文,以40秒40篇的速度取得了总考生前25%的成绩。欧尼3.0宙斯的智能创作能力已经对外开放,各行各业的开发者都可以在线体验和定制欧尼3.0宙斯的文字创作能力。先说AI绘画,AI绘画等AIGC应用想要得到保障,背后是文心跨模态模型的强大支持。作为全球最大的中文跨模态生成模型,文心的ERNIE-ViLG参数规模达到100亿,将“文本生成图”和“图生成文本”的任务整合到同一个模型中进行端到端学习,从而增强文本和图像的跨模态语义对齐。最近,ERNIE-ViLG文本图生成算法得到了升级。通过渐进扩散模型,生成空间由小到大,生成轮廓由粗到细。同时根据生成阶段自动选择最优生成网络,进一步提高了文本生成图像的效果。可以说,每一幅AI画的背后,都有文心大模技术能力满满的证明。

2.沃土通途:产业工具和开发平台逐渐完备。

各行业、各领域的开发者需要有针对性的平台和工具,才能真正使用大模型,从而降低技术获取的门槛,提高产业开发的效率。为此,文心大模在工具化和平台化方面做了丰富的探索。以AI绘画为例,文心一格是百度推出的AI美术与创意辅助平台。是百度依托飞桨和文心模型的持续技术创新,在“AI画图”方面发布的产品。对于有设计需求和创意的人,文心一格可以基于文心大模型智能生成多样化的AI创意图片,辅助创意设计,打破创意瓶颈。需要更多便利的开发者还可以使用ERNIE-ViLG服务,用文心吐温生成大型模型,从而快速获得用沉浸式吐温生成大型模型的技术体验,更加灵活、便捷、高效地实现产品集成。这样我们就可以看到,对AI绘画有不同需求和考虑的开发者,都有平台和工具来获得他们想要的AIGC能力。这是大模型走向产业和应用的沃土。

3.草下乘凉:模型大规模应用的开始。

面对更广阔的行业应用前景和产业想象,文心大模型不仅推动与百度业务的融合,还积极探索对外赋能的形式和方式。文心大模型的知识增强特性,可以在实体问答、知识预测等领域取得更好的效果,提高大模型在行业场景中的可用性。同时,文新行业模型利用行业知识增强技术学习行业特征数据和行业特征知识,从而提高大模型对行业应用的适应性。目前,文新已经发布了电力行业的NLP模型“国家电网-百度文新”和金融行业的“浦东-百度文新”,已经在电力和金融相关任务中得到应用。在航天领域,文心大模型联合中国航天发布全球首个航天大模型——“航天-百度文心大模型”,推动AI技术在航天领域的应用。

541.png

文心大模型已经推出了开发套件、API和内置文心大模型能力的开发平台,可以让不同领域、不同需求的产业开发者以更低的成本、更低的门槛精准获取大模型赋能,推动人工智能的进一步广泛应用。

文新大模正在加速产业落地,正在成为推动AIGC发展的新引擎,也正在成为推动产业智能化的新基地。大尺度模型的大规模应用及其成功,或许就是我们所期待的智能中国的草下乘凉梦。

我们已经准备好了,你呢?
2024我们与您携手共赢,为您的企业形象保驾护航