顺晟科技
2023-02-22 15:16:26
134
ChatGPT的受欢迎程度显然超出了很多人的预期。
甚至在中国互联网上,与ChatGPT相关的报道和讨论早已超越其他科技概念,甚至出现了“ChatGPT概念股”一词。很多与AI、Big Model、NLP相关的中概股,短时间内的涨幅都出乎意料的超过了50%。
每次有“科技事件”上演,就有人蠢蠢欲动,有人顺势而为,ChatGPT掀起的浪潮似乎也是如此。
但是当我们在谈论ChatGPT的时候,我们在谈论什么呢?颠覆性创新的技术洗礼,或者说对人工智能前景的看好,在潜移默化中被有意志的人带到了风口。澄清这些问题的答案远比讨论ChatGPT本身更有价值。
01一个自上而下的“不圆”
和2016年的AlphaGo一样,ChatGPT的“火”也呈现出自上而下的轨迹。
答案就藏在一系列10W的爆款文章里。ChatGPT相关文章可谓利润无穷。除了自媒体大量的科技财经分析报道,就连旅游博主也开始以ChatGPT为主题,内容特别吸引人:
大部分是博主和ChatGPT的对话截图,其中问题本身就颇具话题性,截取的问答也很抢眼。稍微联系一下AI取代人的宏大话题和可能的应用场景,短时间内就能炮制出一篇大众喜欢的文章。
追逐热点一直是媒体的“天职”,以热门的ChatGPT为话题无可厚非。问题恰恰出现在信息的不对称上。
从2022年11月底上线运营,到2023年1月底月活上亿,ChatGPT两个月刷新了用户增长的历史记录。只是在注册体验ChatGPT尝鲜的过程中,对中国网民相当不友好。
想打开OpenAI的网站,必须要有“科学冲浪”的工具,而ChatGPT没有在国内注册,必须使用海外手机接收验证码.可以说是增加了人为的壁垒。在这样的注册机制下,用ChatGPT“自由聊天”的国内网民注定是“少数”,大多数网民都是从别人那里“听”ChatGPT的。
正是在这样的背景下,ChatGPT的“神奇能力”被不断放大。究其原因,与人们对对话机器人的特殊感情密不可分。
无论是2014年诞生的微软萧冰,还是以“智能助手”自居的Siri,还是专注于语音交互的智能音箱,都吸引了无数人的好奇,在特定时间引发了现象级的讨论。毕竟早在上世纪初,图灵就提出“对话”是检验机器是否具有人类智能的有效场景。
遵循类似的逻辑,ChatGPT的“出圈”是注定的结果。以千亿级模型GPT-3为后盾,ChatGPT的自然语言理解能力远超早期的微软萧冰和Siri。在与用户对话时,它不会机械地根据一两个关键词输出结果,而是理解用户的“语义”。输出的准确性和相关性也不尽相同,很大程度上刷新了人们的认知。
但目前的ChatGPT仍然是大规模离线语料库的训练版:即时消息无法收录到自己的答案中;经常给出一些看似合理但不正确的答案;对话中涉及的因果关系还缺乏很好的理解能力;人类缺乏从他人身上进行推论的能力.不能像朋友一样畅所欲言。
如果说有些阴谋论的话,在ChatGPT大行其道的这几天,也不乏“炒作”。比如让人摸不着头脑的“ChatGPT概念股”,目前还没有看到任何中国股票与OpenAI合作。所谓概念股,多处于文本生成、信息抽取、知识抽取、机器问答等技术的热度,是典型的“借物说事”。
就目前的情况来看,ChatGPT的火爆还会持续一段时间,但刻意营造的期望值就像吹起来的泡沫,再美好也有被戳破的一天。与其讨论ChatGPT的短期效应,不如关注它的长期影响
或许ChatGPT的“突然走红”有一些偶然的因素,但同类产品的出现是必然的结果。
显然,在ChatGPT前所未有的受欢迎程度下,竞争产品正在加速追赶:谷歌首席执行官sundar pichai在2月7日凌晨宣布,他将推出一项名为Bard的实验性对话ai服务,该服务将在几周内对部分开发者开放。
几乎与谷歌同时,百度正式宣布将推出类似ChatGPT的人工智能聊天机器人。项目名称为“文易欣燕”,英文名为“ERNIE Bot”。预计3月完成公测,或将直接接入百度搜索,向公众开放。
人工智能创业公司Meta-intelligence迅速推出功能对话产品ChatYuan;阿里达摩院主导的类ChatGPT对话机器人在内测阶段曝光;昆仑万伟宣布将与奇点致远合作,在年内发布开源的中国版ChatGPT代码.官方公布的路上产品更多,不排除画虎不成反成狗的尴尬场景。
一个流行的解释是ChatGPT将取代搜索引擎。被引用次数最多的Gmail创始人之一Paul Buchheit说:“像ChatGPT这样的AI聊天机器人会摧毁谷歌,就像当年搜索引擎彻底杀死黄页电话簿一样。这需要一两年的时间。”固有的商业逻辑是,一旦搜索引擎决定的信息检索方式被颠覆,整个互联网商业将重新洗牌,没有一家互联网巨头愿意错过在新格局中占据一席之地的可能。
或许还有另一种解释,那就是ChatGPT的诞生是一种方向性的探索。OpenAI率先验证了对话AI的可行性,随后Google和百度迅速跟进。类似ChatGPT的产品之所以能在短时间内推出,就是从大型号入手。
回到2017年,当时还在谷歌工作的Ashish Vaswani等人提出了Transformer架构,使得深度学习的参数达到了上亿;2018年,Google基于Transformer推出双向深度预训练模型Bert,参数首次突破3亿;同年,OpenAI提出了生成式预训练变压器模型GPT,进一步推动了大型模型的发展。
然而,直到2020年,大模特才真正进入大众视野。诱因是著名的GPT-3,它有1750亿个参数,是传统深度学习小模型的1万多倍。与此同时,外界看到了“励精图治,创造奇迹”的一幕:常见的小模型需要针对不同的任务由不同的模型进行训练和求解,而GPT三号则是用海量数据对大模型进行预训练,然后在训练前初始化模型参数。
一场千亿级别型号的军备竞赛就这样开始了。
仅在2021年,华为、致远、浪潮、阿里云、百度等国内企业相继发布了自己的大型模型产品,之后不断从NLP延伸出双语、CV、跨模态模型。据OpenBMB开源社区统计,中国贡献了1/3,美国贡献了1/2,世界其他国家或组织贡献了全球模型剩余1/6的超千亿参数。和历史上很多“军备竞赛”一样,消耗大量真金白银的大型模型最终需要找到一个商业出口。
有意思的是,无论是GPT-3还是ChatGPT,OpenAI都站在了新旧交替的临界点上,第一次掀起了一股大模型热,让全球科技巨头们可以一试身手。这次能给大模特的商业化带来活力吗?
03大型模型商业化的“火炬”
大模特的表演并不性感,但是培养大模特要花很多钱。
公开数据显示,GPT-3训练的硬件和电力成本高达1200万美元;谷歌在用5400亿个参数训练PaLM时使用了6144个TPU.曾经有一个关于盲目“提炼大模型”的质疑,资本市场因为大模型的应用而拒绝下注,“多才多艺”的大模型离“生存危机”越来越近。
并不是大模式缺乏商业故事。按照大规模预训练的思路,大规模模型细分场景的微调在一定程度上给出了人工智能落地长尾场景的最优解,大规模模型在小样本训练的情况下也有较好的改善。
不缺大模特的落地场景。AIGC在2022年开始流行。投资机构红杉(Sequoia)在2022年发表的一篇分析文章中特别提到,生成式AI有可能产生数万亿美元的经济价值,进一步增强了相关企业家的信心。
但在2023年之前,资本市场很少关注大模式,只有智普AI等少数企业获得融资。与此形成鲜明对比的是,AIGC轨道上的初创企业长期以来一直是资本的宠儿。资本宁愿在应用层面的AIGC轨道上试错,也不愿为大模型烧钱。
正如熊彼特在《经济发展理论》中所说,资本是创新的杠杆。如果只有企业和科研院所在花大价钱“提炼”大模型,缺乏资本产生的杠杆,大模型的价值和应用场景可能很难脱离“学术”二字。
ChatGPT就像一个火炬,不仅完全吸引了外界的目光,还可能为大模型的商业化指明方向。
一个直接的例子就是微软的“反常行为”。先是向OpenAI投资100亿美元,随后又宣布将ChatGPT整合到其全线产品中。比尔盖茨和纳德拉频频上ChatGPT平台,再到ChatGPT版本的Bing和Edge浏览器,甚至废除了工业元宇宙部门为ChatGPT让路,就像摆出了一副All in AI的新姿态。微软的真正动机还不得而知,但映射到外界眼中的是,微软正在开启AI的商战,大模式已经迎来商业化元年。
OpenAI也在不断释放好消息:2月1日,宣布推出付费订阅版ChatGPT Plus,向用户收取每月20美元的费用;同时,OpenAI预测2023年营收将达到2亿美元,2024年营收有望超过10亿美元。
其实早在2020年,OpenAI就开始寻求商业化。GPT-3不再是完全开源的代码,而是提供了一个商业API,允许开发者调用大模型的一些能力,并逐步开放Dall E2、Whisper等大模型的API接口。客户调用OpenAI的API,获得图像、语言、代码生成能力,进而赶超AIGC,OpenAI从中收取接口费,初步形成了从模型开发、应用开发到消费的完整产业链。
故事讲到这里,似乎让人看到了大模型的可观前景:当国内大大小小的互联网公司争先恐后地推出各种版本的ChatGPT时,必然会聚焦于提供底层能力的大模型,为国内大模型市场注入一股活水。
如果再乐观一点,即使ChatGPT的大潮会消退,只要通过试错探索出大模型的商业化路径,资本的注意力最终还是会聚集到底层技术上,并转化为源源不断的投资,赋予大模型可持续的驱动力。
04写在最后
现实的残酷在于,新物种崛起时,会习惯性地吹起层层泡沫,尤其是这几年,泡沫被戳破的时间周期越来越短。
2021年初爆炸的Clubhouse,一个多季度后宣布“破产”;2022年初的元宇宙下半年被AIGC抢走;ChatGPT引发的新热潮会是个例外吗?情感上,我们希望ChatGPT带来一场熊熊大火,点燃人工智能的产业革命。
可惜现在所有的假设还是建立在理想的假设上,现实中还有太多的不确定性,我们还需要跨过一座又一座的山头。
09
2023-03
04
2023-03
22
2023-02
22
2023-02
22
2023-02
19
2022-10