尽管“底层大模型已不值得投资”的论调,在一级市场日渐成为主流,但在这短短半年里,大模型依旧创造了3200亿的造福神话。只是方向,悄然发生了变化。
先看一组数据,今年以来,马斯克的xAI完成60亿美金B轮融资,估值达180亿美金 (约合人民币1307亿) ;OpenAI“叛将”创立的Anthropic,拿到了亚马逊追加投资的40亿美金,估值约200亿美金 (约合人民币1452亿) ;号称法国版OpenAI的Mistral,获得了6亿欧元投资,估值60亿欧元 (约合人民币465亿) 。
这三家企业承包了半年来海外大模型融资的前三甲,融资总额超过770亿人民币,估值总和更是达到了恐怖的3224亿人民币。更有趣的是,这三家企业都有一个共同点——坚持开源。
也就是说,海外资本市场在半年内,通过狂撒超过770亿元,扶植起了一批开源大模型的超级独角兽。而在今年年初,犹记得“模型应该开源还是闭源”的问题,引发了李彦宏、周鸿祎、王小川、杨植麟等人的激烈争论。
而在短短半年后,曾经的争议,竟然催生了一笔价值3200亿的大生意……
01 开源才能让大厂恐惧
“我们没有护城河,OpenAI也没有。”
在去年5月的一份内部文件中,一位谷歌研究员这样写道。这位研究员认为,虽然OpenAI与谷歌在大模型方面你追我赶,但真正的威胁来自于开源社区。
彼时,OpenAI通过GPT-4确立了自己的霸主地位,但一家由法国人创办的开源社区公司——HuggingFace同样异军突起,迅速引起了全世界的关注。
HuggingFace就像一个AI版GitHub,通过提供大量高质量的开源模型与工具,开发者可以在HuggingFace上调用、测试、微调开源模型,并以此开发专属应用。从而极大降低AI的技术门槛,也让大模型的能力惠及了更多开发者。
虽然HuggingFace的标志是一张“笑脸”,但在商业上,它却是能让OpenAI和谷歌恐惧的对手。
要理解HuggingFace的威力,可以参考黄仁勋对其的评价: “拥有200万用户,超过25万个模型,以及5万个数据集的,最受AI开发者喜爱的平台之一。”
在加了一系列眼花缭乱的定语后,黄仁勋用了一个戏谑的说法:“我们 (英伟达) 很幸运能与HuggingFace达成合作,并通过提供英伟达AI超算,帮助开发者在HuggingFace更加高效地完成模型训练与微调。”
现如今,能让黄仁勋低头奉上GPU的公司,实在是凤毛麟角。
去年,甲骨文董事长埃里森伙同马斯克,一起请黄仁勋吃了一顿高级日料。按照埃里森后来回忆:“席间马斯克和我在乞求,我想用这个词来形容我们再恰当不过了。吃了一个小时寿司,也乞求了一个小时。”
这两位商界大佬乞求的自然是英伟达GPU,但最终两人都未能如愿。
与之相反的,HuggingFace不但拿到了英伟达GPU,还格外受黄仁勋重视,其原因当然不是HuggingFace当前的商业价值,超过了甲骨文或特斯拉,而是 开源本身代表着大模型未来发展的另一大方向。
360公司创始人、董事长周鸿祎就认为, 大模型发展并非只有一条路,大家应该相信开源的力量。
周鸿祎表示:“开源意味着不闭门造车,不重复发明轮子。开源社区为什么这么发达?因为当前者贡献了一些想法和代码,后者在前者基础上受到启发,又会贡献一些新知识,相当于没有一个公司在主导,但是很多公司的成员又都参与其中,大家共享成果。”
除了短期效益,从长期竞争角度,押注开源同样很有必要。最直接的因素在于——谁都无法真正预测未来。未来是OpenAI的闭源模型一统江湖,还是开源模型百花齐放,仍然是未知数。因此,从降低风险角度,相比全盘押注闭源,总有机构愿意分散投资开源模型。
02 OpenAI杀灭了其他可能
当然,一位硅谷投资人Eric也告诉小饭桌:“投资开源模型的一大原因还在于,OpenAI已经杀灭了其他可能,大家都清楚,几乎不可能再投出一家OpenAI了……”
朱啸虎也曾分享,在2023年上半年每周会给金沙江创投的美国团队打一个电话,交流中美之间AIGC有哪些新动向。但打了半年电话之后他选择不打了,因为“没有意义”。朱啸虎表示:“美国的大模型确实很牛逼,中国投资投不进去,今天的估值投进去也没有意义了。”
而随着时间进入2024年,越来越多投资人意识到 OpenAI的成功几乎完全不可复制。
比如在最直观的用户增长上,2022年底ChatGPT一经问世,用户量在两个月内破亿,成为了历史上用户增长最快的应用,时至今日ChatGPT的月活是1.8亿。
ChatGPT创历史记录的C端成绩,意味着其他模型公司要重走TOC之路,难度极高。但开源模型却从TOB端提供了一条路径。
上海人工智能实验室领军科学家林达华教授就旗帜鲜明地指出:“从To B角度,开源会比闭源更好,因为它有更大的开放性去做二次开发。虽然未来闭源模型厂商会推出平台化服务,开发者在上面用标准化工具可以做单一行业和垂直方向的模型。但由于各行各业的需求非常复杂和多样化,可能并非一套标准化的工具链就能全部覆盖。”
百川智能创始人王小川也认为,从To B角度,开源闭源其实都需要,并且未来80%的企业都会用到开源的大模型。“因为闭源没有办法对产品做更好的适配,或者成本特别高,闭源可以给剩下的20%提供服务。二者不是竞争关系,而是在不同产品中互补的关系。”
换句话来说,虽然在TOC端,大模型已经很难复刻ChatGPT的增长神话,但 在TOB企业服务侧,开源模型很可能更符合企业需求。
比如很多企业和机构会有隐私需求,希望自己掌控整个模型的迭代,但他们既没有基础模型,也不愿投入太大成本。在这种情况下,开源模型就是最好的选择。因为企业可以基于开源模型,做各种细节上的二次开发和定制,训练符合自身需求、同时由自己掌握的模型。
林达华教授就预测:“未来开源模型的模式,将支撑经济体系里大量的产业需求。”
考虑到TOB端变现更加明确的特性,开源模型所代表的TOB之路,同样具有极大市场潜力。
03 开源也容易被大厂收购
关于大模型公司如何与巨头共存的问题,朱啸虎曾经做过一个悲观的预测:“在美国,最终大部分 (大模型) 会被巨头并购。而中国大模型则很难,即使被并购,也很难出好价格,就是买个团队。”
在此,我们不妨顺着这个问题延伸一下 ——假设大模型创企发展不及预期,巨头们会愿意并购哪些大模型公司?
除了OpenAI,这个问题的答案恐怕还要包括开源模型厂商。
首先从历史上看,虽然软件巨头们大都靠闭源起家,但开源公司已经证明了自己独特的收购价值。
比如全球最大的开源技术社区GitHub,在2018年被微软以75亿美金收购。在此之前,微软第二任CEO史蒂夫·鲍尔默曾将开源文化视作“癌症”、“毒瘤”,是一种不可能成立的商业模式。
但时间证明了鲍尔默决策的失误。随着GitHub上开发者数量超过1亿,GitHub早已成为了全球程序员编程的必需品,开发者可以将自己的代码放心地托管在GitHub,也从这个平台获得需要的代码。
正如微软在宣布收购GitHub的公告中写道:“开发者是新时代的建造者,用代码构建世界。GitHub就是他们的家。”
而把时间拉回到现在,开源大模型同样具有极高的商业价值。
首先开源大模型虽然用户数量相比闭源未必占优,却能网罗更多开发者。
开源的特性决定了,其吸引的更多会是开发者而非普通用户。因为普通用户本就不具备开发能力,所以不会被开源吸引。会被开源大模型吸引的用户,更多还是有能力对模型进行微调的人,即所谓的开发者。
而只有开发者才是能真正打动软件巨头的稀缺资源,因为巨头最不缺的就是用户,稀缺的反而是能升级产品的开发者。
微软曾在官网写道:“每个行业创造的价值和成长,更多取决于开发者所做的决定。只有所有开发者团结起来、合作、分享代码并互相辅助才能产生真正的力量。社区的力量我们有目共睹,软件开发和开发者也是这样。”
如果能通过收购开源大模型公司,帮助巨头吸引到更多开发者,这笔账显然非常划算。
另一方面, 收购开源大模型公司,同样可以是巨头们对自身业务团队的补充。
截至目前,已经有多家巨头开始了对开源模型业务的探索。
比如Meta已经确立了“AI为先”的公司新战略,并推出了LLAMA开源模型,随着未来生成式AI进一步发展,Meta很有可能继续在开源模型发力。包括英伟达也在最近推出了自己的开源模型nemotron-4,开源了3400亿参数版本。
做个最坏的预设,即便大模型创企最终真要卖身,卖给Meta和英伟达这样的超级巨头,总归更能卖上个好价钱。
本文来自微信公众号“小饭桌”(ID:xfzmedia),作者:黄泽正,编辑:张丽娟