人类历史上,任何伟大的科技创新都不是权力规划出来的,一定是在权力的阳光关怀不到的地方,依靠科学家自发的兴趣和责任感,依靠市场和民间的自发力量异军突起的。
Deepseek无疑是这两年全球科技界最有爆炸力的话题,因为它不仅仅是一场技术的革命,也涉及到大国竞争。关于这款科技产品的讨论已经持续了半个多月,这两天全球主流媒体依旧每天在做深度分析和报道,这也是史无前例的,即便是当初的ChatGPT也没有达到如此的热度。
在正式话题开始之前,笔者首先谈谈关于如何清晰公正评估Deepseek出现的历史意义的问题。目前国内有两种截然不同的看法,一种是过于夸大Deepseek出现的意义,认为这是中美科技竞争的“斯大林格勒战役”,国运级别的,证明了中国的文化和体制优势,以及美国的日薄西山、江河日下。
我始终非常讨厌“国运”这个词,股票一涨、科技创新成果稍微有点成果,就说国运来了,似乎你想挡都挡不住,就享受这泼天富贵吧。如果说近代之前,在封闭的国际环境下以及几乎静止的技术进步条件下,中国社会发展还有个固定的历史周期,在如今全球化多变的环境中,已没有什么“国运”可言。如果非要说有国运这东西,它无非是创造一种宽松、开放、自由的制度,把各种生产要素的活力调动起来,历史是混不过去的,不用在基础工作没有打牢的情况下,就开口闭口讲国运。
关于Deepseek的技术革命意义,这个应该由行业专家说了算,笔者作为技术盲也无权置喙。不过综合专业人士的意见,我们可以这么认为:Deepseek只不过是我们在模型领域的一个暂时领先,中美人工智能竞争方面,尽管中国是唯一有力量和美国匹敌的国家,但是中国跟美国还是有不小的差距,一款产品的出现并不意味着获得了整体竞争的胜利,我们在基础科研、算力设备等关键要素上与美国还有巨大差距。
另一个极端就是竭力否定Deepseek的意义,集中概括起来,无外乎:Deepseek是造假,是盗用了外国的技术,自己没有原创,它在收割国民的爱国智商税,以及欺骗国家领导人,你赞扬DS就是无脑自嗨,是一种夜郎自大。
并且很有意思的事,这种抹黑集中于中文自媒体,反倒是严肃的英文媒体没有这么多的质疑,《纽约时报》《华尔街日报》《经济学人》之类都是褒扬的声音多。这种极力否定Deepseek的声音,跟中国一些知识分子的固有批判思维有关,也跟还在高度复杂的信息战有关——不排除其中有竞争国政府释放的舆论烟雾弹。
这种言论以客观理性的面貌出现,很多人信以为真。不过Deepseek火爆以来,尽管它被诟病,但是它更得到了全球人工智能行业最权威人士的普遍性肯定。当全球几千名、几万名专家一致聚焦于你的产品时,你能经得住半个月的考验,并经过天文数字级的使用验证,这说明你的东西的确是几下子,并非吹出来的,或造假出来的。
话归本文的正题。对于Deepseek的出现,不同的人会看到不同的价值,对于我们致力于研究经济和社会现代化研究的人来说,它的出现,给予更多的是如何构建我国的创新体制和创新路径的启发。
在中美科技战的背景下,社会对于我国科技创新投入了超乎寻常的关注,中央也提出了自主创新和新型举国体制创新路径等理念体系,以快速提升中国的原创力,减少对外部依赖,降低风险。
尽管大家的目的是明确的、一致的,但对于如何实现自主创新,社会上的不同群体,基于价值和视野的不同,提出的路径、对策也不同。实践是验证真理的唯一标准,Deepseek的出现,以及综合数年来不同创新路径的结果比较,可以帮助我们更好地思考这个问题,确立一些关键性的原点认知。
第一, 政府的角色问题,或产业支持方式问题。这些年来我们的政府为了赢得科技战争的胜利,依托财政专项投放或央企产业基金,给很多企业都给予鼎力支持,投入的资源可谓是惊人的,但是效果并不是太让人满意,甚至产生了腐败。
最典型的就是芯片领域的国家大基金,2014年以来三期累计投入6800多亿,尽管对我国芯片产业发展起到了很大促进作用,但是搞了十年卡脖子状况依然没有破局,最后还形成腐败窝案,七位创始人中有六位落马。
Deepseek可以用横空出世和石破天惊来出现,不仅出乎公众的意料,也出乎官方的意料,因为它并非是在政府基金的关怀下成长起来的,也不是从来没有得到过任何科技规划的资助,总之它在出名之前只不过是“一棵无人知道的小草”。而细心的网友也发现,很多拿了天文数字公帑的,由众多院士领衔的国家人工智能重点项目,却乏善可陈,科研成果两三年都不更新。
人类科技史也充分表明,任何创新奇迹都不是政府重点关怀和规划出来的,一定是在权力的阳光关怀不到的地方,依靠科学家自发的兴趣和责任感,依靠市场和民间的自发力量异军突起的。
所以对于产业创新路径,笔者认为如何科学定位政府角色,以及改变资源分配方式非常关键。创新中不能没有政府,不能贬低看得见手的力量,美国政府的角色和作用也是越来越大,但是这只手以何种方式出现是个非常大的学问,最忌讳的是政府亲自直接下场经营、规划,过于积极的角色一定会导致腐败和产能过剩等问题,最终搞垮这个产业。
现在有人担忧Deepseek的未来,由于它太优秀了,政府怎么跟它保持关系是一个很关键的问题。笔者认为要给予深度探索这家公司空间,不能过度关注、关心,更不能管束太严厉,给它一个自由的空间,它才能更多成长的机会。
另外,这两天江苏官媒开始反思,为什么同是长三角中心城市,南京在创新上远远落后于杭州。笔者认为,根本上还是在于两地市场发育程度和权力的边界问题,南京过去计划经济太发达,至今依然是一个权力主导型的经济(比如2023年南京百强企业中民企仅有29家,民企和外资企业营收占比仅为38%),而杭州是民间市场主导的经济。有什样的土壤就结什么样的果,所以,南京最大的民企(如南京钢铁、金浦、红太阳、金鹰等)仍然都是集中于权力主导的钢铁、化工、地产等产业,大家没有兴趣搞消费领域科创,而杭州的民企更贴近于市场主导的消费应用和创新路径。
第二,开放和参与全球的重要性。现在一谈起科技自主创新,很多人立即想起来要像过去搞“两弹一星”一样,关起门来、勒紧裤腰带搞建设,我们不依靠任何外人,也不跟任何外人打交道。
其实这种创新方式仅仅适用于战时状态下的国防工业,而不适用于今天民用万千领域的竞争,原子弹的价值更多体系在有和无,而不像今天民用领域科技竞争,更多体现在细微的效率和质量,随时要接受全球消费者的检验。
即便是当时的国防重工体系的科研路径,也与我们所想象的也不尽一样。“两弹一星”的主要科研带头人,95%以上具有国外留学背景,他们更多是在复制和使用之前所学到的西方20世纪上半叶科学技术成果;在封闭的环境下,我们重工业技术进步仍然离不开对进口设备的依赖,前期而言主要是苏联设备,即便是文革期间,我国对技术进口的依赖也仍在持续增加,1973年中国进口额是1959年两倍,只不过进口渠道从苏联变为法国、联邦德国和日本。所以,自力更生是一种精神,一种哲学,而非一种完全依靠自己的状态。
虽然Deepseek团体几乎全部是本土高校毕业,但是这个团队的创新仍然得益于之前储存的美国最先进的芯片,以及对国外人工智能知识的充分掌握,这都是依托中国高度参与全球化背景下完成的,而不是一种闭门造车。
任何一种有价值的高端科技都一定全球竞争性的,它只有在国际化的环境中得到修正、完善,封闭的环境不会保护企业(百度的历程似乎是当下最好的证明)。高度的封闭一定是苏联模式的结果:有庞大的科研系统和世界最高昂的科研支出,而没有科创产业、没有影响世界的产品。所以,中国的科技未来仍在于开放,在于参加全球化。
第三,关于金融与创新生态。世界上最有活力的创新生态,莫过于创新团队、金融和商业应用之间形成的完美创新生态,目前对于当下的我国来讲,创业人才比较充足,商业应用市场大,应用模式创新也源源不断,最大问题在于创新所依赖的金融支持不够。
很多人认为Deepseek的成功证明了中国创新生态并不存在严重问题,甚至优于美国,笔者仍认为Deepseek是科创产业持续低迷下的一个孤例,一个幸运儿,这也是它能够引发这么多关注和惊叹的一个客观原因。
创业初期企业面临的风险极高,中国中小企业平均寿命仅为2.5岁,言外之意,半数以上企业在2.5年之内被淘汰。另外,根据2018年深圳市市场监督管理局对该市188万家企业存续时间的统计,只有24%的企业寿命超过5年,因此,传统意义上的银行,以及以保值增值、维护国有资产安全为主要目标的国资产业基金,都不愿意为有高度风险的创新提供初期发展资金。
这种情况下,市场上的风险投资和私募基金对于支撑科创产业极为重要,他们为创新起到了资金池和担保的作用,凡是创新活跃的地方,都是市场风险投资行为发达的地方。但是,我国最近几年投资市场规模急剧萎缩,2021年VC/PE投资规模为14228亿,而2024年降低到6036亿,减幅达近60%,已经退回2016年的水平。国际比较上,中美科创市场从基本并驾齐驱,到去年中国科创投资额仅相当于美国的8%(美国VC/PE实际投资总额为10475亿美元),这种差距引发的长期效应,未来可能会进一步放大。
因此,我们一方面要防范资本无序扩张带来的资源浪费和误导性作用,另一方面也要看到其积极的一面,对创新不可或缺的一面,政府和资本界要合力构建一个健康的科创金融生态,为创新提供必备的动力,这样才会有更多Deepseek出现,否则这只能是一枝独秀。
第四, 关于破除功利主义,重视基础研究、基础设施、基础原创性人才的价值。最近《纽约时报》有一篇文章对深度探索这家公司大加赞赏,认为它并不是简单去模仿美国科技公司,而是很重视在基础领域探索,以及团队内部有大量跨领域的人才。不过,美国人赞赏深度探索这家企业独特性的背后,也折射出中国科研和教育中忽视基础研究和基础原创性人才培养问题。
支撑人工智能技术源源不断创新的首先是数学、计算科学、物理,以及心理学、语言学、哲学这些基础学科的发展。我国虽然每年SCI论文发表量早已经超过美国,但基础研究仍是落后很多。2022年,我国基础研究占R&D总经费的比例仅为6.2%(OECD国家在12-23%之间),绝大多数(83.3%)投入到应用性试验上,有本末倒置之嫌。尽管中国清华大学、北京大学科研论文发表量超过了哈佛、MIT,但是近五年我国前五位高校的基础研究高引论文数量仅为美国前五名高校的42%左右。在人工智能领域,尽管中国的总论文发表量和专利数量超过美国,但是高引基础研究方面仅为美国三分之一左右。基础研究的落后是中国AI产业大而不强的关键制约因素之一。
另外,人工智能大模型背后依赖数据“基建”。全球十大云计算平台中,美国占八家、中国仅占两家。最近十年以来,腾讯、阿里、华为等构建的云计算平台,为人工智能创新提供了很好的基础,这仍是远远不够的,我们还需要提高我国的云计算能力。
Deepseek的另一个特点在于其创始团队并没有像往常一样,唯名牌大学学历是用,而是更侧重于考虑兴趣和基础积累。梁文峰最近在回答媒体采访时说:“我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意”。
笔者认为Deepseek的出现,也是对过去中国教育模式和人才聘用模式的一个警示。我国高等教育仍没有摆脱专才教育和论文教育的窠臼,导致生产的博士数量全球第一,而可用之才少。这些年无论招聘还是选项目也首先看是不是藤校、北清复交学历,其实决定创造力的并不是文凭标签,而是你的好奇心、责任感,以及跨学科的知识储备。
人类的自然科学创新史证明了这一点,笔者在人文社科领域研究的所察所感,也证明了这一点。比如在笔者熟悉的经济学、历史学领域,大量精英学校路线成长起来的高学历者,并没有产生与学历成正比的学术能力和影响力,反而最优秀的经济学家、历史学家是从物理系、土木工程系走出来的,是从普通211学校、双非学校走出来的,这充分证明兴趣和跨学科积累是创造力之源。
所以Deepseek既是对技术路线的颠覆,也是对政策路径、科研教育模式、社会判断价值的善意警示,我们只有做出顺应性的调整,才能培育出更多的Deepseek,根本提升中国的创新能力。
来源:阜成门六号院