DeepSeek创始人梁文峰:
>>浙江大学机器视觉专业
>> 2015 年,30 岁时,推出 High-Flyer 量化对冲基金
>>赚大钱(now资产管理规模达 80 亿美元)
>>希望开发“人类”级别的人工智能作为副业,并向合作伙伴推介,但他们最初持怀疑态度
>> 2021 年购买 10,000 块 H800 芯片,并招募其顶级对冲基金员工(他们都有丰富的经验,可以为基金充分利用 Nvidia GPU)
>> 2023 年推出 DeepSeek,并聘请了数十名来自中国顶尖大学(北京大学、清华大学和北航)的博士
>>为科技人才提供最高薪资,中国只有字节跳动能与之匹敌……希望 DeepSeek 成为领先的“本土”公司
>>美国出口限制迫使 DeepSeek 团队发挥创造力,他们找到了新的训练方法,使 LLM 模型 (V3、r1) 能够与 OpenAI、Anthropic、Gemini、Grok、LLama 等相媲美,而成本仅为其二十分之一
>>培训成本并不完全相同,但方法新颖,效率明显提高(还有关于复制其他模型、他们可能无法谈论的更大的 H-100 集群和/或中共支持的问题)
>>开放来源并发布方法(r1 推理论文有 200 多位作者)
>> DeepSeek 刚刚登上 App Store 榜首
下一篇
已是最新文章