【侨报讯】近日,中国人工智能公司深度求索(DeepSeek)发布的大模型DeepSeek-R1震动业界,该模型使用更低的成本和更小的算力规模,实现了足以匹敌美国顶尖AI模型的效果。北京时间1月27日,苹果App Store中国区免费榜显示,近一周全球刷屏的DeepSeek一举登上首位。同时,DeepSeek在美国区苹果App Store免费榜从前一日第六位飙升至第一位。令人惊叹的是,DeepSeek除夕(1月28日)又抛出新模型——Janus-Pro,且文生图测试优于OpenAI。

综合香港文汇报、香港中通社、澎湃新闻报道,北京时间1月27日早上,中国国产AI Deepseek在中国和美国区苹果App Store免费榜上一路从第六位飙升至第一位。超越ChatGPT及Meta公司旗下的社交媒体平台Threads,Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。DeepSeek现象引发美国各大媒体争相报道。

美国媒体的报道称,DeepSeek-R1的出色表现已经给美国科技行业留下深刻印象,其开源模型成为行业关注与分析焦点。

深度求索在1月20日发布了DeepSeek-R1模型,该公司表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,其性能比肩美国OpenAI o1正式版。为促进技术社区的充分交流与创新协作,深度求索还公开了DeepSeek-R1训练技术。

今日(28日),DeepSeek又发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。

“Meta的生成式AI部门正处于恐慌中”

事件的起因是美股投资网出现的一则消息,一位Meta的工程师在美国科技公司员工社区Blind中这样写道,“Meta的生成式AI部门正处于恐慌中”。

“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。”

工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。

这也是DeepSeek引人关注的另一个原因。 DeepSeek是 “仅用不到600万美元训练预算”出的大模型,成本之低仅是Meta部门里一个高管的薪资。

“令人惊叹” 美企转用DeepSeek

英伟达高级研究科学家范麟熙(Jim Fan)称赞DeepSeek取得了突破,他在社交平台X上发文称,DeepSeek-R1完全由强化学习驱动,“这让人想起了AlphaZero,从零开始学习围棋、象棋和国际象棋,而不是先模仿人类大师的动作。”

DeepSeek-R1的表现引起美国科技行业的高度关注。硅谷风险投资家马克·安德森(Marc Andreessen)表示:“DeepSeek-R1是我见过的最令人惊叹、最令人印象深刻的突破之一。”

旧金山AI硬件公司Positron的联合创始人巴雷特·伍德塞德(Barrett Woodside)表示,最近他和同事一直在讨论DeepSeek的开源模型,“这太酷了。”

一些美国企业也开始在工作中使用DeepSeek。硅谷一家创业公司的联合创始人安东尼·普奥(Anthony Poo)告诉《华尔街日报》,他们原先使用Claude模型预测财务回报,但现在已转向DeepSeek,两者性能相似,使用DeepSeek的成本仅为Claude的四分之一,“OpenAI的模型有着极佳的性能,但我们不想为我们不需要的能力付费。”

不仅如此,DeepSeek的开发成本和使用的算力规模都远低于美国顶尖AI公司。先前发布的DeepSeek-V3在仅使用2,048颗英伟达H800 GPU的情况下,完成了6,710亿参数模型的训练,成本约为560万美元,这远低于其他顶级模型的训练成本。美媒指出,H800的算力要弱于英伟达H100等芯片,美国限制对华出口此类高性能芯片。

《华尔街日报》提到,作为对比,美国AI企业、Claude模型开发商Anthropic首席执行官达里奥·阿莫代伊(Dario Amodei)去年曾透露,该公司构建模型的成本约为1亿至10亿美元。

投行富瑞(Jefferies)分析师指出,DeepSeek开发的开源大语言模型使用极少的计算能力,就达到了与GPT-4o相当的性能。该行认为,对算力需求的重新评估可能导致相关企业2026年AI领域的资本支出下降或不再增长,这也解释了人工智能相关的半导体股票遭到抛售的原因。“海外人工智能公司一直在不惜一切代价追求模型改进,但DeepSeek的情况可能促使投资者对这些算力投资提出尖锐问题。”富瑞称。

开源是强心剂 专家:未来AI或会更民主化

清华大学新闻学院、人工智能学院教授沈阳指出,在开源的推动下,AI技术不再是少数几家技术巨头的专属领地,它开始向更多参与者开放。“这不仅仅是技术和资源的再分配,更在于全球技术创新的全新生态系统的建立。”

“也许,未来的AI会更加民主化,更多创意和进步会从全球范围内的无数小型团队和初创公司中诞生,而非少数大型机构的闭门造车。”沈阳表示,开源同样是一剂强心剂,技术共享并非止于代码的开放,它还意味着思想的交汇、智慧的碰撞,开源让全球的研究人员和开发者能够站在一个共同的平台上,快速迭代、快速创新。