中国DeepSeek登顶美APP Store 全球刷屏震撼业界除夕再发新模型

侨报网 > 中国

时间: 2025-01-27 23:46

【侨报讯】近日，中国人工智能公司深度求索（DeepSeek）发布的大模型DeepSeek-R1震动业界，该模型使用更低的成本和更小的算力规模，实现了足以匹敌美国顶尖AI模型的效果。北京时间1月27日，苹果App Store中国区免费榜显示，近一周全球刷屏的DeepSeek一举登上首位。同时，DeepSeek在美国区苹果App Store免费榜从前一日第六位飙升至第一位。令人惊叹的是，DeepSeek除夕（1月28日）又抛出新模型——Janus-Pro，且文生图测试优于OpenAI。

综合香港文汇报、香港中通社、澎湃新闻报道，北京时间1月27日早上，中国国产AI Deepseek在中国和美国区苹果App Store免费榜上一路从第六位飙升至第一位。超越ChatGPT及Meta公司旗下的社交媒体平台Threads，Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。DeepSeek现象引发美国各大媒体争相报道。

美国媒体的报道称，DeepSeek-R1的出色表现已经给美国科技行业留下深刻印象，其开源模型成为行业关注与分析焦点。

深度求索在1月20日发布了DeepSeek-R1模型，该公司表示，DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，其性能比肩美国OpenAI o1正式版。为促进技术社区的充分交流与创新协作，深度求索还公开了DeepSeek-R1训练技术。

今日（28日），DeepSeek又发布开源多模态模型Janus-Pro，其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。

“Meta的生成式AI部门正处于恐慌中”

事件的起因是美股投资网出现的一则消息，一位Meta的工程师在美国科技公司员工社区Blind中这样写道，“Meta的生成式AI部门正处于恐慌中”。

“一切源于DeepSeek-V3的出现，它在基准测试中已经让Llama 4相形见绌。更让人难堪的是，一家‘仅用550万美元训练预算的中国公司’就做到了这一点。”

工程师们正在争分夺秒地分析DeepSeek，试图复制其中的一切可能技术。这绝非夸张。

这也是DeepSeek引人关注的另一个原因。 DeepSeek是 “仅用不到600万美元训练预算”出的大模型，成本之低仅是Meta部门里一个高管的薪资。

“令人惊叹” 美企转用DeepSeek

英伟达高级研究科学家范麟熙（Jim Fan）称赞DeepSeek取得了突破，他在社交平台X上发文称，DeepSeek-R1完全由强化学习驱动，“这让人想起了AlphaZero，从零开始学习围棋、象棋和国际象棋，而不是先模仿人类大师的动作。”

DeepSeek-R1的表现引起美国科技行业的高度关注。硅谷风险投资家马克·安德森（Marc Andreessen）表示：“DeepSeek-R1是我见过的最令人惊叹、最令人印象深刻的突破之一。”

旧金山AI硬件公司Positron的联合创始人巴雷特·伍德塞德（Barrett Woodside）表示，最近他和同事一直在讨论DeepSeek的开源模型，“这太酷了。”

一些美国企业也开始在工作中使用DeepSeek。硅谷一家创业公司的联合创始人安东尼·普奥（Anthony Poo）告诉《华尔街日报》，他们原先使用Claude模型预测财务回报，但现在已转向DeepSeek，两者性能相似，使用DeepSeek的成本仅为Claude的四分之一，“OpenAI的模型有着极佳的性能，但我们不想为我们不需要的能力付费。”

不仅如此，DeepSeek的开发成本和使用的算力规模都远低于美国顶尖AI公司。先前发布的DeepSeek-V3在仅使用2,048颗英伟达H800 GPU的情况下，完成了6,710亿参数模型的训练，成本约为560万美元，这远低于其他顶级模型的训练成本。美媒指出，H800的算力要弱于英伟达H100等芯片，美国限制对华出口此类高性能芯片。

《华尔街日报》提到，作为对比，美国AI企业、Claude模型开发商Anthropic首席执行官达里奥·阿莫代伊（Dario Amodei）去年曾透露，该公司构建模型的成本约为1亿至10亿美元。

投行富瑞（Jefferies）分析师指出，DeepSeek开发的开源大语言模型使用极少的计算能力，就达到了与GPT-4o相当的性能。该行认为，对算力需求的重新评估可能导致相关企业2026年AI领域的资本支出下降或不再增长，这也解释了人工智能相关的半导体股票遭到抛售的原因。“海外人工智能公司一直在不惜一切代价追求模型改进，但DeepSeek的情况可能促使投资者对这些算力投资提出尖锐问题。”富瑞称。

开源是强心剂专家：未来AI或会更民主化

清华大学新闻学院、人工智能学院教授沈阳指出，在开源的推动下，AI技术不再是少数几家技术巨头的专属领地，它开始向更多参与者开放。“这不仅仅是技术和资源的再分配，更在于全球技术创新的全新生态系统的建立。”

“也许，未来的AI会更加民主化，更多创意和进步会从全球范围内的无数小型团队和初创公司中诞生，而非少数大型机构的闭门造车。”沈阳表示，开源同样是一剂强心剂，技术共享并非止于代码的开放，它还意味着思想的交汇、智慧的碰撞，开源让全球的研究人员和开发者能够站在一个共同的平台上，快速迭代、快速创新。

分享到: