DeepSeek R1的出现,如同在平静的AI领域投下了一颗重磅炸弹,引发了全球范围内的热议。其宣称以极低的成本(600万美元)实现了与美国巨头公司耗资数十亿美元才能达到的效果,这一说法立即引起了OpenAI和Anthropic等公司的回应,两大巨头试图淡化DeepSeek带来的冲击和对其技术领先地位的潜在威胁。
Anthropic CEO阿莫迪发表长文,系统分析了AI发展的三大定律,试图解释DeepSeek的成功并非技术上的突破性进展,而是行业发展趋势使然。这三大定律分别是:
阿莫迪认为,DeepSeek-V3在某些任务上接近了美国最先进模型的性能,其训练成本显著降低,这与行业成本下降趋势相符,并非技术上的巨大飞跃。DeepSeek团队在工程优化方面确实有所成就,例如在键值缓存管理和专家混合架构等方面,但Claude 3.5 Sonnet在多个关键评估中仍领先DeepSeek。
OpenAI首席研究员Mark Chen也对DeepSeek R1做出回应,肯定了DeepSeek在模型研发过程中的一些核心思想,但强调外界对DeepSeek成本优势的解读有些过头。Chen提出了“双轴优化”(pre-training and reasoning)的概念,并提到了“蒸馏技术”和“成本与能力解耦”的趋势,暗示OpenAI在成本控制和模型优化方面同样具有实力。
与阿莫迪和Chen相对谨慎的态度不同,纽约大学教授Gary Marcus则认为DeepSeek对OpenAI构成了实质性威胁。他指出DeepSeek基本上免费提供了OpenAI想要收费的东西,这可能会严重影响OpenAI的商业模式。此外,Marcus还强调DeepSeek比OpenAI更开放,这将吸引更多人才。
然而,DeepSeek的成功也引发了关于地缘政治的讨论。阿莫迪指出,DeepSeek是第一个实现成本优化的中国公司,这在以往从未有过,具有重大的地缘政治意义。但这并不意味着美国公司将落后,因为他们也在沿着同样的技术路线前进。
总而言之,DeepSeek的出现引发了关于AI发展趋势、技术创新、成本控制以及地缘政治竞争等多方面的讨论。虽然DeepSeek的成功值得关注,但其是否真正超越了行业趋势,还需要时间和进一步的研究来验证。而对于OpenAI等美国巨头而言,DeepSeek的挑战无疑将促使他们进一步加快技术创新和成本优化的步伐。