Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

admin 1 2

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  来源:第四波

  研究员|冯皓钦

  近日,科技圈有一条争议不小的消息。

  Anthropic 发布声明,指控三家中国AI公司:DeepSeek、Moonshot AI 和 MiniMax对其大模型 Claude 进行大规模“蒸馏”。

  根据披露的数据,对方通过超过2.4万个虚假账号,与Claude进行了约1600万次交互,用来抽取模型能力训练自家模型。Anthropic称,这种行为并非正常使用,而是系统化、工业级的能力提取。他们形容为“hydra cluster”,即一个 *** 同时管理大量账号,请求结构高度重复,集中瞄准推理能力、Agent工具使用、编程与思维链输出等关键能力。

Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

  Anthropic的帖子

  蒸馏是常规技术,争议在于“规模与方式”

  所谓“蒸馏”(distillation),是AI领域常见的训练 *** 。简单来说,就是利用一个性能更强的“教师模型”生成输出数据,再用这些数据训练一个“学生模型”,从而在参数规模更小、成本更低的情况下复现部分能力。

  目前在AI训练上,蒸馏被广泛用于模型压缩、轻量化部署以及能力迁移等,这本身并非新技术,也并不带有天然的违规属性。

Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

  此次争议的焦点在于方式与规模。Anthropic称,这三家公司通过共享支付方式、 *** 服务和批量化请求结构,系统性抽取Claude在推理能力、思维链输出、Agent工具使用以及编程能力等方面的表现。

  具体而言,DeepSeek被指进行超过15万次交互,侧重推理能力与思维链数据;Moonshot AI约340万次交互,聚焦Agent能力与工具调用;MiniMax数量更大,约1300万次交互,集中在Agent编排与工具使用,并被指在新版本发布后迅速切换抽取目标。

  Anthropic表示,他们通过行为识别与异常检测模型发现这一模式,并强调这种行为可能削弱模型原有的安全护栏,因此呼吁行业与云服务商采取更严格的防护措施。

  舆论分歧与“蒸馏边界”的讨论

  不过,争议很快蔓延到舆论层面。

  此次事件一出,Elon Musk 在X上隔空抨击Anthropic大规模盗用训练数据,发帖直言, Anthropic 本身也曾因训练数据问题饱受争议,并讽刺称:“你偷来的东西被偷了?”

Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

  据悉,此前,2023年Elon Musk就曾对Anthropic蒸馏其它大模型公司的数据进行嘲讽。

Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

  需要指出的是,Anthropic此前确实曾卷入过关于训练数据来源的版权诉讼,并支付了巨额赔偿,目前相关争议仍处于法律与舆论层面的博弈中。

  并且就在事件发生不久后,Elon Musk又转载一AI科技业内人士的帖子称,Anthropic公司没有得到任何人的同情。他们利用公共数据构建的封闭模式攫取价值,并招致我们目前所见的监管俘获。他们既想继续利用现有数据,又想通过特殊规则来保护自身利润。并直言到,当技术具有如此颠覆性时,这种模式无疑是有害且具有腐蚀性的。

Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

  马斯克转载的帖子

  围绕本次指控,行业内部也出现不同声音。一部分观点认为,本次争议的重点并不在蒸馏技术本身,而在具体实施方式。如果确实存在大量虚假账号、批量化请求、结构化提取模型核心能力的行为,且绕过服务条款或地区限制,那么问题已超出技术范畴,可能涉及商业合规与不正当竞争。

  也有创作者和评论者表达更为情绪化的观点,声称他们并不在乎其它公司对 Claude 进行“蒸馏”的做法。并且有评论认为,大模型本身建立在互联网公开数据之上,训练数据来源长期处于版权争议之中。在这种背景下,再以“能力被蒸馏”为由指责竞争对手,难免被解读为“贼喊抓贼”。如果AI公司可以在未经明确授权的情况下使用互联网内容训练模型,那么当模型能力被“蒸馏”迁移时,批评者的立场显得并不牢固。

Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

  从商业常识角度看,若存在绕过平台规则、大规模抽取核心能力的行为,确实容易引发争议;但从技术实践看,模型输出是否具备明确、可独占的产权属性,目前尚缺乏清晰的法律标准。

  这场黑色幽默之下,问题的关键也指向:蒸馏本身是行业常规技术,用强模型输出训练弱模型,本质上并不罕见。但当规模扩大到数千万次调用、并以虚假账号批量操作时,它究竟是正常竞争,还是违规抽取?

  事实上,包括 OpenAI 在内的多家头部企业,也曾在不同场景中采用蒸馏技术进行模型优化。区别在于,内部蒸馏与基于竞品输出训练模型之间,是否存在明确边界,目前仍缺乏统一标准。

Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

  当模型能力可以通过输出被“迁移”时,问题的核心早已不在技术本身,而在规则如何界定:什么属于合理使用,什么构成系统性能力抽取?巨头之间互相蒸馏的边界,仍然有待进一步厘清。

  

标签: #蒸馏 #模型 #能力 #Anthropic #数据 #训练 #争议 #抽取 #输出 #技术

  • 评论列表

  • 低的情况下复现部分能力。  目前在AI训练上,蒸馏被广泛用于模型压缩、轻量化部署以及能力迁移等,这本身并非新技术,也并不带有天然的违规属性。  此次争议的焦点在于方式与规模。Anthr

    2026年02月25日 00:44
  • 为可能削弱模型原有的安全护栏,因此呼吁行业与云服务商采取更严格的防护措施。  舆论分歧与“蒸馏边界”的讨论  不过,争议很快蔓延到舆论层面。  此次事件一出,Elon Musk 在X上隔空抨击Anthropic大规模盗用训练数据,

    2026年02月25日 00:08

留言评论