相关资讯
AI 摘要
英伟达主任工程师陈源博士发文称:De­e­p­S­e­ek是用模型蒸馏技术做出来的,它是通过已有的大模型蒸馏出小模型,再用少量数据对这些小模型进行微调而成。(by NVIDIA ( 英伟达 )主任工程师,硅谷陈源博士)兼听则明。推特上这篇关于DeepSeek的分析非常全面和很...
254万热度
·
·
·
2025年2月02日
·
AI 摘要
2024年12月,DeepSeek-V3在全球AI领域掀起巨大波澜,它以极低的训练成本,实现了与GPT-4o等顶尖模型相媲美的性能,震惊业界。随着DeepSeek推出新模型DeepSeek-R1,1月27日,Deepseek应用登顶苹果中国地区和美国地区应用商店免费App下载排行榜,在美区下载榜上超越ChatGPT。 同一时间,网络阴暗角落有很多声音称DS是GPT蒸馏的产品。 我的问题有三:什么是蒸馏?怎么蒸馏闭源的GPT?GPT能不能......
69万热度
·
·
·
2025年2月20日
·
AI 摘要
据《金融时报》消息,OpenAI表示已经发现证据,证明DeepSeek利用他们的模型进行训练,这涉嫌侵犯知识产权。 具体来说,他们发现了DeepSeek“蒸馏”OpenAI模型的迹象。即使用更大模型的输出来提高较小模型的性能,从而以较低成本在特定任务上取得类似结果。 微软也开始调查DeepSeek是否使用OpenAI的API。硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿
3万热度
·
·
·
2025年2月01日
·
AI 摘要
如何看待OpenAI宣称DeepSeek违规“蒸馏”?
239万热度
·
·
·
2025年1月31日
·
AI 摘要
近日,OpenAI宣称发现了证据表明DeepSeek使用其专有模型来训练自己的模型,违反了服务条款中的“蒸馏”禁令。
7W
·
·
·
2025年1月30日
·
相关榜单
热点推荐
换一批