49W
·
·
·
2025/04/05 17:48:02
·
AI 摘要
前往原文
DeepSeek新论文来了!在清华研究者共同发布的研究中,他们发现了奖励模型推理时Scaling的全新方法...
相关资讯
AI 摘要
DeepSeek新论文来了!在清华研究者共同发布的研究中,他们发现了奖励模型推理时Scaling的全新方法...
49W
·
·
·
2025年4月05日
·
AI 摘要
Transformers without Normalization? 论文链接:https://arxiv.org/pdf/2503.10622
85万热度
·
·
·
2025年3月14日
·
AI 摘要
去年12月,由国内大模型公司“深度求索”开发的DeepSeek应用推出的DeepSeek-V3在全球AI领域掀起了巨大的波澜,它以极低的训练成本,实现了与GPT-4o等顶尖模型相媲美的性能,震惊了业界。
108W
·
·
·
2025年1月28日
·
AI 摘要
大语言模型真的可以推理吗?LLM 都是“参数匹配大师”?苹果研究员质疑 LLM 推理能力,称其“不堪一击”!
热点推荐
换一批