40W
·
·
·
2025/04/05 17:48:02
·
AI 摘要
前往原文
DeepSeek新论文来了!在清华研究者共同发布的研究中,他们发现了奖励模型推理时Scaling的全新方法...
相关资讯
AI 摘要
DeepSeek新论文来了!在清华研究者共同发布的研究中,他们发现了奖励模型推理时Scaling的全新方法...
40W
·
·
·
2025年4月05日
·
AI 摘要
Transformers without Normalization? 论文链接:https://arxiv.org/pdf/2503.10622
85万热度
·
·
·
2025年3月14日
·
AI 摘要
Meta发布Llama 4系列,强调多模态和超长上下文窗口,部分模型将开源。OpenAI确认O3和O4-mini即将上线,GPT-5推迟发布但将免费。DeepSeek与清华发布新论文,提出SPCT方法和元奖励模型,显著提升推理扩展性能。
AI 摘要
去年12月,由国内大模型公司“深度求索”开发的DeepSeek应用推出的DeepSeek-V3在全球AI领域掀起了巨大的波澜,它以极低的训练成本,实现了与GPT-4o等顶尖模型相媲美的性能,震惊了业界。
108W
·
·
·
2025年1月28日
·
AI 摘要
大语言模型真的可以推理吗?LLM 都是“参数匹配大师”?苹果研究员质疑 LLM 推理能力,称其“不堪一击”!
热点推荐
换一批