DeepSeek公布推理新论文

AI 摘要

大语言模型真的可以推理吗？LLM 都是“参数匹配大师”？苹果研究员质疑 LLM 推理能力，称其“不堪一击”！

2024年10月24日

如何评价 Meta 新论文 Transformers without Normalization？

AI 摘要

Transformers without Normalization？论文链接：https://arxiv.org/pdf/2503.10622

85万热度

知乎热榜

知乎

2025年3月14日

关税刷屏的一周，AI圈也“暗流涌动”：Llama 4来了，O3和O4-mini也要来了，DeepSeek R2和GPT-5也不远了？

AI 摘要

Meta发布Llama 4系列，强调多模态和超长上下文窗口，部分模型将开源。OpenAI确认O3和O4-mini即将上线，GPT-5推迟发布但将免费。DeepSeek与清华发布新论文，提出SPCT方法和元奖励模型，显著提升推理扩展性能。

2025年4月06日

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

AI 摘要

DeepSeek和清华的研究者提出了一种新方法——自我原则点评调优（SPCT），用于推动通用奖励建模在推理阶段实现有效的可扩展性，最终构建出DeepSeek-GRM系列模型。同时引入了元奖励模型（meta RM），进一步提升推理扩展性能。

2025年4月04日

DeepSeek 公布模型推理成本利润细节，透露了哪些关键信息？

AI 摘要

一天的总收入为 $562,027，成本利润率 545%DeepSeek：DeepSeek-V3 / R1 推理系统概览

14万热度

2025年3月01日

2025年3月01日

10美元成功复现DeepSeek顿悟时刻，3B模型爆发超强推理！微软论文实锤涌现

AI 摘要

来自荷兰的开发者采用轻量级的RL算法Reinforce-Lite，把复刻成本降到了史上最低！同时，微软亚研院的一项工作，也受DeepSeek-R1启发，让7B模型涌现出了高级推理技能。

2025年2月22日