deepseek v3模型为啥要开源？ - 知乎热榜 - 知乎

2024年12月25日，deepseek官网与api已更新V3模型官网显示模型名为deepseek-V3-600B Deepseek V3的Aider代码能力排行榜正确率为48.4%，仅次于OpenAI o1，超过Claude 3.5 Sonnet。幻方量化旗下模型DeepSeek上线V3版本|界面新闻 · 快讯

3.1万热度

知乎热榜

知乎

2024年12月27日

前往原文

最新全球模型榜单：阿里 Qwen2.5-Max超DeepSeek V3

AI 摘要

在最新的全球大模型榜单中，阿里的最新大语言模型Qwen2.5-Max排名第7，领先于DeepSeek V3、O1-Mini和Claude-3.5-Sonnet等顶级专有大语言模型，在数学和编程方面排名第一，在处理复杂任务的硬提示（hard prompts）方面排名第二。

资讯最新

华尔街见闻

2025年2月05日

前往原文

如何预期DeepSeek传言中的R2新模型

AI 摘要

DeepSeek R2 预计基于 V3 基座模型，利用现有路线、算力及 infra 能力，有望实现推理等能力提升，对标 o3 完整版，并且会继续开源。

2025年2月26日

AI 摘要

什么是推理大模型？DeepSeek R1推理大模型与DeepSeek V3模型的区别是什么？什么时候该使用推理大模型？

49万热度

2025年3月09日

新

18W

微博热搜

微博

2024年10月24日

前往原文

Synthetix V3财政委员会启动V3迁移

精选快讯

金色财经

2024年10月24日

前往原文

谷歌开源Gemma-3模型：支持多模态、128K输入，27B版本在大模型匿名竞技场超过DeepSeeK V3，免费商用授权

AI 摘要

12日，Google开源了第三代Gemma系列大模型，共包含4个不同参数规模版本，第三代的Gemma 3系列是多模态大模型，即使是最小的10亿参数规模的Gemma 3-1B也支持多模态输入。

资讯最新

华尔街见闻

2025年3月12日

前往原文

国产之光 DeepSeek 把 AI 大佬全炸出来了，对 AI 行业竞争格局有何影响？

AI 摘要

物联网技术DeepSeek新版模型正式发布，技术大佬们都转疯了！延续便宜大碗特点的基础之上，DeepSeek V3发布即完全开源，直接用了53页论文把训练细节和盘托出的那种。怎么说呢，QLoRA一作的一个词评价就是：优雅。具体来说，DeepSeek V3是一个参数量为671B的MoE模型，激活37B，在14.8T高质量token上进行了预训练。在多项测评上，DeepSeek V3达到了开源SOTA，超越Llama 3.1 405B，能和......

3.2万热度

知乎热榜

知乎

2025年1月25日

前往原文