40万热度
·
·
·
2025/01/03 10:15:06
·
AI 摘要
前往原文
自己留着挣钱不行吗,openai就不是这样,国内的公司反而开源
相关资讯
AI 摘要
自己留着挣钱不行吗,openai就不是这样,国内的公司反而开源
40万热度
·
·
·
2025年1月03日
·
AI 摘要
2024年12月25日,deepseek官网与api已更新V3模型 官网显示模型名为deepseek-V3-600B Deepseek V3的Aider代码能力排行榜正确率为48.4%,仅次于OpenAI o1,超过Claude 3.5 Sonnet。幻方量化旗下模型DeepSeek上线V3版本|界面新闻 · 快讯
3.1万热度
·
·
·
2024年12月27日
·
AI 摘要
在最新的全球大模型榜单中,阿里的最新大语言模型Qwen2.5-Max排名第7,领先于DeepSeek V3、O1-Mini和Claude-3.5-Sonnet等顶级专有大语言模型,在数学和编程方面排名第一,在处理复杂任务的硬提示(hard prompts)方面排名第二。
AI 摘要
DeepSeek R2 预计基于 V3 基座模型,利用现有路线、算力及 infra 能力,有望实现推理等能力提升,对标 o3 完整版,并且会继续开源。
AI 摘要
什么是推理大模型?DeepSeek R1推理大模型与DeepSeek V3模型的区别是什么?什么时候该使用推理大模型?
49万热度
·
·
·
2025年3月09日
·
18W
·
·
·
2024年10月24日
·
AI 摘要
12日,Google开源了第三代Gemma系列大模型,共包含4个不同参数规模版本,第三代的Gemma 3系列是多模态大模型,即使是最小的10亿参数规模的Gemma 3-1B也支持多模态输入。
AI 摘要
物联网技术DeepSeek新版模型正式发布,技术大佬们都转疯了!延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。怎么说呢,QLoRA一作的一个词评价就是:优雅。具体来说,DeepSeek V3是一个参数量为671B的MoE模型,激活37B,在14.8T高质量token上进行了预训练。在多项测评上,DeepSeek V3达到了开源SOTA,超越Llama 3.1 405B,能和......
3.2万热度
·
·
·
2025年1月25日
·
相关榜单
热点推荐
换一批