AI 摘要
前往原文
中国AI创业公司DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,因为在前者的低成本高歌猛进下,后者无法解释自己的超高预算的合理性。Meta的Llama 3系列模型的计算预算多达3930万H100 GPU Hours—— 如此计算量足可训练DeepSeek-V3至少15次。
相关资讯
AI 摘要
中国AI创业公司DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,因为在前者的低成本高歌猛进下,后者无法解释自己的超高预算的合理性。Meta的Llama 3系列模型的计算预算多达3930万H100 GPU Hours—— 如此计算量足可训练DeepSeek-V3至少15次。
AI 摘要
这些小组的任务包括分析DeepSeek如何降低训练和运行成本、研究其使用的数据集、以及探索如何改进Meta的Llama模型。Meta希望通过这些努力,能够在即将发布的Llama 4中实现技术突破。
相关榜单
热点推荐
换一批