相关资讯
AI 摘要
2 月 24 日,DeepSeek 第一天的开源项目 FlashMLA 正式发布。 DeepSeek 官方在 X 平台发文称: 「很荣幸能分享 FlashMLA —— 我们专为 Hopper GPU 优化的高效 MLA 解码内核,不仅支持变长序列处理,现在已经投入生产使用。 ✅ 支持 BF16 ✅ 分页 KV 缓存(块大小 64) ⚡ 在 H800 上实现 3000 GB/s 的内存带宽 & 580 TFLOPS 的计算性能」 据官方介......
35万热度
·
·
·
2025年2月24日
·
AI 摘要
300行代码榨干H800、比英伟达更懂GPU、6.6TiB/s数据高铁……“开源周”活动最深远的意义,或在于其验证了DeepSeek“低成本高性能”的技术路径。
AI 摘要
如何看待DeepSeek第5天开源的Smallpond?对工业界、学术界的影响是什么? 暗涌:但你们究竟是一个商业组织,而非一个公益科研机构,选择创新,又通过开源分享出去,那要在哪里形成护城河?像2024 年 5 月这次 MLA 架构的创新,也会很快被其他家 copy 吧? 梁文锋:在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很......
36万热度
·
·
·
2025年2月28日
·
AI 摘要
DeepSeek的开源,尤其是infra开源,短期内极大地加强了英伟达生态的护城河。据了解,英伟达内部把DeepSeek的支持重要性排到了Llama之前,成为了最重要的开源项目,内部的资源和流程也是一路绿灯。
AI 摘要
DeepSeek今日宣布,接下来一周,会陆续开源5个代码库,每日都有新内容解锁,进一步分享新的进展。DeepSeek还表示,当前在线服务的模块已经经过测试、部署完备,可以投入生产环境。这个领域没有高高在上的象牙塔,只有纯粹的车库创业精神与社区共筑的创新力量。
相关榜单
热点推荐
换一批