算力成本又挨“一刀”！DeepSeek开源周首日：开源FlashMLA，AI推理速度再进化 - 资讯最新 - 华尔街见闻

相关资讯

算力成本又挨“一刀”！DeepSeek开源周首日：开源FlashMLA，AI推理速度再进化

AI 摘要

DeepSeek发布为英伟达Hopper GPU优化的高效MLA解码内核FlashMLA，专门设计用于处理可变长度序列，展现出卓越的计算效率。分析称，通过使用FlashMLA，可以在更少的Hopper GPU服务器的情况下部署完成相同的任务量，而无需昂贵的硬件升级，使推理成本大大下降。

资讯最新

华尔街见闻

2025年2月24日

前往原文

“源神”DeepSeek 突破H800性能上限 FlashMLA重磅开源算力成本还能降

24小时热文

金色财经

2025年2月24日

前往原文

DeepSeek开源代码库FlashMLA

bilibili热搜

哔哩哔哩

2025年2月24日

前往原文

算法冲破算力瓶颈 DeepSeek继续开源

15W

头条热榜

今日头条

2025年2月25日

前往原文

DeepSeek 开源周第一天开源的项目 FlashMLA，有哪些亮点值得关注？

AI 摘要

2 月 24 日，DeepSeek 第一天的开源项目 FlashMLA 正式发布。 DeepSeek 官方在 X 平台发文称：「很荣幸能分享 FlashMLA —— 我们专为 Hopper GPU 优化的高效 MLA 解码内核，不仅支持变长序列处理，现在已经投入生产使用。 ✅ 支持 BF16 ✅ 分页 KV 缓存（块大小 64） ⚡ 在 H800 上实现 3000 GB/s 的内存带宽 & 580 TFLOPS 的计算性能」据官方介......

35万热度

知乎热榜

知乎

2025年2月24日

前往原文