AI 摘要
前往原文
硅谷风投a16z合伙人、法国开源AI公司Mistral董事会成员安杰尼·米达认为,DeepSeek的效率革命不会减缓AI行业对GPU的需求,相反AI企业可以借鉴DeepSeek的方法改进效率,在同等的算力投入下“实现10倍的产出”。
相关资讯
AI 摘要
硅谷风投a16z合伙人、法国开源AI公司Mistral董事会成员安杰尼·米达认为,DeepSeek的效率革命不会减缓AI行业对GPU的需求,相反AI企业可以借鉴DeepSeek的方法改进效率,在同等的算力投入下“实现10倍的产出”。
AI 摘要
分析认为,确实短期的用量增加全部都是因为Deepseek,客户的主要诉求是把现有的API改成Deepseek看能否做得更好。同时因为对Deepseek兴趣很大,也在咨询内存更大的卡,例如H200。但需求实际上还是Double Purchasse,客户是在保留之前API的同时,试用下Deepseek看看改善有多少,原来的Llama模型该用还是用。在试用结果确认后,会很快选定最终模型,高利用率可能不可持续。
AI 摘要
民营企业座谈会在北京召开,任正非、马化腾、马云、雷军、王传福(比亚迪)、曾毓群(宁德时代)、王兴兴(宇树科技)等多位知名企业家出席。这场重磅座谈会的参会名单释放了什么信息?
38W
·
·
·
2025年2月18日
·
AI 摘要
物联网技术DeepSeek新版模型正式发布,技术大佬们都转疯了!延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。怎么说呢,QLoRA一作的一个词评价就是:优雅。具体来说,DeepSeek V3是一个参数量为671B的MoE模型,激活37B,在14.8T高质量token上进行了预训练。在多项测评上,DeepSeek V3达到了开源SOTA,超越Llama 3.1 405B,能和......
3.2万热度
·
·
·
2025年1月25日
·
相关榜单
热点推荐
换一批