Mistral推出Mistral Large 2：对标Llama 3.1 405B - 资讯最新 - 华尔街见闻

本次共发布三款Llama 3.1模型，其中Llama 3.1 405B包含4050亿个参数，这是Meta迄今为止最大的模型。扎克伯格称Llama 3.1为“艺术的起点”，将对标OpenAI和谷歌公司的大模型。同时，Meta和英伟达实现强强联手，英伟达AI Foundry将为全球企业提供Llama 3.1模型的定制服务。

资讯最新

华尔街见闻

2024年10月24日

前往原文

开源大模型的ChatGPT时刻？备受期待的Llama 3 405B即将发布

AI 摘要

分析认为，Llama 3 405B不仅仅是人工智能能力的又一次提升，对于开源 AI 来说，“这是一个潜在的 ChatGPT 时刻”。在基准测试中，Meta Llama 3.1 在GSM8K、Hellaswag等多项测试中均优于 GPT-4o。

资讯最新

华尔街见闻

2024年10月24日

前往原文

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

AI 摘要

Llama 3.1-405B版本性能极强、参数巨大，普通的GPU无法带动，因此个人开发者可能无法担负。有网友“泼冷水”，认为该模型推理成本提升了3倍，但编码的性能却要差很多。

资讯最新

华尔街见闻

2024年10月24日

前往原文

Meta Llama 3.1-405B AI 模型多项跑分超越 GPT-4o，如何评价该款模型？

AI 摘要

IT之家 7 月 23 日消息，网友在 LocalLLaMA 子 Reddit 板块中发帖，分享了 4050 亿参数的 Meta Llama 3.1 信息，从该 AI 模型在几个关键 AI 基准测试的结果来看，其性能超越目前的领先者（OpenAI 的 GPT-4o）。这是开源人工智能社区的一个重要里程碑，标志着开源模型可能首次击败目前最先进的闭源 LLM 模型。如基准测试所示，Meta Llama 3.1 在 GSM8K、Hella......

42万热度

知乎热榜

知乎

2024年10月24日

前往原文

如何看待阿里云紧追Meta开源百余款大模型，性能超越Llama 405B，有可能实现弯道超车吗？

AI 摘要

9月19日云栖大会，阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5，旗舰模型Qwen2.5-72B性能超越Llama 405B，再登全球开源大模型王座。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型，每个尺寸都有基础版本、指令跟随版本、量化版本，总计上架100多个模型，刷新业界纪录，通义在卷基模这件事情上是没有停过的，国内大模型会实现弯道超车吗？

26万热度

知乎热榜

知乎

2024年10月24日

前往原文

如何评价英伟达新发布的桌面AI超级电脑project digits？

AI 摘要

128GB内存，$3k售价，1P flops（fp4），4T存储一块能跑200B模型（int4），两块能跑Llama 3 405B 很明显是冲着Mac Pro来的我是真心动啊

18万热度

知乎热榜

知乎

2025年1月07日

前往原文

Mistral AI 宣布将推出新模型，性能将超越 DeepSeek，其可能在哪些方面实现突破？

AI 摘要

据华尔街日报报道，Mistral AI 宣布将发布一款超越 DeepSeek 的新模型。 Mistral AI 公司 CEO Arthur Mensch 在 MWC 2025期间表示，Mistral 近期将发布一款非常强大的模型，且该模型将超越 DeepSeek。Mensch 认为，DeepSeek 是开源领域的贡献者而非竞争对手，并且 Mensch 同意开源模式鼓励企业相互借鉴，形成良性竞争，推动 AI 技术的整体发展。 Mensch......

54万热度

2025年3月12日