开源大模型的ChatGPT时刻？备受期待的Llama 3 405B即将发布 - 资讯最新 - 华尔街见闻

相关资讯

AI 摘要

分析认为，Llama 3 405B不仅仅是人工智能能力的又一次提升，对于开源 AI 来说，“这是一个潜在的 ChatGPT 时刻”。在基准测试中，Meta Llama 3.1 在GSM8K、Hellaswag等多项测试中均优于 GPT-4o。

资讯最新

华尔街见闻

2024年10月24日

前往原文

Meta发布LLAMA 3.1 405B开源人工智能模型

2024年10月24日

164W

2025年4月06日

如何看待阿里云紧追Meta开源百余款大模型，性能超越Llama 405B，有可能实现弯道超车吗？

AI 摘要

9月19日云栖大会，阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5，旗舰模型Qwen2.5-72B性能超越Llama 405B，再登全球开源大模型王座。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型，每个尺寸都有基础版本、指令跟随版本、量化版本，总计上架100多个模型，刷新业界纪录，通义在卷基模这件事情上是没有停过的，国内大模型会实现弯道超车吗？

26万热度

知乎热榜

知乎

2024年10月24日

前往原文

Mistral推出Mistral Large 2：对标Llama 3.1 405B

AI 摘要

Mistral Large 2拥有1230亿参数。在多个基准测试中（特别是在代码生成和数学领域），表现优异，甚至与Llama 3.1 4050亿参数相媲美。像Mistral NeMo一样，它经过大量源代码和多语言数据的训练，提供高级函数调用功能。

资讯最新

华尔街见闻

2024年10月24日

前往原文

Meta发布最大开源AI模型Llama 3.1，英伟达新AI代工加持，云伙伴助阵

AI 摘要

本次共发布三款Llama 3.1模型，其中Llama 3.1 405B包含4050亿个参数，这是Meta迄今为止最大的模型。扎克伯格称Llama 3.1为“艺术的起点”，将对标OpenAI和谷歌公司的大模型。同时，Meta和英伟达实现强强联手，英伟达AI Foundry将为全球企业提供Llama 3.1模型的定制服务。

资讯最新

华尔街见闻

2024年10月24日

前往原文

Llama 3.1 405B--大力出奇迹

AI 摘要

Joe表示，Llama 3.1 405B 真正关注的是推动规模化（它使用16000个GPU在15万亿个token上进行训练），他对它将实现的零样本工具使用以及它在提炼和生成合成数据以教授较小模型方面的作用感到兴奋。

资讯最新

华尔街见闻

2024年10月24日

前往原文

如何评价英伟达新发布的桌面AI超级电脑project digits？

AI 摘要

128GB内存，$3k售价，1P flops（fp4），4T存储一块能跑200B模型（int4），两块能跑Llama 3 405B 很明显是冲着Mac Pro来的我是真心动啊

18万热度

知乎热榜

知乎

2025年1月07日

前往原文

如何评价Meta刚刚发布的LLama 4系列大模型？

AI 摘要

刚刚，当地时间2025年4月5日，Meta 发布了 Llama 4 系列模型。其中的Maveric的预览版已经登录LMArena，以1417分排行第2。发布博客：https://ai.meta.com/blog/llama-4-multimodal-intelligence/ 模型卡：https://www.llama.com/docs/model-cards-and-prompt-formats/llama4_omni/ 模型地址......

48万热度

2025年4月06日

2025年3月07日