前往原文
全网热点
综合
热点
娱乐
财经
科技
游戏
社区
购物
开发
区块链
华尔街见闻
.
资讯最新
19
LLM的范式转移:RL带来新的 Scaling Law
资讯最新
·
华尔街见闻
·
2024/10/24 20:43:44
·
前往原文
AI 摘要
前往原文
在新范式下,LLM 领域的 scaling law 会发生变化:计算量变大仍会带来模型智能的提升,但会从模型参数量变大,转移到 inference-time compute 增加,也就是模型进行更多 RL 探索。
前往原文
相关资讯
LLM的范式转移:RL带来新的 Scaling Law
AI 摘要
在新范式下,LLM 领域的 scaling law 会发生变化:计算量变大仍会带来模型智能的提升,但会从模型参数量变大,转移到 inference-time compute 增加,也就是模型进行更多 RL 探索。
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
Grok 3用20万GPU帮AI界做了个实验:Scaling Law没撞墙,但预训练不一定
AI 摘要
目前可以提高模型效果的Scaling方法,按照性价比由高到低排序的话:Test time Scaling Law RL Scaling Law预训练阶段Scaling Law。如果哪天RL Scaling Law和Test Time Scaling Law到了天花板,又没有找到新的性价比更合算的Scaling Law,仍然可以回归预训练阶段的Scaling Law。
资讯最新
·
华尔街见闻
·
2025年2月20日
·
前往原文
出海是中国的scaling law
AI 摘要
天风宏观认为,从长远看,不管中国企业出海的动机是主动还是被动,最后都汇集到了国际化这条必经之路上。它们通过出海变成了一张更大的网,把产业链、供应链、利益链分散了到更多国家和地区,这也是中国的scaling law。
资讯最新
·
华尔街见闻
·
2024年10月31日
·
前往原文
微软CTO:AI大模型的“Scaling Law”还能走多远
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
微软CTO:AI大模型的“Scaling Law”还能走多远?
AI 摘要
Kevin Scott表示,过去20年里,人工智能领域最重要的进步都与“规模”有关;OpenAI的潜力在于未来可能成为构建AI平台的基础;数据的质量比数量更重要。
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
Scaling Law要撞墙了吗?如何找到基座大模型的未来方向?
AI 摘要
"如果把参数规模扩大x倍,模型能力就会得到y倍的提升" ——这条支撑着AI领域几年狂飙突进的Scaling Law,似乎正在走向尽头。 从GPT-3到GPT-4,从BERT到PaLM,AI的进化史几乎就是一部算力竞赛史。但最近的发展却给这个故事带来了转折:Claude 3在维持3.2B上下文的同时显著压缩了参数规模;Anthropic的研究人员公开表示"更大的模型未必更好";DeepMind在近期论文中更是直指Scaling Law在逼......
热度累计中
·
知乎热榜
·
知乎
·
2025年1月10日
·
前往原文
真正的LLM Agent
AI 摘要
Alexander的观点很明确:未来 AI 智能体的发展方向还得是模型本身,而不是工作流(Work Flow)。他认为像 Manus 这样基于「预先编排好的提示词与工具路径」构成的工作流智能体,短期或许表现不错,但长期必然遇到瓶颈。这种「提示驱动」的方式无法扩展,也无法真正处理那些需要长期规划、多步骤推理的复杂任务。而下一代真正的 LLM 智能体,则是通过「强化学习(RL)与推理(Reasoning)的结合」来实现。
资讯最新
·
华尔街见闻
·
2025年3月23日
·
前往原文
扎克伯格:“Scaling Law”还没有到极限
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
OpenAI附议Ilya预训练终结!“但Scaling Law还没死”
AI 摘要
OpenAI大神Noam Brown表示,AI从2019年到现在,难以置信的成就都来自于数据和算力规模的扩大,但大语言模型仍然无法解决像井字棋这样的简单问题。而o1带来了Scaling的新的维度,是一种以推理计算为代表的Scaling。
资讯最新
·
华尔街见闻
·
2024年12月16日
·
前往原文
谷歌重磅推出全新Scaling Law,智能的未来将是分布式的?3万亿美元AI面临岔路
AI 摘要
谷歌推出的DiLoCo分布式训练方法,其Scaling Law比数据并行更稳健、更优越、更高效、更强大,其模型规模越大优势越明显,有效解决通信瓶颈,为大模型训练开辟新可能。网友称DiLoCo可能会重新定义Scaling的方式。
资讯最新
·
华尔街见闻
·
2025年3月16日
·
前往原文
华尔街见闻
相关榜单
资讯最新
热点推荐
换一批
1
甲亢哥被三折叠手机惊艳下单三台
2
毛新宇携家人清明回韶祭祖
热
3
踏春赏花享胜景 文旅融合热力足
4
网友实车演示小米SU7辅助驾驶
新
5
陈芋汐全红婵包揽世界杯冠亚军
热
6
美媒曝美财长受不了想辞职
7
甲亢哥与机器人斗舞
新
8
对向车道多车逆行 司机驾车顶回去
新
9
揭秘藏在节气里的农事密码
10
深圳地铁辟谣发生人员踩踏
11
美民众谈关税政策:是一场灾难
新
12
谢浩男妹妹发视频回应父母离婚争议
新
13
中国反制美国加征关税力度有多强
热
14
6家商会发声明反对美加征关税
15
全美掀起1200多场反特朗普抗议
新
16
甲亢哥坐车身子探出天窗被交警警告
热
17
美国超市物价暴涨30%
热
18
吴镇宇认为许绍洋反派塑造脸谱化
19
甲亢哥试坐“飞行汽车”吓出表情包
20
美投资人喊话:是时候开始囤货了
热
21
美国对华加征关税背后想下什么大棋
热
22
特朗普为何声称“中国最不该这样”
热
23
大张伟回应和甲亢哥合作
24
专家:美国打贸易战犯下三大错误
25
大V:中国对等反制让特朗普“破防”
26
美国进入紧急状态是在逼谁
27
美国亿万富翁提醒民众囤货
28
国产机器人再跳电影《功夫》斧头舞
29
周鹏:上海需破解广东现有的防守
30
胡锡进:全世界最惊慌的是特朗普
31
甲亢哥最喜欢在少林当和尚那场直播
新
32
胖东来拟起诉宋清辉
新
33
中国为何首个反制美对等关税
34
小孩哥带好友回家吃饭大方介绍家人
35
甲亢哥爆火幕后推手是谁
36
关税战升级 中国股市未来怎么走
37
男子为几千元帮人买黄金被刑拘
新
38
老外总结这些年“白学了”的中文
39
美关税大刀为何让“台独”分子哀嚎
40
美国州长:特朗普要把国家搞破产
41
媒体:“科技感”贯穿甲亢哥深圳行
新
42
老人离世留财产给保姆要求操办海葬
43
主人一番操作后母鸡被迫收养鸡苗
44
卤鹅哥给甲亢哥送上家乡非遗好礼
新
45
网友野餐抓到大鱼 热心大爷帮杀鱼
46
台名嘴:两岸若爆发战争台湾必输
47
直击缅甸震后125小时生命救援
新
48
特朗普就职以来美股蒸发8万亿美元
49
“人口增量第一城”易主
50
小车为躲避大车突然的变道发生车祸