客岁 10 月份,Poolside 曾经拿了 5 亿美金的新一轮融资,英伟达也参取了,其时估值听说正在 30 亿美金。此次融资,则是为了更大的愿景。Poolside 最后的产物定位也是建立一个生成式 AI 编程平台,通过 API 和编程帮手来从动化和改良软件开辟流程,次要面向企业客户,出格是那些对数据平安和私密性有高要求的客户(例如说和国防使用等)。
然而,Poolside 的创始人很快认识到,仅仅依托“扩狂言语模子规模”来告竣 AGI 存正在局限。正在 2025 年中,当我们于 2023 年 4 月正在创立 Poolside 时,行业内的叙事是,我们只需要扩狂言语模子的规模就能达到 AGI。虽然我们同意扩大算力的主要性,但我们,最主要的扩展径将是强化进修(RL)。他们认为强化进修(RL)是环节,RL 可以或许让模子从新经验和实正在世界的互动中进修,从而冲破保守 LLM 仅依赖静态文本数据的瓶颈。互联网是人类的理解、经验和思惟以言语形式压缩而成的调集。言语是一种高效的交换体例,但当消息以这种体例被压缩时,我们就无法接触到最终之前的人类思维和现实世界的输入。代码是通往 AGI 的“言语”,他们将软件开辟视为一个完满的 AGI 锻炼场。通过代码施行反馈的强化进修(RLCEF),模子能够领受到清晰、客不雅的“准确”或“错误”信号,这比人类反馈(RLHF)更高效、
Poolside 声称,虽然人工智能很快就会生成比所有人类做者加起来还要多的文本,但纯真的数量并不等同于消息密度。一本研究生程度的物理教材将几个世纪的发觉和做者数月的推理浓缩正在薄薄的几页纸中;比拟之下,平均而言,合成文本是对每一个摸索分支的冗长记实。软件工程范畴是通用智能的一个代表,它为强化进修供给了一个丰硕的,并供给了可验证的励机制,并且我们晓得若何无效地扩展这种机制。若是说互联网是我们的化石燃料,那么来自取现实世界互动的数据就是我们的可再生能源。建立通用人工智能(AGI)并非是将越来越多的文本数据塞进越来越大的神经收集;而是要从我们现有的无限数据中提炼出所有人类的经验进修和思虑,引入智能体的经验进修来挖掘取之不尽的数据,并杂乱无章、精准地使用计较能力。Poolside 将“其 AGI 径比方为一个“能源系统”:“聚变反映堆”(从现无数据中提取能量)和“风力涡轮机”(操纵 RL 来收集通过进修和摸索发生的新颖数据的能量)。别的,前两天曲播带货平台 让其估值间接涨到了 116 亿美金,看得出本钱市场对这类电商平台级产物给的估值很是高。而比来一个由大学停学生创立、操纵 AI 帮帮大师卖二手商品的产物,让我看到了 AI 正在电商里很是好的一个使用场景,做法也很简单:操纵了 AI 扫描识物和强大的消息搜刮能力,让保守需要破费良多时间上架商品的流程只需要几秒钟时间,大大提拔了……Memo(是一个基于付费订阅模式的创投内容平台,已获得大量 VC、企业 CEO 以及高管的支撑,我们但愿帮帮你捕获最具价值的行业信号、过滤乐音(Signal,Not Noise)。