掀起人工智能新浪潮的OpenAI,看上了ChatGPT之外另一条赛道
发布时间:2023-09-16 浏览量:212
在科幻剧《西部世界》中,在庞大的高科技主题乐园中,模拟真人设计的机器人可以像人类一样行事、拥有记忆、可以和其他机器人交互……在8月份,斯坦福开源了一个名为Smallville 的“虚拟小镇”,25个 AI Agents(AI智能体)在小镇上工作生活,每个“人”有自己的性格,也能和其他“人”交谈、并能结识新朋友。
斯坦福小镇中的AI Agents并不是一个新鲜的研究课题,只是之前该领域的研究通常集中在孤立环境中、通过有限的知识来进行训练,这与人类的学习过程有了很大的差异。然而,大语言模型(LLM)的出现,给这个领域的研究带来了新的曙光,这也重新掀起了基于LLM的自主AI Agents的研究热潮。
OpenAI联合创始人Andrej Karpathy在一场开发者线下活动中表示,如果一篇论文提出了某种不同的模型训练方法,OpenAI内部都会嗤之以鼻,但是当新的AI Agents论文出来的时候,他们会认真兴奋地讨论。
OpenAI AI的应用研究主管Lilian Weng发布了一篇关于AI Agents的万字长文:《大语言模型(LLM)支持的自主代理》引起了行业的热议,在文章中,她清晰地定义了基于LLM构建AI Agents的应用框架:Agent=LLM(大型语言模型)+记忆(Memory)+规划技能(Planning)+工具使用(Tool Use),其中,LLM是智能体的大脑,而其它几个部分,是关键的组件。
以上被热议的这种智能体,可以被称为Autonomous AI Agent(完全自主的智能体),它就像是拥有“记忆”一样,能够记住在训练中学习到的东西。此外,LLM可自主学习调用外部API来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。
它可以将大型任务分解为更小的、可管理的子目标,从而能够有效处理复杂的任务。它还可以对过去的行为进行自我批评和自我反思,从错误中吸取教训,并针对未来的步骤进行完善,从而提高最终结果的质量。
但是,这类智能体在目前存在致命缺陷,比如,由于以LLM作为“大脑”,智能体依赖自然语言作为LLM和记忆、工具等关键组件的接口,模型输出的可靠性是有问题的,大语言模型存在的“幻觉”,也都会在自主AI智能体存在。另外还有一些技术实现方向的困难:比如上下文长度受限制;很难完成长期规划和复杂任务的分解等。
这就造成了虽然Autonomous AI Agents被寄予厚望,但是在实际应用中,有很多硬伤,这也造成大火的Agents,在很多场景中,是完全不能被使用的。究竟应该如何看待AI Agents的前景,腾讯科技深度对谈了两位深度实践AI Agents的创始人:MRS.ai 创始人/CEO Mingke,他在AI Agents领域有五年以上的研发经验,目前所进行的项目也是以AI Agents为核心,项目正处于保密阶段;另外一位是MoPaas魔泊云创始人/CEO 鲁为民博士,在AI技术和工程领域有超过二十年的经验。
AI Agents似乎正在成为ChatGPT之后的又一个关注焦点,从行业实践来看,实用意义何在?未来应用前景何在?到底是一场正在进行的人类通往AGI的美好梦境,还是已经在重塑某些行业?两位行业老兵提出了自己的冷静思考,除了最让人激动的Autonomous AI Agents,另外一种Autopilot AI Agents的潜力,可能正在被市场低估。
核心观点
●AI Agents不是新鲜事儿,今天我们看到的新鲜部分主要是如斯坦福小镇中所看到的Autonomous AI Agent(全自主行动的人工智能体)。但是以大语言模型为底座的Autonomous AI Agent有很多目前无法避免的缺陷,让这种智能体的应用受到很大限制。
●LLM可被理解为通用逻辑模拟器,即用概率对逻辑推理的结果用低维表达,而非真正(人类习惯的符号化)逻辑推理过程的执行。任何由LLM做核心驱动的Agent,都无法承载复实际杂业务逻辑的设计与执行。
●除了Autonomous Agent,还有Non-Autonomous Agent, 其中包括AutoPilot Agent 和Copilot Agent。LLM对后两类的帮助很大,但仅靠LLM也远不够完成企业级服务。
●光靠语言模型的改进可能不足以通过大模型驱动这条路径来实现理想的自主智能体(Autonomous Agents),智能体引擎的反馈控制逻辑设计可能同样重要,甚至更为关键。
●我们可以参考自动驾驶中的分级策略,循序渐进从简单到复杂逐步实现高级别的 AI Agents,不断逼近Autonomous Agents的理想目标;另外分级科学管理AI Agents,也可以更好应对其潜在风险,充分发挥它的应用潜力。
最新热文 7天