在我们设想的未来世界中,大部分的人工智能都拥有自主性,它们会及时、主动地帮助我们,而不是等待我们输入指令。而且,它们没有领域、行业的限制,也不需要我们对AI技术了解多少直接就能使用。
(资料图片)
回到现在,相信大多数人面对AI工具,都会有一种“无从下手”的感觉——即便我们知道它“无所不能”,但是我们并不知道如何让它运作起来,来真正帮助我们的生活与工作。
不过现在,未来更近了。拥有自主性的AI工具已经出现——最近AI领域热议的AI Agents,又被称为自主人工智能、自主代理,已经能够达到自行拆解宏观任务并执行的水平。比如,你可以让自主代理帮你制定一份市场推广方案,但是并不需要你一步步告诉它怎么做。
当然,想要大规模采用自主代理,还需要在执行、算力、数据等方面突破障碍。但是仍然不能否认的是,自主代理的潜力巨大。
在过去的九个月,我们迎来了数次人工智能创新浪潮,每一次都扩展我们对AI潜力的认知。
去年夏天,能够通过文本或图像提示生成艺术作品的深度学习模型 「稳定扩散」 (Stable Diffusion)发布;在11月,ChatGPT又将我们的注意力转向 大语言模型(LLMs) ;随着GPT-4和其他产品的推出,我们对LLMs的关注只增不减,这也让用于开发由语言模型驱动的应用程序的框架 LangChain 走进人们的视野;LangChain普及了 代理 (Agent),所以现在,自主代理产品也出现了——4月21日,AutoGPT上线不到一个月,在GitHub上的星星数量就突破了10万颗;另外BabyAGI获得了1.2万颗星,并激发了一长串项目。
或许你在困惑,什么是自主代理?简单来说, 自主代理可以看作由语言模型驱动的机器人,它们能分解复杂问题并以迭代的方式加以解决,还能代表用户采取行动。
我们可以用一个简单的例子来说明LLMs、代理以及自主代理分别能做些什么。
仅使用LLMs,我们可以找到某个城市中最好的餐馆;使用代理,我们可以让它查找评价最高且有空位的餐厅,并预定一个两人桌;有了自主代理,我们可以让它找到最符合我的日程安排并且满足我个人喜好的最佳餐厅,同时为我和朋友预订好座位。
自主代理可以通过将一个任务分解成各个子任务,并在每个步骤之间使用记忆来指导代理的行动来实现这一点。
这样,是不是就很容易理解为什么自主代理抓住了我们的集体想象力了——它们让我们很容易去想象通过LLMs的小型轻量级应用可以来实现些什么。已经有很多人尝试过使用各种代理,从电子邮件摘要(从抓取数据到综述总结)到复杂的旅行行程规划等。
听起来,自主代理像是带着AGI(通用人工智能)的曙光而来,但说不定它也只是众多次迭代的浪潮之一。因为,目前自主代理还有很多不足之处,尚处于早期阶段,它 在性能提升、用户控制和输出质量等方面还有很大的改善空间。 想要实现大规模采用,代理必须至少克服三大障碍:
1.逻辑推理≠良好的执行
原则上,驱动自主代理的GPT-4等AI具有思维链推理和将任务分解为多步骤过程的能力;但在实践中,代理常常会在执行自己的子任务时遇到困难,而且它们很难知道什么时候该“退后一步”,从而导致陷入重复同样动作的死循环,或者会因为没有什么外部反馈而对某个步骤产生“幻觉”,进而卡住。
2.计算成本
这些应用程序的架构依赖于递归循环,可能导致多次重复调用你的LLMs。如今,使用像OpenAI的API等工具,每次调用的成本相对较低,但可能会遇到API限制;而对于内置模式来说,成本方程可就会大不相同了。
3.学习
由于自主代理在启动后不再重复使用,所以它们不会从提示或先前的尝试中学习,也不会从犯下的错误中吸取太多教训。不过,帮助代理存续下去的服务即将出现,这应该会简化相应的管理。
或许,未来是一个 “代理对代理” 交互的未来:我们可以为常见任务创建专门的代理,还可以购买预先训练好的代理步骤,将项目里的部分任务、步骤“外包”并且将这些输出作为输入整合到你的下一个步骤中。换句话说, 你的人工智能可以雇佣或外包给另一个人工智能,“核心”任务可以由不同的代理来完成,而新的工具层可以作为“胶水”,将整个过程缝合起来。
要怎样才能实现这一目标?当前,我们可以依靠短期代理所使用的GPT-4 API来实现,但它的上下文窗口极其有限。所以为了发挥其全部潜力,下一代将需要做到以下几点:
• 计算意识: 将资源使用量最小化作为一个目标函数。
• 数据意识: 为任务找到并连接到正确的模型或数据源。
• 代理意识: 寻找、重用代理的生态系统并与之沟通。
• 安全意识: 检查输出和沙盒代码是第一步,此外还需要更严格的控制措施来防止滥用。
• 用户意识: 从用户行为和偏好中学习以优化性能。
(文章来源:红杉美国官网)
X 关闭
Copyright © 2015-2023 今日餐饮网版权所有 备案号:沪ICP备2023005074号-40 联系邮箱:5 85 59 73 @qq.com