Claude新指南，教你构建属于我方的智能体

发布日期：2025-01-22 14:50 点击次数：89

本文来自微信公众号：王智远，作家：王智远，原文标题：《Claude发布一套智能体构建指南》，题图来自：AI生成

上周五，2024年12月20日。Anthropic这家AI公司发布一份回报，题目是《Building effective agents》（构建高效的智能代理）。

你可能没听过Anthropic，但他们的家具你可能知说念，比如Claude系列的AI助手，有Claude 3.5 Haiku和Claude 3.5 Sonnet等等。

这份回报，是基于他们当年一年与数十个团队调和构建LLM（谣言语模子）代理系统的教训归来。我周末看了，好像有五点内容：

1. 对代理系统Agents的界说；

2. 商讨什么时候用代理系统；

3. 五种中枢的责任流模式；

4. 一些现实中的例子；

终末，给诞生者提供一些执行领路。

我以为内容对诞生者，或者对智能体、责任流感意思的东说念主挺有匡助；是以，把有价值的内容结实后，跟你申报下。

一

Agents不少东说念主听过，Anthropic这家公司怎样结实的呢？他们认为，代理不错有许多种界说。

有些客户把代理看作齐全孤独的系统，不错长时期自主运行，使用多样用具来完成复杂的任务；另一些客户则把这个词用来描述那些按照事前设定的历程运行的系统。

在Anthropic，把通盘这些不同的花式都叫作念代理系统（agentic systems），但在责任流（Workflows）和代理（Agents）之间，有很大的区别。

区别在哪呢？

责任流，是提前写好的代码来调和东说念主和用具的系统；代理是我方动态连接我方的历程和用具使用，保执对完成任务方式的摒弃。

这种区别很攻击，因为它帮咱们结实了代理系统的骨子：即，不是通盘的AI接济系统都得齐全自主，只怕候一个提前设定好的责任流更得当某些情况。

那么，什么时候该用责任流、什么时候该用智能体？

其认为，如果任务界说得很明晰，责任流更得当，因为它能提供可展望性和一致性。

如果要大鸿沟的机动性和模子驱动的决策，代理是更好的摄取，但对许多运用来说，优化单个LLM调用，配合检索和潦倒文示例频繁就够用了。

世俗地说：责任流更得当任务明确、关节固定的责任。就像你按照食谱作念菜，每一步都写得明分解白，惟一随着作念就行了。

而智能体得当要机动应酬、以权达变的情况。比如：你要去一个新城市冒险，莫得固定的阶梯，要字据推行情况来决定下一步怎样走，此时，智能体能帮你在复杂多变的环境中作念出决策。

对于界说，这是第一部老实容。第二部分是什么呢？

Anthropic提倡，目下，看到市面有四种流行诞生框挺火。辨认是：LangChain的LangGraph、Amazon Bedrock的AI Agent框架、Rivet和Vellum。

敬佩你看到名字有些结实不透，别畏俱，我和你一样，于是，索性查了一下。

先说说LangChain。它是一个用具，帮咱们创建和连接话语模子（LLM）的责任流。你不错把它假想成一个图表，帮诞生者把不同的任务和关节连起来，这么，就能明晰地知说念每一步该怎样作念，治愈起来也轻松。

接下来是Amazon Bedrock的AI Agent框架。

这是亚马逊提供的一个框架，像一个用具箱，内部有许多现成的用具和资源；帮诞生者快速搭建智能运用，你不错用它来遐想和运行多样AI任务，毋庸从新启动。

然后是Rivet，它是一个拖放式的图形用户界面（GUI）用具，特意用来构建话语模子的责任流。

咱们不错把它假想成拼积木一样，把不同的功能和关节拖到沿途，变成一个完好意思的责任历程，这种方式省略直不雅，得当不太会编程的东说念主。

终末是Vellum，它亦然一个图形用户界面用具，主若是用来构建和测试复杂的责任流；遐想完成后，你不错在Vellum里测试，确保一切浩繁运行。就像一个实验室，让你不错在内部尝试多样决策。

总的来说，四个用具区别在于：LangGraph用图表皆集任务和关节；Amazon Bedrock的AI Agent框架提供全面的用具箱，让诞生者毋庸从零启动；Rivet是一个拖放式的GUI用具，得当不懂编程的东说念主；Vellum专注于复杂责任流的遐想和测试。

Anthropic给了一个建议：

诞生者不错先径直用LLM API来诞生，因为许多功能用几行代码就能处置；如果要用框架，一定要弄懂底层代码，要戒备，框架可能会让调试变难，别因为框架功能多就乱加复杂性。

它们还终点提醒，客户常犯的一个空虚是，对框架底层竣工存扭曲。这告诉咱们，用具仅仅襄理，真确攻击的是结实背后的意思意思。

是以，论断是：1. 框架如实能让一些基本任务变省略，比如调用LLM、界说息争析用具、连络调用，但框架不应该成为咱们增多不必要复杂性的根由；2. 保执系统省略、好爱护、好调试，这才是最攻击的。

二

第三部分，回报中详备先容五种中枢责任流模式。

这部分很攻击，最初提到，辅导链式责任流（Prompt chaining）。怎样结实？

假想一下，你要完成一个复杂的写稿任务，比如写一篇很棒的营销案牍。你可能先写个大纲，检查一下大纲合分歧格，然后，再字据大纲写出完好意思的案牍。

这种责任流的重心是，把一个大任务拆成一连串的小关节。每个关节都是一个LLM调用来处理的，况兼后头的关节会用前一个关节的着力行为输入。

在这个过程里，你还不错加一些检查点（回报里叫“gate”），确保一切都在正确的轨说念上。

这种责任流最得当能明确分红几个固定小任务的情况。主要筹谋是让每个LLM调用都专注于更省略的任务，培育合座的准确性，天然可能会多花点时期。

具体例子是：

文档写稿历程：第一步，生成文档大纲；第二步，检查大纲是否顺应特定圭臬；第三步，基于审核过的大纲写完好意思文档。

上风是每个关节都专注作念一个任务，培育准确性；不错在枢纽点加质料检查；历程显露，容易调试和优化。

第二种是：路由责任流（Routing）。

这个模式挺有利思意思，处理许多用户恳求时，会遭遇多样各类的问题；有的问题省略，有的要专科技能维持，还有的可能波及退款这种明锐操作。

路由责任流，枢纽是先对问题进行分类，然后联接到最合适的处理历程，这么作念的公正很昭彰：不错针对不同类型的任务优化不同的处理方式，而不是用一个通用的主见来应酬通盘情况。

举个例子：

客户处事系统里，收到用户的问题后，路由责任流不错先判断这是个一般问题、退款恳求也曾技能维持需求，然后辨认联接到不同的处理历程。

更机灵的是，它还能字据问题的复杂度摄取用不同智力的模子。比如，省略常见的问题不错交给像Claude 3.5 Haiku这么快速的模子处理，复杂或不常见的问题不错交给像Claude 3.5 Sonnet这么浩繁的模子来解决。

这么既能保证处事质料，又能优化老本和速率，枢纽是，这种分类不错通过LLM来完成，也不错用传统的分类模子或算法。

是以，它的上风在于机动性和可推广性，随着业务的发展，你不错温暖添加新的分类和处理历程，不会影响现存的功能。

三

第三种，是并行化责任流（Parallelization），这个模式得当要同期处理好多任务。

比如：你在作念一个大格式，得同期辩论好几个方面；雷同于诞生软件，要一个模子来检查用户输入的安全性，同期另一个模子来生成代码。

并行化责任流，即是为了应酬这种要同期作念多件事的情况遐想。

回报里说，并行化主要有两种竣工方式：

1. 把任务拆成孤独的小任务，让它们同期进行，这么不错省时期；2. 通过投票机制，让好几个模子处理归并个任务，然后汇总着力；这么作念的公正是，你能从不同的角度取得不同的输出，培育着力确凿切度。

总的来说，它像一个多功能团队，每个东说念主都作念我方最擅长的事，沿途调和，终末取得一个更强的着力。

第四种，调和者-责任者责任流（Orchestrator-workers）是什么？

你在组织一场音乐会，总得有个东说念主来管大局，确保每个细节都能告成进行，这个东说念主就像“调和者”。

其他东说念主就矜重具体的活儿，比如：调音响、弄灯光、卖票这些，他们即是“责任者”，调和者得字据现场情况机动治愈谁干什么。

回报里说，调和者-责任者责任流的点子是一个中央LLM（即是调和者）来动态分拨任务，让好多责任者LLM去完成这些任务。

这么，调和者能字据推行情况，机动决定要作念哪些小活儿，而不是一启动就把关节都定死了。

这个模式得当你没法提前知说念具体要干啥的情况，比如软件诞生里的编程任务，每次字据需求，可能要改好多文献，调和者就能字据推行情况决定哪些活儿先干，哪些不错放一放。

总之，调和者-责任者责任流就像是一位带领家。

接下来说说第五种：评估者-优化者责任流（Evaluator-optimizer），这个模式得当要反复改良和响应的任务。

比如：你写著作，可能先写个草稿，然后请一又友望望，提提主见；你字据主见再修改，让著作更好。这个过程就跟评估者-优化者责任流差未几。

再举个例子，咱们搜一个东西可能要好几轮；评估者责任流，会望望当今的搜索着力满不得志要求，不得志连续搜，直到找到想要的信息。

回报里说，这种责任流的枢纽是轮回：

一个LLM先给出初步的复兴，另一个LLM来评估这个复兴，然后提供响应，这个过程不错一遍遍重叠，直到取得一个更好的着力。

公正在于它不错一遍遍改良，通过连接的响应和治愈，终末的输出质料能培育许多；是以，评估者-优化者责任流就像一个严格的裁剪，帮你把著作改得更好。

以上五种中枢责任流模式，你对哪一种印象比拟深？

记不住也不重要，有一个主见是，用个东说念主责任的方式，去镶嵌几种模式中，望望哪些业务、格式、任务得当哪一种。

四

第四部分主要敷陈了：智能代理怎样责任。其提到：代搭理先字据用户的号令或者和用户的互动，来搞明晰要干啥。一朝任务明确，代理就我方启动干活。

干活时，代理得知说念周围的情况，比如用用具取得的着力或者代码运行的响应，这么它才能知说念我方干得怎样样。

如果代理在干活的时候碰到辛苦，它不错停驻来，找东说念主问问，确保任务能告成完成；任务干结束就收尾了，但也不错先设定好一些罢手的要求，比如最多干若干次，这么能摒弃通盘过程。

在第10页中，Anthropic给了一些推行例子。

他们强调，代理终点得当处理绽放性的问题，尤其是关节不好展望的任务。因为代理能我方干活，是以，在信任它们的场合，它们能帮大忙。

比如：有个编码代理，用来解决软件工程里的任务，代理我方先望望哪些文献需要改，然后响应出来，这么能大大培育诞生的速率。

终末，第五部分里，Anthropic给出了一套诞生用具的好点子，他们以为：

1. 用具在代理系统里终点攻击。它们能让代理和外面的处事、API好好相似；是以，用具遐想和作念出来时要明晰分解，这么代理用起来才顺遂。

2. 诞生者得给模子弥散的时期想考。别让模子在生成输出的时候卡壳，用具的输入格式和参数描述要下里巴人，这么模子才能更好地结实和用这些用具。

3. 用具的界说和规格要和合座的辅导工程一样爱重。诞生者要辩论不同格式对模子发扬的影响。比如：在裁剪文献时，不错摄取用互异格式或者重写通盘文献，要确保选的格式能让模子更容易生成正确的输出。

回报还建议要多作念测试，不雅察模子怎样用用具，然后字据测试着力连接改良用具的遐想，通过运行好多示例输入，诞生者不错发现模子可能犯的空虚，然后改良。

终末，创建一个好的代理预想机接口（ACI）也很攻击，诞生者要确保用具用起来省略径直，这么用户体验才好；通过这些行为，Anthropic但愿能帮诞生者在诞生用具的时候躲避常见的坑，确保代理系统能高效运行。

可贵：[1].Anthropic. Building effective agents. 2024.12.20；地址：https://www.anthropic.com/research/building-effective-agents

本文来自微信公众号：王智远，作家：王智远

上一篇：周鸿祎微博发文：AI弥远无法替代东谈主脑，和东谈主类是配合推断

下一篇：东说念主形机器东说念主融资数亿，江苏创新企业领跑，小米机器狗幕后推手再获本钱爱重

数据安全

Claude新指南，教你构建属于我方的智能体