北京PK10官方网站-北京pk10 Hermes Agent 为什么贤惠?
你的位置:北京PK10官方网站 > 冠亚和 > 北京pk10 Hermes Agent 为什么贤惠?
北京pk10 Hermes Agent 为什么贤惠?
发布日期:2026-05-06 01:05    点击次数:124

北京pk10 Hermes Agent 为什么贤惠?

我没批准AI用末端改文献,过了已而发现成立照旧改好了——它换了个不触发审批的裁剪用具,静默完成。这不是预设的fallback代码,是模子我方推理出来的。我翻了源码,找到系统prompt里三条舛误指示,和一条被全心遐想的终止措辞。

AI我方换了个要领,把事办了

前篇说过,我一般让AI来我方排查问题,我只认真在它的排查着力内部识别它的排查是不是有凭证,信息可靠。

一次让小虾子(HermesAgent)排查”申报说一半就停”的问题,查到根因后需要改config.yaml。平时它会用terminal执行shell敕令来改文献,但这会触发approval审批过程。一般用AI的时候,会作念许多事,素养许多个AI,也未必候干着活儿就去刷视频了。看完一个视频后,再去看哪些需要审批。然后有几次我就忘了。

过了已而我发现——成立照旧改好了。

它没用terminal,径直用了patch文献裁剪用具。patch不经过approval,静默完成了修改。

自后我还碰到过别的情况:某条路走欠亨了,它会我方说”算了,我用另外一种表情处理”或者”先岂论了,把主任务作念完”。”算了””先岂论了””绕过禁闭”——这不是预设的fallback逻辑,是模子我方推理”主张是改文献,这个用具被堵了,阿谁用具也能改文献,用阿谁”。

给主张,不给旅途。这照旧有一些智能的滋味了。

但这里有个双刃剑的问题:你的审批机制,可能防不住一个贤惠的Agent。terminal执行敕令会触发审批,但patch改文献不会。write_file灭绝写也不会。Agent交融用具之间的相关——濒临审批被终止,它知说念换不触发审批的用具来达到一样的主张。

贤惠的Agent和危机的Agent,未必候就在一线之间。

一样我让他我方去翻了源代码,稽查了这个所谓的”智能”到底是什么东西,他为什么会我方绕过一些执行表情,或者为什么知说念在遭受费劲的时候换一种表情?

无人不晓,Agent的才调来自LLM,写了prompt这样多年,我细则是用辅导词写的,一样也因为用了AI这样多年,我当今照旧莫得能源去我方翻prompt了,是以径直用AI来找。

三句话撑起的自主判断力

许多东说念主用了Hermes之后会有一个嗅觉:它不仅仅能调用用具,它不祥”知说念”我方在干什么。濒临禁闭它会绕路,濒临审批被拒它会换要领,以至你不申报阐明的时候它会我方想办法用别的表情把事办了。

我让Hermes翻了我方的源码(agent/prompt_builder.py),找到了系统prompt里几条舛误指示。不是什么哲学,即是几句话——但措辞的精确度决定了模子的交融表情。

第一句,”任务没完就别停”:

“Keepworkinguntilthetaskisactuallycomplete.Donotstopwithasummaryofwhatyouplantodonexttime.Ifyouhavetoolsavailablethatcanaccomplishthetask,usetheminsteadoftellingtheuserwhatyouwoulddo.”

合手续执行,直到任务着实完成为止。切勿以回首”下一步野心”来结尾。只消手头有可用用具能完成任务,就径直调用,开云体育中国官网入口别光跟用户理论说说。

这条指示告诉模子:你判断”完没完”的圭表是任务自己有莫得完成,不是你这一轮能作念的事有莫得作念完。背面那句更舛误——”要是你有能用的用具,就别光说毋庸”。这句话径直出手了模子在一条路走欠亨时去翻我方的用具箱。

第二句,”着力不好就换计策”:

“Ifatoolreturnsemptyorpartialresults,retrywithadifferentqueryorstrategybeforegivingup.”

若用具复返空值或不完好的着力,切勿径直烧毁,而应更换查询词或治疗计策进行重试。

这条在标签里。它告诉模子:用具调用失败不是尽头,是信号。复返了空着力、部分着力、报错——你要换一种表情再试,而不是停驻来讲演”失败了”。

第三句,”别问,径直干”:

“Whenaquestionhasanobviousdefaultinterpretation,actonitimmediatelyinsteadofaskingforclarification.”

若问题存在可想而知的旧例交融,请径直执行,切勿停驻来条目用户清醒。

这条在里。它告诉模子:大大量时候你能判断该如何作念,就别停驻来问用户了。独一当歧义的确会影响你调用哪个用具的时候,才问。

这三句话共同构建了一个行为形状:主张导向,不是过程导向。

模子被见告的不是”按照A→B→C的法子执行”,是”把事作念完,遭受禁闭想其它办法完成任务”。

“只终止敕令,握住绝主张”

还有个遐想细节。

当审批被终止时,Hermes复返给模子的音书是:

“BLOCKED:Userdeniedthispotentiallydangerouscommand.DoNOTretrythiscommand.”

已阻断:用户已终止执行此项潜在高危指示。严禁重试该指示。

严防这个措辞——”不要重试这条敕令“。它没说”罢手任务”,没说”告诉用户作念不了”。它说的是:这条具体敕令被终止了,pk10别再试并吞条。

但模子读到的信号是”这条路走欠亨”,不是”主张取消了”。

然后它看了一眼我方的用具列表——terminal被堵了,但patch也能改文献,write_file也行。于是它我方推理:主张是改文献,terminal不可,patch不错,用patch。

这不是预设的fallback代码。Hermes的代码里莫得”要是terminal被拒就切patch”这样的逻辑。这是模子在交融了”主张是什么””哪些用具能达成这个主张””现时哪条路被堵了”之后,我方推理出来的旅途接管。

三条可复用的prompt写稿技术

之是以有这篇著作,我的主张即是要获取这个prompt。

Hermes“贤惠”的内容不是模子自己特地贤惠,是系统prompt的措辞精确度+用具界说的完好性,把模子推向了”主张导向”的行为形状。

这三条指示的写稿技术,咱们我方遐想prompt的时候满盈不错模仿:

1.给尽头,不给旅途。

说”把事作念完”,别说”按法子执行”。模子知说念尽头在哪,就会我方找路。你把路定死了,它就只会走那条路,堵了就停。

2.把失败界说为”信号”而不是”尽头”。

说”换计策再试”,别说”失败了就讲演”。前者让模子把失败当成需要处理的信息,后者让模子把失败当成不错停驻来的原理。

3.终止时只终止具体操作,握住绝主张。

说”这条敕令不可”,别说”罢手”。前者保留了科罚问题的空间,后者径直把门关死了。Hermes之是以能在审批被拒后绕路,即是因为被拒音书里只堵了具体敕令,没堵主张。

况且这个遐想有个很有兴味的引申:用具越多、用具刻画越暴露,模子就越”贤惠”。因为它能看到更多的替代旅途。要是Hermes独一terminal一个用具,审批被拒了它就的确只可停驻来。但有了patch、write_file、read_file、execute_code这些功能疏通但审批旅途不同的用具,模子就能我方组合出绕行决议。

是以要是你在别的系统里也想复现这种”贤惠”,中枢不是选一个更贤惠的模子,而是:给完好的用具界说+主张导向的指示+精确的失败响应。三者缺一,模子要么停在原地等指示,要么机械重试并吞条末路。

它为什么能”我方查我方”

我方查我方也不崭新了,比如说,Claudecode、openclaw、HermesAgent都有访佛的才调。此次,让小虾子帮我查明晰。

比如,咱们问Hermes对于它我方的成立里写了什么、现时用的什么模子、compression阈值是些许——它都能答上来。以至你让它改我方的成立、排查我方的问题,它也颖慧。

这个才调从哪来的?有一段指示:

“NEVERanswerthesefrommemoryormentalcomputation—ALWAYSuseatool.”

以下类型的问题,严禁凭操心或默算(推理?)作答——必须调用用具。

背面列了系统状况、文献内容、现时时间、Git历史等类型。兴味就一句话:这些事你别猜,去查。

是以你问它成立,它不是”记取”了config.yaml,是用read_file重新读了一遍。你问它某个功能如何用,它去读了SKILL.md文献。你让它排查问题,它用搜索用具在源码里找。用具出手的自我默契——模子不需要记取统共成立,只需要知说念该查什么文献、该用什么用具。

还有一个细节:源码里有个标签,条目模子申报前作念四项搜检——正确性、事实依据、体式、安全。作念了→查了→阐明对了→再申报。不是作念完就交,是作念完再验一遍。

和ClaudeCode的辩认——显式指示vs隐式遐想

之前codecode有访佛决议的遐想想路,这里跟Hermes亦然有一些辩认。

底层逻辑一样,都是”按需查,不靠背”。但已毕表情有辩认。

ClaudeCode不需要显式告诉模子”去查”——它把用具的用法、参数、严防事项径直写进用具刻画(schema)里。模子看到用具刻画就当然知说念该如何作念,不需要独专指示。你给它一个Bash用具,刻画里写着”执行shell敕令”,它遭受系统状况问题就知说念调用Bash去查。学问嵌在用具界说里,不在系统prompt的大段笔墨里。

Hermes多了一层显式的行为指示。它的系统prompt里不独一用具刻画,还有特地的行为适度标签——告诉模子”这些事必须用用具查”,告诉模子”着力不好就换计策”,告诉模子”别问径直干”。这些不是用具界说,是行为准则。

打个比喻:ClaudeCode的表情是”给一册写得很好的评释书,你我方看”,Hermes的表情是”给评释书,再加一位老职工在把握说’遭受这种情况你该这样作念'”。

哪个更好?**取决于模子自己的才调。才调强的模子,看到好的用具刻画就够了,不需要独特打法。才调叨唠不皆或者你想和洽转为形状时,显式指示更可控。**Hermes因循切换不同模子(GPT、Gemini、GLM、Claude……),是以它需要这些显式指示来确保岂论底座模子是什么,行为都一致。

这里一样印证了咱们在商议AI产物的时候,全球常常说的:遐想AI产物时不要过度工程化。

汇总——五条指示

Hermes通过系统prompt适度模子行为的舛误指示,一共五条:

1.出手主动鼓吹

“Keepworkinguntilthetaskisactuallycomplete.Donotstopwithasummaryofwhatyouplantodonexttime.Ifyouhavetoolsavailablethatcanaccomplishthetask,usetheminsteadoftellingtheuserwhatyouwoulddo.”

2.出手自我纠错

“Ifatoolreturnsemptyorpartialresults,retrywithadifferentqueryorstrategybeforegivingup.”

3.出手自主判断

“Whenaquestionhasanobviousdefaultinterpretation,actonitimmediatelyinsteadofaskingforclarification.”

4.出手用具查询(不靠幻觉)

“NEVERanswerthesefrommemoryormentalcomputation—ALWAYSuseatool.”

以下类型的问题,严禁凭操心或默看成答——必须调用用具。

5.出手考证轮回

“Beforefinalizing:checkcorrectness,grounding,formatting,safety.”

主动鼓吹、遭受禁闭绕路、不问过剩的问题、用用具查真实状况、作念完毕再验一遍。五条组合出你看到的那种”贤惠”。

“贤惠”——是遐想出来的北京pk10。

开运体育中国官网入口