AI代理人技能工场:我把Claude调教成了“老员工”,老板以为我偷偷加班了

小编头像

小编

管理员

发布于:2026年04月21日

17 阅读 · 0 评论

我跟你说,现在这年头,你要是还不会鼓捣AI代理人,那真跟当年不会用智能手机似的,不仅吃亏,还显得有点“out”了

上礼拜的事儿。我们部门接了个急活,要把过去三年的市场数据全捋一遍,还得按新模板生成几十份周报。搁以前,这活儿下来,不薅掉点头发是交不了差的。结果你猜怎么着?我花了不到半小时,在AI代理人技能工场里倒腾了一下,给Claude喂了几个“技能包”,剩下的活儿基本它干了大半。第二天晨会,老板盯着我看了好几秒,那眼神分明在说:“你小子是不是偷偷加班了?”

其实哪是加班,无非是让AI学会了干“人事儿”


从“人工智障”到“真能干活”,就差一个“技能工场”的距离

以前咱们玩AI,顶多是个聊天机器人,你问它答,像极了刚进公司的实习生——你说一步,他动一步,稍微模糊点指令,他能给你把饭喂到鼻子里去。那叫一个闹心。

后来我开始琢磨AI代理人,说白了就是给AI穿上一身工作服,定好规矩,让它自个儿去跑流程。但你很快就发现另一个坑:你辛辛苦苦搭好的“技能包”,比如让它按固定格式审合同、写周报,可能过了俩月,AI模型一升级,它又给你按“自己的想法”自由发挥了。

这时候,就得提那个让我少掉不少头发的AI代理人技能工场

这玩意儿它不是个简单的工具,更像是个“AI的驾校” -1。你造了个技能,好比是造了辆车,但这车能不能上路?过不过得了检测?会不会开着开着散架?技能工场就是那个检测站。它里面最近升级了个叫Evals的系统,我管它叫“AI的考官” -1

比如说我上个月给团队写了个处理客户投诉的技能包。以前写完只能凭感觉试,行不行的看运气。现在好了,扔进技能工场里,我只要告诉它“期望输出是啥样”——比如必须是三段式:先共情、再给解决方案、最后留个话茬——它就能自动跑一堆测试案例,告诉我有百分之多少的情况是达标的。那感觉,就像以前看病靠老中医把脉,现在直接上CT机,哪儿堵了一眼就看出来。 -1

让“死”技能“起死回生”,这感觉比捡钱还爽

更绝的是啥?是它能让你那些“吃灰”的老技能活过来。

我们公司去年折腾了一批自动化技能,后来模型版本迭代,好多都失灵了,扔在那儿跟一堆废铁似的。上周末我心血来潮,把这些“废铁”又扔进了AI代理人技能工场的新版Benchmark模式里跑了一遍 -1。好家伙,不跑不知道,一跑吓一跳。系统不光告诉你是哪个环节卡壳了,还贴心地给出了修改建议。

我就跟着它的提示,像修车似的拧了几个“螺丝”——改了两句触发描述,结果那些旧技能跟打了鸡血似的,跑得比新写的还顺溜。那一刻,我真觉得这玩意儿是在帮我省钱,有种“捡钱”的快乐。

你看,丹麦有家啤酒厂更会玩,直接给AI同事做了工牌、照片,甚至编了背景故事,让员工跟AI在聊天软件里互动 -4。一开始大家觉得怪,结果呢?使用率翻了四倍。为啥?因为有了“人样儿”啊。咱们这AI代理人技能工场干的也是类似的事儿,它不是给AI整容,而是给AI的“脑子”做培训,让它在企业里干活儿的时候,知道啥时候该讲规矩,啥时候可以灵活点。

别把AI当神,把它当成你带的那个“笨徒弟”

有人总担心AI会抢饭碗。我倒是觉得,AI更像是我手底下的那个“笨徒弟”。

我带徒弟,你得教吧?光嘴上说没用,得让他上手练,错了得改,改完还得复盘。现在这个技能工场升级后,引入了一个叫Comparator的盲测对比功能 -1。这就像同时带两个徒弟,一个按老方法教,一个按新方法带,最后不看脸,光看活儿干得咋样,让第三方裁判打分。

我上个月就用这个功能测了两个版本的文案撰写技能。结果出来,我一直觉得好用的那个版本居然比分低了20%。当时脸上真有点挂不住,但回头一想,这不就是花机器的钱,请了个不会发脾气的教练嘛。

现在我对AI的态度特简单:别把它当神供着,也别把它当狼防着。就把它当成一个刚入职、学历挺高但没啥经验的新人。你要做的,就是用好AI代理人技能工场这类“岗前培训班”,给它定好规矩(SKILL.md指令)、备好工具(脚本和资源)、设好考核标准(Evals系统) -1

你看最近挺火的那个开源项目,55个AI角色组成个虚拟公司,从工程师到市场部,分得清清楚楚 -3。这说明啥?说明未来咱们每个人可能都带一个“AI部门”。你能不能当好这个部门经理,就看你会不会给这些AI同事定KPI、做迭代

反正我现在是尝到甜头了。以前下班那是真下班,现在下班,脑子里还转着:今天那个技能触发率好像低了点,明天得去技能工场里看看是不是触发词写得太死板了。这种状态,累是累点,但看着那些重复劳动被AI吃得死死的,心里头那个爽快劲儿,啧,比发奖金还舒服。


网友问答:

网友“程序员老马”问:
你说的这个AI代理人技能工场,听起来挺专业,是不是只有大厂或者懂代码的人才能玩?我们这种业务部门的小白,连Python都忘光了,能上手吗?

答:
老马你这问题问到点子上了!其实一开始我也被吓住了,以为又是啥高深的开发工具。但实际用下来,真没那么玄乎。我给你打个比方吧,这就像早年间的单反相机,专业摄影师用手动挡,但咱们普通人用个“人像模式”“风景模式”也能拍出好照片。

现在的技能工场,尤其是Anthropic这次升级的skill-creator,它对小白已经相当友好了 -1。你不需要写代码,它的核心逻辑其实是“教AI做事”,而不是“写程序给AI跑”。你只要会用自然语言描述清楚三件事就行:第一,你希望AI在啥情况下出手(比如“当有人提到合同审核时”);第二,你希望它按啥流程走(比如“第一步先看金额,第二步检查乙方信息”);第三,你希望它最后交出啥(比如“一份带风险提示的摘要”)。

它那个Evals系统,小白用着可能有点懵,但你就把它当成一个“AI考官”。你给几个例子,告诉它“这样是对的”,它就能自己跑去判卷子。我刚开始也是瞎摸索,后来发现官网上有好多现成的模板,直接拿来改改就能用。这年头,会用引擎、会模仿,就能上手,真的别怕。

网友“爱思考的Lily”问:
我有个更深层的担忧。你把AI调教得这么像人,甚至给它们设KPI、做测试,那咱们人类员工在公司里到底算什么?难道以后就专门给AI当“保姆”和“教练”吗?这种工作有啥成就感?

答:
Lily这个问题,说实话,我也琢磨过好一阵子。甚至有一段时间特别丧,觉得自己钻研的这些技能,最后可能亲手把自己给“优化”了。

但我后来想通了一件事,就是丹麦那家啤酒厂的经理说的那句话特启发我:“你永远要对AI保持批判性思维,因为它说的都对,但需要人的创造性去赋予它温度。” -4

你想啊,AI写的周报,格式再漂亮,它能写出你谈判桌上那个瞬间的直觉吗?它分析的数据再准确,它能拍板说“这事儿咱们赌一把”吗?不能。

咱们的角色其实是在“升维”。以前咱们是干活的,现在咱们是规则的制定者和价值的裁判员。就像你说的当“保姆”和“教练”,但你看哪个单位的教练不比运动员牛?成就感不在于你亲手干了多少活儿,而在于你构建了一个能高效产出的系统。当你看到整个团队因为你的调教,从手工作坊变成了自动化流水线,那种掌控感和创造感,其实比亲自拧螺丝要过瘾得多。

网友“创业小强”问:
我是自己开公司的,只有几个人的小团队。你说的这些AI技能,对我有啥实际好处?能帮我省钱还是帮我赚钱?会不会投入产出不成正比?

答:
小强,我跟你说句掏心窝子的话,咱们小公司才更应该玩命地拥抱这东西。 为啥?因为大厂有人,咱们没人啊!大厂一个活儿能雇十个人干,咱们可能就一个人扛。这时候AI就是咱们的“增援部队”。

我给你举个例子,咱们写标书或者做方案的时候,是不是最怕那种“既要又要还要”的甲方?要求格式五花八门,内容还都得个性化。以前咱只能熬夜熬成熊猫眼。现在呢?你可以先在AI代理人技能工场里建一个“标书格式审查员”的技能,再建一个“案例库检索员”的技能。你主攻策略和报价,那些排版、查重、合规检查的脏活累活,让AI帮你跑。这就相当于你用一个人的工资,招了一个“数字团队” -5

而且现在这些工具的门槛在降低,投入的成本其实远比你招个实习生便宜。更重要的是,它能让你少犯错。比如合同里的坑,你眼神不好漏了,AI按你设定的规则去审,大概率能揪出来。对咱们小本经营来说,省钱就是赚钱,少踩坑就是赢。 别再观望了,这波红利,小公司反应快,反而跑得比大公司快。

标签:

相关阅读