原创文章

0.1 大模型、技能、智能体,到底有什么区别

大模型、技能、智能体,到底有什么区别

标题图

故事是这样的。

这两年,AI圈里有三个词,几乎已经被说烂了。

大模型。

技能。

智能体。

但比较骚的事是,很多人天天在用这三个词,真让他解释一下,往往一开口就开始混。有人把大模型当成智能体,有人把技能理解成提示词,有人又觉得,智能体不就是把几个提示词串起来吗。

说真的,这也不能怪大家。

因为这三个东西,本来就不是完全割裂的。它们像一家三口,长得有点像,天天又住在一起。你远远一看,很容易认错。

但你真想把AI用明白,这个事儿还是得掰开。

不然你会出现一种特别常见的情况。

你明明想解决的是流程问题,结果跑去换模型。

你明明缺的是领域方法,结果以为多堆几个提示词就够了。

你明明需要的是一个能自己干活的系统,最后却只搞出来一个会聊天的窗口。

这篇文章,我就尽量用大白话,把这三个词聊明白。

先说结论。

大模型,更像脑子。

技能,更像经验和说明书。

智能体,更像一个真的会接活、会调用工具、会按目标往前推进的干活系统。

如果你非要用一句最短的话来区分,那就是这样。

大模型负责想。

技能负责把想这件事,想得更像行家。

智能体负责把想,变成一步一步真的去做。

先聊大模型。

大模型这玩意,最核心的能力,其实不是知道很多知识。

而是预测。

它通过海量数据训练之后,学会了在一段上下文里,接下来最可能出现什么词,什么句子,什么结构,什么推理路径。

你可以把它理解成一个压缩过的人类语言世界模型。它脑子里装了很多统计规律,也因此表现出理解、推理、写作、总结、编程这些能力。

但回到最根上,它是一个底层能力引擎。

像发动机。

像CPU。

像大脑皮层。

它很强,但它本身不等于一个完整的工作系统。

比如你跟一个纯大模型说,帮我写一篇关于大模型、技能、智能体区别的文章。

它当然能写。

而且大概率写得还挺像那么回事。

但问题也很快会冒出来。

它可能写得很顺,很全,很像标准答案。

也可能,很像机器。

它知道很多概念,但不一定知道你到底想要公众号风格、学术风格,还是演讲稿风格。它也不一定知道,你是不是特别在意结构节奏、读者共鸣,或者有没有真实案例。

这就是大模型的第一个边界。

它有通用智力。

但不天然有你的具体方法论。

于是,技能就出来了。

技能这个词,你可以把它理解成一套被外置出来的经验系统。

它不是模型参数本身。

它更像是,一个高手把自己做某件事的方法、步骤、禁区、参考资料、常见错误、工具脚本,全部整理成一个可复用的包,然后交给模型去调用。

如果说大模型像一个很聪明、但初来乍到的实习生。

那技能就像你团队里那个干了很多年的人,给他写的一份特别具体的入职手册,再外加一些模板、脚本和过往案例。

注意,这里最关键的一点是,技能不是单纯的一段提示词。

好的技能,往往比提示词厚得多。

里面可能有工作流,有风格要求,有参考资料,有禁用词,有脚本,有模板,甚至还有一整套质检方式。

就像我现在这个 yangzai-writer

它不是告诉模型,模仿阳仔写作风格。

如果只是这句话,说实话,八成会写出一股子AI味。

真正有用的,是把选题判断、风格节奏、口语化表达、去AI味返修、自检体系这些东西,全部拆出来,变成模型随时可以调用的作战手册。

这就是技能的价值。

它不直接提供智力。

它提供的是,把智力导向正确结果的路径。

再往前一步,就是智能体。

智能体这个词,这两年也被吹得有点玄乎。

很多人一听智能体,脑子里就容易出现那种特别科幻的东西,仿佛一个数字生命,在电脑里觉醒了自我意识。

倒也没那么夸张。

你先别急着脑补奥创。

在今天大多数实际场景里,智能体更接近什么呢。

更接近一个围绕目标自主推进任务的系统。

它通常会有几个东西。

一个大模型,作为思考和决策核心。

一组技能,作为领域方法和工作规范。

一些工具,比如搜索、读文件、写文件、调用接口、执行脚本。

再加上一点记忆、状态管理和任务规划能力。

这些东西凑在一起,它就不只是回答你一句话了。

它会开始做事。

比如还是写文章这件事。

只有大模型的时候,你问它,它回你。

有技能的时候,它会按更专业的方法回你。

到了智能体这层,它可能会先去读你的素材,再整理框架,再写初稿,再自己跑一轮去AI味返修,再输出成 markdown 文件,最后甚至还能帮你发到公众号后台。

从单步生成到多步执行的升级路径图

这就已经不是单纯的生成。

而是执行。

所以你会发现,这三个东西,其实对应的是三个不同层级。

大模型,是能力底座。

技能,是领域增强层。

智能体,是任务执行层。

大模型、技能、智能体三层关系图

这就是它们最大的区别。

如果再讲细一点,我觉得至少还有四个维度,可以特别清楚地把它们分开。

大模型、技能、智能体差异对比图

第一,抽象层级不一样。

大模型最底层,像引擎。

技能在中间,像插件包,像作战手册。

智能体在最上层,像一个把引擎、手册和工具都串起来的项目经理兼执行者。

第二,主动性不一样。

大模型本质上是被动响应,你给它输入,它给你输出。

技能也还是偏被动,它本身不会干活,它只是让模型在某个任务上更懂规矩。

智能体则不一样,只要目标明确,它就会拆解任务、决定下一步、调用工具,然后一路往前推。

第三,完成任务的闭环能力不一样。

大模型擅长单步生成。

技能擅长提高单步生成的质量。

智能体擅长把多步动作串成闭环。

第四,失败的原因也不一样。

大模型不行,很多时候是底层能力不够,理解差了,推理断了,幻觉多了。

技能不行,通常是方法不对,约束不清,资料不够,流程设计得太糙。

智能体不行,则更像工程问题,规划失误了,工具没调好,状态丢了,步骤之间没衔接上。

但说到这儿,它们又不是毫无相似点。

恰恰相反,它们相似的地方,可能比很多人想象得还多。

第一,它们本质上都在放大人的认知和行动。

大模型放大的是思考和表达。

技能放大的是经验和专业方法。

智能体放大的是把目标推进到结果的执行力。

第二,它们都离不开上下文。

上下文这个词,真的特别重要。

你给大模型什么上下文,它就会在什么世界里思考。

你给技能什么规则和材料,它就会形成什么风格和边界。

你给智能体什么目标、工具权限和记忆,它就会长成什么样。

第三,它们的边界,其实在现实产品里会越来越模糊。

这点挺有意思的。

很多时候,用户打开一个AI产品,看到的只是一个输入框。

但那个输入框后面,可能挂着一个大模型,外面包着十几层提示词和技能,再外面接着工作流、工具调用、记忆系统和自动执行逻辑。

最后用户会统一把它叫成,AI。

也正常。

就像大部分人不会区分CPU、操作系统、应用层和自动化脚本。

但如果你是做产品的,做内容的,做工作流的,或者哪怕只是想把AI用得比别人深一点,这里面的分层意识就特别关键。

因为分清层次,才知道问题该去哪里修。

模型不够强,就换模型。

方法不够稳,就补技能。

流程跑不通,就改智能体设计。

别一出问题就无脑说,再换个更强的模型试试。

很多时候,真不是模型的锅。

回到最开始那个问题。

大模型、技能、智能体,到底是什么关系。

我自己的感受是,它们其实很像造车。

大模型、技能、智能体的造车类比图

大模型是发动机。

技能是老司机写下来的驾驶手册、维修规范和赛道经验。

智能体则是一辆真的能上路跑、会导航、会换挡、会去目的地的车。

只有发动机,没有车身,没有方向盘,没有地图,你再牛逼也只能原地轰油门。

只有手册,没有发动机,那更别聊了。

而只有车壳子,没有好的发动机和经验系统,这车大概率也跑不远。

所以真正有价值的,从来不是只看其中一个。

而是看,三者怎么配合。

未来很长一段时间里,我觉得AI行业真正的竞争,可能都不只是模型参数的竞争。

而是谁更会把模型、技能、工具、工作流、数据和场景,拧成一个真正能解决问题的智能体系统。

大模型决定天花板。

技能决定专业度。

智能体决定你最后能不能把事做完。

这三者,少一个都别扭。

大时代啊,朋友们。

我们现在很多人,其实还停留在把大模型当搜索框、当聊天对象的阶段。

但再往前一点点,你会发现,真正改变工作方式的,不是会聊天的模型。

而是会调用技能、会使用工具、会持续执行的智能体。

这才是下一层。

也是很多人还没真正意识到的一层。

评论

发表评论