← Home

关于AI的一些轻科普

2025-12-23
#AI

想象一下在周末的下午,我们想一下晚上吃什么?
可以自己去买一些食材、叫一些外送、在家就直接做了;
我们可以选择点外卖,肯德基的炸鸡、麦当劳的汉堡、外婆家的套餐、一些收藏店铺的单品;
也可以选择到店堂食,楼下的小店、连锁餐饮;
也可以叫几个朋友,酒吧小聚;或者直接开到户外,准备一些食材。
 

那么换到AI上面,我们想利用AI来解决一个具体事项。
也是那么几个选项:
可以选择直接使用已有的客户端:ChatGPT、Claude、Gemini、DeepSeek、豆包等;
也可以选择使用一些第三方的部署端:open webUI、Cherry Studio等;
我们还可以使用一些自定华更强的工具:dify、coze等;
我们还需要考虑使用什么模型,是ChatGPT的4o、GPT-5.2?还是Claude的Opus 4.5、Haiku 4.5?还是Gemini 3 Pro?
如果是使用了第三方的工具,我们还要考虑采用官方的API服务、还是一些聚合平台的API服务?
 

是不是和我们决定一餐饭吃什么很像?
 

想吃的炸鸡、汉堡、小炒套餐,可类比于AI的模型:像是Claude、GPT、Gemini、DeepSeek;
这些连锁餐饮、小食店铺,就相当于这些AI大厂:Anthropic、OpenAI、Google、深度求索、字节;
到店堂食,就像是选择去这些大公司出的AI客户端,稳定性有保证;
如果我们想一餐不仅仅吃一家食物,那么也可以选择直接点不同的外卖,那么一些AI的API聚合平台,可以在上面直接选择不同厂家的不同模型;
如果我们自己去户外、去酒吧,就像是自己去动手开发、部署AI的各类应用了,就需要使用一些dify、coze类似的应用了。
 

还有一些相关的名词:
API
原义: 应用程序接口。
“晚餐”比喻: 点菜单 / 传菜员。
解释: 厨师(模型)在后厨,你在前台。你不能直接冲进厨房炒菜,你需要一张“点菜单”(API)把你的需求(Prompt)传进去,厨房做好了再把菜(Response)端出来。
聚合API: 就像是一个外卖跑腿小哥,他手里拿着好几家餐厅的菜单,你想吃哪家他都能帮你去那家后厨下单。
 

Agent:

普通 AI 是切菜学徒,Agent 是主厨

区别在于主动性:Agent 会自己看冰箱(检索)、自己买菜(联网)、自己做菜(执行)。

普通 AI (Chatbot) 厨房学徒 (The Line Cook)
场景: 你站在厨房门口喊:“把土豆切了。”(Prompt)
反应: 他就把土豆切了(Response)。
局限: 如果你不发令,他就傻站在那里。你如果不告诉他“切完土豆要记得洗锅”,他就不洗。他只是一个被动的执行者。
Agent (智能体) 能够承接“全案”的主厨 (The Executive Chef)
场景: 你只说了一句模糊的目标:“今晚有这几个朋友来,搞个四菜一汤,不要辣,要有格调。”(Goal) Agent 的“内心戏”与行动(Chain of Thought & Action): 拆解任务: 主厨心想,“四菜一汤需要买什么食材?先看看冰箱里有什么。”
调用工具: 他打开冰箱(检索数据库),发现没肉了,于是拿起电话给供应商下单(调用联网搜索/API)。
执行与修正: 开始做菜。尝了一口发现淡了(自我反思),于是加了点盐(自我修正)。
交付: 最后把做好的菜端到你面前。
关键点: Agent 的核心不在于“聊”,而在于“拆解目标”、“主动规划” 和 “调用工具”。它是一个为了达成结果而自动工作的闭环。
 

MCP:与各个平台对接的“通用插头”
没有 MCP 的时代,就像专机专用的尴尬
场景:
你想用 Claude 处理飞书文档,发现 Claude 的机器插头和飞书的插座不匹配。你需要找个电工(程序员)专门焊一根线。转头你想用 ChatGPT 处理同一个飞书文档,完蛋,还得再焊一根线。你想用 ChatGPT 处理本地 PDF?对不起,那得换个完全不同的接口。
痛点: 每一个 AI 模型要想吃到每一份数据食材,都要单独修一条路,这也太累了。有了 MCP 之后,就像厨房里的 USB-C 接口(或者通用的乐扣乐扣保鲜盒)
比喻: MCP 就是制定了一个“标准保鲜盒接口”。
原理:
数据端(Server): 不管你是 Notion 还是本地电脑,请把数据都装进这个“标准盒子”里。
AI 端(Client): 不管你是 Claude 还是 Cursor,只要你身上有这个“标准卡槽”,你就能直接读取这个盒子里的东西。
结果: 你的数据(食材)只需要打包一次,所有的 AI 厨师都能直接拿来做菜,哪怕以后换了新厨师(新模型),也不需要重新装修厨房。
 

SKILL/TOOL:功能单元、技能/工具
原义: AI可以调用的外部功能(联网、计算器、画图)。
“晚餐”比喻: 厨房里的电器与厨具。
解释: 即使是米其林大厨(GPT-4),让他徒手切排骨也费劲。给他一把“菜刀”(Python代码解释器),他就能切得很完美。给他一个“联网搜索”的手机,他就能查到最新的菜谱。
 

对于每个需要AI来处理的问题、事项,我们首先要对其进行分析,使用哪些工具?那类模型?如何搭建流程还是直接进行问答?是否可以保存此流程进行复用?