🤖 AI Agent

Tool Use、MCP协议、Agent架构与Harness Engineering

AI Agent是2025-2026年最核心的技术趋势。当LLM学会使用工具(Tool Use),它就从一个"会说话的大脑"进化成了"能动手干活的助手"。

🔧 Tool Use 工具调用

Tool Use是AI Agent的核心能力:LLM根据用户请求,自动选择并调用外部工具获取信息或执行操作,然后将结果整合为自然语言回复。

工作流程

1

用户请求

用户发送自然语言请求

2

意图识别

AI分析请求,判断是否需要调用工具

3

参数构造

AI根据工具定义构造调用参数

4

执行工具

系统执行工具并返回结果

5

结果整合

AI将工具结果整合为最终回复

🔍

代码分析

读取代码文件、执行测试、分析依赖关系

🌐

信息检索

搜索网络、查询数据库、调用API获取数据

📋

任务执行

创建文件、发送邮件、管理日程

🔄

多步工作流

串联多个工具完成复杂任务链

🔌 MCP 协议

维度Tool Use(工具调用)MCP(模型上下文协议)
定义AI调用外部工具的能力工具调用的统一标准协议
范围单个应用内的能力跨应用、跨平台的标准化
类比🚗 汽车能开(能力)🚦 统一交通规则(标准)
现状各厂商各自实现Anthropic主导,生态快速扩展

🎯 MCP 设计原则

  • 标准化:统一工具描述和调用格式,一次接入多端可用
  • 安全性:权限分级、沙箱执行、审计日志
  • 可组合:工具可嵌套、可编排、可共享

🏗️ Agent 架构

维度传统WorkflowAI Agent
执行逻辑预定义流程LLM动态决策
灵活性需要改代码通过Prompt调整行为
适应性固定规则根据反馈自我调整
上下文理解有限深度语义理解
🧠

记忆层

向量数据库 / RAG / 对话历史

提供上下文记忆能力

🗺️

规划层

CoT / ToT / ReAct

将复杂任务分解为可执行步骤

🛠️

行动层

Tool Use / MCP协议

调用外部工具执行具体操作

📖 推理方法速览

CoT(Chain-of-Thought)

链式思考:一步一步推理,适合逻辑推导

ToT(Tree-of-Thought)

思维树:探索多条推理路径,选最优解

ReAct(Reasoning + Acting)

推理+行动交替:思考一步→执行一步→观察结果→继续思考

🏗️ Harness Engineering 驾驭工程

Harness Engineering是驾驭AI Agent的工程化能力——如何设计约束、提供反馈、确保AI Agent在可控范围内高效完成任务。

维度内容
上下文工程为Agent设计最优信息输入(System Prompt + RAG + 记忆)
架构约束权限控制、操作沙箱、执行超时、回滚机制
反馈与验证输出质量评估、自动校验、人类审查节点

🔄 Harness Engineering vs DevOps

维度DevOpsHarness Engineering
管理对象软件服务AI Agent行为
核心目标稳定部署与运维可预测、可控的AI输出
反馈循环监控告警 → 修复输出评估 → 调整上下文/约束

📡 可观测性 + LLMOps + AI安全

📊

可观测性

日志 + 指标 + 追踪,给AI装"行车记录仪"

  • • 每次调用的输入输出
  • • Token消耗和延迟
  • • 工具调用链路追踪
⚙️

LLMOps

模型运维的四大支柱

  • • 模型路由(按任务选模型)
  • • 成本控制(Token预算管理)
  • • 模型评估(自动化Benchmark)
  • • 灰度发布(A/B测试新模型)
🛡️

AI安全

企业级AI安全防护体系

  • • 提示注入防护
  • • 数据泄露拦截
  • • 恶意Agent检测