返回开源项目Back to Open Source

Microsoft AI Agents for Beginners 课程深度研究

Microsoft AI Agents for Beginners Course - Deep Dive

📚 学习来源:微软官方开源课程 · 57K+ Stars · 15节系统课程 📚 Source:Microsoft Official Course · 57K+ Stars · 15 Comprehensive Lessons

AI Agent Azure MCP A2A AutoGen

🎯 核心收获

🎯 Key Takeaways

1. AI Agent的本质定义

1. What is an AI Agent?

AI Agent是让大语言模型能够实际执行操作的系统,通过给予工具和知识来作用于世界,而不仅仅是响应提示。

AI Agents are systems that let LLMs actually DO things by giving them tools and knowledge to act on the world, not just respond to prompts.

核心三要素:

Core components:

2. Agent的七种类型

2. Seven Types of Agents

类型Type特点Characteristics示例Example
简单反射型Simple Reflex硬编码规则,无记忆Hard-coded rules邮件转发Email forwarding
基于模型的反射型Model-Based维护世界内部模型Internal world model价格跟踪Price tracking
目标导向型Goal-Based有目标,逐步规划Step-by-step planning行程预订Trip booking
效用导向型Utility-Based权衡利弊找最优Optimize tradeoffs最优决策Optimal decisions
学习型Learning通过反馈持续改进Continuous improvement自适应推荐Adaptive recommendations
分层型Hierarchical多层Agent分工Multi-level delegation任务分解Task decomposition
多Agent系统Multi-Agent多Agent协作Agent collaboration团队协作Team collaboration

3. 三大核心Agent框架对比

3. Three Core Agent Frameworks Comparison

框架Framework特点Features适用场景Use Cases
AutoGenAutoGen开源、事件驱动、分布式Open source, Event-driven研究、多AgentResearch, Multi-agent
Semantic KernelSemantic Kernel企业级、轻量级、Azure集成Enterprise, Lightweight企业应用Enterprise apps
Azure AI Agent ServiceAzure AI Agent全托管、自动工具调用Fully managed, Auto tool calling生产环境Production

4. 六大Agent设计模式

4. Six Core Agent Design Patterns

1. Tool Use
函数调用/工具使用
2. Planning
任务分解与规划
3. Memory
短期/长期记忆
4. Multi-Agent
多Agent协作
5. Metacognition
元认知/自我反思
6. Trustworthiness
可信Agent构建

5. 三大Agent协议

5. Three Agent Protocols

协议全称定位Positioning核心功能Core Function
MCPModel Context ProtocolLLM ↔ 工具/数据LLM ↔ Tools/Data标准化工具发现Standardized tool discovery
A2AAgent to AgentAgent ↔ AgentAgent ↔ Agent跨组织协作Cross-org collaboration
NLWebNatural Language Web网站 ↔ AIWebsite ↔ AI自然语言交互Natural language interaction

📖 详细内容

📖 Detailed Content

1. Agentic RAG核心循环

1. Agentic RAG Core Loop

┌─────────────────────────────────────────┐
│         Agentic RAG Core Loop            │
├─────────────────────────────────────────┤
│  1. Initial Call: 用户目标发给LLM       │
│  2. Tool Invocation: 选择检索工具        │
│  3. Assessment: 评估结果是否足够         │
│  4. Refinement: 优化查询或尝试其他工具   │
│  5. Repeat: 循环直到满意                │
│  6. Final Response: 交付最终答案         │
└─────────────────────────────────────────┘

与传统RAG的区别:

Difference from Traditional RAG:

维度Dimension传统RAGAgentic RAG
流程Flow检索→读取(固定)LLM调用→工具调用→循环
规划Planning预定义路径自主决定
错误处理Error Handling返回失败重试、调整策略

2. MCP协议工作流程

2. MCP Protocol Workflow

1. AI助手(Client)连接航司MCP Server
2. 询问可用工具 → Server返回"search_flights"、"book_flights"
3. 用户请求:搜索Portland到Honolulu的航班
4. AI识别需调用"search_flights",传参数给Server
5. Server调用航司API,返回航班信息
6. 用户选择航班,AI调用"book_flights"完成预订

3. 多Agent退款流程示例

3. Multi-Agent Refund Process Example

专用Agent:

Specific Agents:

通用Agent:

General Agents:

💭 思考与实践

💭 Reflections and Practice

学习心得

Key Insights

  1. Agent不是银弹:不是所有问题都需要Agent,简单LLM能解决的不要过度设计
  2. 工具是Agent的灵魂:Agent的能力边界由其工具体系决定
  3. 多Agent协作是趋势:复杂任务需要专业化分工
  4. 协议标准化很重要:MCP、A2A、NLWeb将构建Agent生态基础设施

适用场景

When to Use What

场景Scenario推荐模式Recommended Pattern
简单问答Simple Q&A基础LLMBasic LLM
需要调用APIAPI IntegrationTool UseTool Use
跨数据库检索Cross-DB RetrievalAgentic RAGAgentic RAG
复杂多步任务Complex Multi-stepPlanning + Multi-AgentPlanning + Multi-Agent
网站智能化Website IntelligenceNLWebNLWeb

🔗 相关链接

🔗 Related Links

📝 笔记信息📝 Note Info

学习日期:2026-04-28 | 来源:Microsoft GitHub | 作者:常思杨Date: 2026-04-28 | Source: Microsoft GitHub | Author: 常思杨