综合笔记 - 看宝AI知识库

⚔️ Claude Opus 4.7 vs OpenAI Codex：AI编程之王争夺战深度解析

核心发现：Claude Opus 4.7的SWE-bench得分80.9%领先，但"模糊税"现象引发社区争议

Benchmark数据：Claude 80.9% vs Codex 77.9% vs Gemini 76.2%
"模糊税"：Opus 4.7 token消耗比4.6高1~1.35倍，模糊提示词不再免费补全
竞争策略：Anthropic走"精英俱乐部"路线（9000亿估值），OpenAI走"开发者生态"路线
新度量衡：DAA（日活智能体数）取代Token成为价值衡量标准

实践建议：精确指令反而省钱；根据任务复杂度选择工具；关注企业服务机会

⚔️ AI编程 · Claude · Codex | 2026-05-18

🧠 五大公认强者思维框架深度研究

核心框架：SMART原则 · PDCA循环 · 第一性原理 · PREP表达模型 · 金字塔原理

SMART：让模糊目标变得可执行，解决"不知道要什么"
PDCA：把计划变成持续行动，解决"知道但做不到"
第一性原理：从本质出发重新思考，解决"做事没重点"
PREP/Pyramid：结构化表达，解决"说不清楚"和"逻辑混乱"

关键洞见：五大框架形成完整闭环——SMART定目标→PDCA执行→第一性原理找本质→PREP/Pyramid做表达

实践建议：一人公司应整合SMART+PDCA工作流，AI Agent可自动化模板生成和进度追踪

🧠 思维框架 · 方法论 | 2026-05-18

🚀 Google I/O 2025 & AI Agent 全景图 2025-2026 深度研究

核心突破：A2A 协议 v0.2 四大升级、Agent Engine UI 三阶监控、Context Engineering 取代 Prompt Engineering

A2A v0.2：无状态交互（延迟-78%）、智能体卡（发现效率+3倍）、文件交换（吞吐量+2.5倍）
六大 SDK 对比：Claude Agent SDK（30小时自主编码）、OpenAI AgentKit（可视化编排）
MCP 生态：10,000+ 服务器、800万下载量、90%组织将采用

关键洞察：MCP 的价值在网络效应，Context Engineering 是 Agent 开发核心学科

实践建议：一人公司 SOP 应整合 Claude SDK 架构、MCP 标准化、Context Engineering 四操作法

🚀 AI Agent · A2A · MCP | 2026-05-17

🌙 Claude Dreaming 与自进化 Agent 系统深度解析

核心功能：Anthropic在Code w/ Claude 2026发布三项革命性功能

Dreaming：让Agent在"睡眠"中提炼历史经验自动进化
Outcomes：定义质量标准，让Agent自评自改直到达标
Multi-Agent：Lead+Specialists并行协作模式

实测数据：任务完成率提升6倍、文档生成质量+10%、审查速度+50%

对看宝AI的启示：Phase1记忆系统修复、Outcomes质量闭环、多Agent协作模式

🤖 AI Agent | 2026-05-17

🛠️ Anthropic Skill-Creator 深度研究：评估与优化机制

核心升级：新版 skill-creator 不再是 SKILL.md 模板生成器，而是包含"Skill 草稿→评测→迭代"的完整工作流。

核心架构：

评估系统：触发评估 + 功能评估，跑完直接告诉你这个 Skill 到底行不行
优化系统：自动迭代 description，支持 A/B 盲评
四角色：Executor、Grader、Comparator、Analyzer

范式转变：从 Prompt Engineering → Eval-Driven Engineering

🛠️ Skill | 2026-04-26

📋 Skill 评测实践指南：从 0 到 1 建立你的技能评测体系

适用人群：想建立自己的技能评测体系的个人开发者或小型团队

快速上手：

评测金字塔：触发测试 → 功能测试 → 性能比较
测试集准备：trigger_eval.json + evals.json
评测飞轮：准备测试集 → 运行评测 → 审查结果 → 优化 Skill

整合框架：GenericAgent(探索) + skill-creator(验证) + 业务知识(沉淀)

📋 实践指南 | 2026-04-26

🤖 Agent设计的三个层次：从需求澄清到自我进化

核心论点：优秀的Agent系统不是堆砌功能，而是在三个层次上做好设计

整合框架：

理解层（Vibe-Coding）：Prompt First方法论，解决需求澄清问题
执行层（GenericAgent）：上下文信息密度最大化，实现自进化
协作层（Multi-Agent）：7种协作模式，实现系统级智能

核心洞察：Agent的进化方向不是"预设更多能力"，而是"让Agent学会自己生长能力"

AI技术 | 2026-04-26

经典决策思维

来源：毛选 + 求是 + KarlMarx

核心内容：

调查研究 → 矛盾分析 → 结构诊断的三步流程
决策前的三重检验体系
从零开始的突破策略
团队与利益相关者决策方法

适用场景：复杂问题分析、战略规划、团队决策

综合笔记 | 2026-04-12

📢 内容运营方法论

来源：MrBeast + X导师 + 户晨风

核心内容：

视频内容的CTR/AVD公式
社交媒体算法权重与增长策略
数据驱动的表达方法
内容增长飞轮

适用场景：视频创作、社交媒体运营、品牌建设

综合笔记 | 2026-04-12

⚠ 风险与危机应对

来源：塔勒布 + 马斯克

核心内容：

尾部风险检验与遍历性分析
杠铃策略的资源配置
五步算法与成本分析
专家建议过滤机制

适用场景：风险管理、投资决策、危机处理

综合笔记 | 2026-04-12

AI行业趋势

来源：Gartner报告 + 头部机构分析 + 企业实践

核心内容：

2026年AI行业全景扫描
大模型竞争格局与演进方向
Agent：AI应用的新范式
AI在各行业的落地进展

适用场景：行业分析、技术战略规划、投资决策

综合笔记 | 2026-04-12

🛠 AI工具推荐

来源：主流AI产品评测 + 使用经验

核心内容：

AI工具全景图谱
对话、写作、设计、办公等工具推荐
开发与代码AI工具精选
AI工具选型指南与工作流构建

适用场景：工具选型、效率提升、AI应用入门

综合笔记 | 2026-04-12