关于AI的思考与未来方向

🤖 关于AI的思考与未来方向

基于三个月（2025.12-2026.03）的AI Coding深度实践，总结了对AI的认知升级、Skills体系化建设、全流程串联经验，以及对未来的规划与愿景。

AI专题导航

如果把这篇文章当成我博客里 AI 主题的入口页，那我更希望它承担的是“导航”而不只是“感想”。下面这几篇，可以按你关心的问题顺着读下去：

1. 先看整体认知

AI理解与应用：偏基础梳理，适合先把 RAG、MCP、Agent 这些概念串起来。
关于AI的思考与未来方向：偏实践复盘，适合看我怎么把 AI Coding、Skills 和流程串起来。

2. 再看 OpenClaw 落地

OpenClaw完全指南：从入门到精通：安装、命令、核心原理的一站式说明。
OpenClaw：你的24小时AI合伙人，重新定义工作流：更偏真实工作场景，适合理解 OpenClaw 的价值边界。
OpenClaw搭建AI特工团队：从单兵作战到协同作战：适合继续看多 Agent 协作和团队化配置。

3. 如果你关心模型选型

GPT-5.5 vs GPT-6 vs Claude Opus 4.7 编码推理与记忆的全面对比：偏模型能力和开发者选型。

4. 如果你想研究 Agent 骨架

Claude Code Agent Harness入门：从Skills、Session到Memory说起：适合先建立整体概念。
Claude Code Agent Harness工程拆解：Skills、Session与记忆系统的实现骨架：适合进一步看工程层面的组织方式。

一、实践成果回顾

1️⃣ AI Coding深度实践

✅ 首次实现90%代码量由AI生成（2026-02-02本地生活项目）
✅ 跑通全流程：JIRA → Trace分析 → 代码修改 → CR → MR
✅ 多工具对比：Cursor（主力）+ Claude Code（文档）+ Codex（聪明）
✅ 模型认知升级：GPT-5.2 Codex > Opus 4.5 > GLM-4.7

关键里程碑：

12月：首次使用Cursor + Gemini分析Trace
1月：体验Skill-creator，做基于上下文驱动的代码审查
2月：第一次AI开发90%代码量，体验Codex 5.3模型的强大
3月：完成Dev-Skills仓库，跑通Agent Team多Agent协作

2️⃣ Skills体系化建设

✅ 创建30+个Skills（覆盖CR、开发、排障、文档等）
✅ 主协调器设计：多技能串联，渐进式披露
✅ 跨应用OpenSpec落地：解决AI识别应用范围问题
✅ Dev-Skills仓库：统一管理，一键安装，支持Cursor/CC/Codex

核心Skills清单：

开发类：sdd-dev-workflow, ai-pair-programmer, brainstorming
CR类：team-cr, author-cr, full-review, code-review
排障类：zan-dev-flow, zan-log-query, jira-view, iot-print-troubleshooting
文档类：project-writer, tech-doc-template, diagram-creation
管理类：skill-usage-tracker, skill-creator, dev-lifecycle

3️⃣ 提效工具链闭环

1
2
3

需求分析 → 技术方案 → 代码开发 → Code Review → 测试 → 上车
    ↓         ↓          ↓          ↓          ↓       ↓
brainstorm  spec-md   sdd-dev   full-review  集成测试  发布流程

二、核心思考与洞察

💡 1. Skills的定位与价值

Skills ≠ 静态文档，而是活的、会进化的知识库

本质：

通过prompt封装最佳实践，让AI”知道”什么时候用什么工具
不是简单的规则堆砌，而是经过实践检验的可复用经验

核心价值：

渐进式披露：按需加载，避免上下文爆炸
可迭代性：用完就优化，没有完美的skill，只有进化的skill
标准化输出：降低对模型能力的依赖，提升结果可预期性

Dev-Skills vs Helm的定位：

Dev-Skills：适合开发者，快速迭代，本地调试
Helm：适合统一管理，像ClawHub一样批量分发

迭代机制：

自动优化：主动发现改进点 → 提出建议 → 用户同意 → 立即更新
协作优化：用户反馈 → 调整描述和流程 → 优化原因记录
版本管理：每个SKILL.md顶部包含版本号和变更日志

💡 2. AI Coding的本质认知

AI不是替代开发者，而是放大器

能力边界：

1-N能力强大：给定详细文档，代码生成质量很高
0-1仍需人：需求理解、技术选型、架构设计需要人类决策
上下文至上：不是模型越强越好，而是prompt和skills越精准越好

模型使用策略：

简单任务：GLM-4.7（省钱，适合文档生成、简单CR）
复杂开发：Codex / GPT-5.2（聪明，适合复杂逻辑、跨应用开发）
文档生成：Claude / Opus 4.5（结构化输出能力强）

关键发现：

给Codex完美的文档，能打败用Opus盲写。上下文的质量比模型能力更重要。

💡 3. 全流程串联的关键

痛点：SDD经常被跳过，复杂需求直接开写，返工多

解决方案：智能路由

用户表达开发意图
    ↓
sdd-intelligent-router（四维评分）
    ├─ 应用影响（25%）：1个应用0分 / 2-3个应用30分 / 4+个应用60分 / 跨团队100分
    ├─ API变更（25%）：无变更0分 / 字段修改20分 / 新增简单API 40分 / 复杂API 70分 / 破坏性100分
    ├─ 数据模型（25%）：无变化0分 / 字段新增30分 / 索引50分 / 表结构80分 / 新增表+关系100分
    └─ 业务复杂度（25%）：简单CRUD 10分 / 条件判断30分 / 状态机60分 / 复杂规则90分 / 跨域100分
    ↓
├─ 🟢 0-30分：快速开发（ai-pair-programmer）
├─ 🟡 31-60分：询问用户选择
└─ 🔴 61-100分：强制SDD流程

已跑通闭环：

1
2
3

JIRA → zan-dev-flow → Trace分析 →
技术方案 → sdd-dev-workflow →
Codex开发 → CR → MR → 上车

三、未来方向与愿景

🎯 短期目标（1-3个月）

1. Skills持续迭代

[ ] 优化高频Skills（基于使用率统计脚本）
[ ] 完善”批量产虾”流程（新龙虾一键喂养Skills包）
[ ] 技能质量审查机制（师、分析师、创建师Agent Team协作）
[ ] Helm同步脚本优化（解决实时性问题，支持自动上传下载）

2. 全流程深度集成

[ ] airbag-skill → sdd开发 → CR 串联
[ ] Trace大师 → 代码修复 → CR → MR 闭环
[ ] OpenSpec提案 → tasks.md → Codex开发自动化
[ ] 集成测试用例生成 → 自动化测试 → 覆盖率报告

3. 工具链优化

[ ] 技能使用率监控面板（可视化展示高频Skills）
[ ] 多IDE统一配置方案（Cursor/CC/Codex一键同步）
[ ] 技能推荐系统（根据需求类型自动推荐Skills）
[ ] Token成本优化（GLM处理简单任务，节省成本）

🚀 中期目标（3-6个月）

1. Agent Team实践

打造多Agent协作系统：

需求分析Agent（brainstorming增强）
- 自动识别需求类型
- 生成技术方案草案
- 评估技术风险
代码开发Agent（门店规范 + SDD）
- 遵循团队编码规范
- 自动执行OpenSpec tasks
- 自我Code Review
CR审查Agent（full-review）
- 10个维度深度审查
- 生成CR报告
- 提出改进建议

目标：多Agent协作，一人就是一个团队

2. 知识库建设

三大知识库：

业务知识库（app-scanner自动生成SKILL.md）
- 应用架构
- 核心接口
- 数据模型
- 业务流程
技术方案库（标准化模板）
- 技术选型
- 架构设计
- 时序图、流程图
- 影响面分析
问题案例库（故障排查经验）
- JIRA案例
- Trace分析
- 解决方案
- 预防措施

目标：AI能自动检索上下文，降低人类干预

3. 研发流程标准化

SDD开发SOP（强制路由）
- 复杂度评估
- 技术方案评审
- OpenSpec提案
- 代码开发规范
CR审查规范（10个维度）
- 命名与可读性
- 逻辑正确性与健壮性
- 异常处理
- 并发、事务与一致性
- 兼容性与契约
- 性能与资源
- 架构与分层
- 安全性
- 测试
- 依赖与可观测性
发布流程自动化（CI/CD集成）
- 自动化测试
- 蓝绿发布
- 灰度切流
- 监控告警

目标：新人也能快速上手，输出质量可控

🌟 长期愿景（6-12个月）

愿景：打造像快手一样的Web平台，传PRD → 自动开发 → 自动测试 → 自动部署

1. 全流程自动化

1
2
3

PRD输入 → AI理解 → 自动生成技术方案 →
自动创建OpenSpec → 自动生成代码 →
自动CR → 自动测试 → 自动发布

2. 规模化复制

批量产虾：一键喂养Skills给新同事
跨团队推广：Skills开源到ClawHub
行业标准输出：门店AI实践成为公司标杆

3. 人机协作新模式

开发者定位转变：从”写代码”到”设计系统”
AI作为Partner：不是工具，而是结对编程对象
持续进化：每次使用都在优化AI能力

四、核心理念总结

✨ 我的AI观

1. 不要追求完美，追求快速迭代

Skills没有完美版本，只有不断进化
今天能用，明天优化，后天颠覆
实践出真知：用过的Skill才有价值，写在文档里的Skill是死的

2. 上下文比模型能力更重要

给Codex完美的文档，能打败用Opus盲写
Skills的价值就是提供精准上下文
渐进式披露：不要一股脑给所有信息，按需提供

3. 标准化是规模化的前提

SDD流程、CR规范、发布标准
AI能做的，必须标准化；AI做不了的，更要标准化
可复制性：一个人的经验，通过Skills变成团队的能力

4. 提效是手段，不是目的

真正的价值：让开发者从重复劳动中解放
去做更有创造性的事情：架构设计、业务创新、用户体验
时间重新分配：从写代码到思考系统设计

🎓 给团队的建议

1. 拥抱变化，快速试错

新工具出来就试，新模型发布就用
不怕用错，就怕不敢用
持续学习：AI领域变化太快，保持好奇心

2. 沉淀优于重复

遇到问题 → 解决 → 写成Skill → 分享给团队
一次解决，永久复用
知识复用：不要重复造轮子，而是优化轮子

3. AI不是替代，是放大

学会用AI的人，效率提升10倍
不会用AI的人，会被时代淘汰
人机协作：AI负责执行，人类负责决策

五、最终目标

让AI成为每个人的”超级实习生”，
我们负责思考方向，
AI负责落地执行，
共同创造更大的价值。🚀

附录：关键数据

提效数据

代码开发效率：提升3-5倍（90%代码由AI生成）
CR效率：提升2-3倍（AI自动发现问题）
文档编写效率：提升5-10倍（从0到1的突破）
故障排查效率：提升3倍（Trace自动分析）

覆盖范围

应用数：10+个零售核心应用
Skills数：30+个可复用技能
JIRA数：50+个需求/故障处理
文档数：20+份技术方案/SKILL.md

Token成本优化

GLM-4.7处理简单任务：成本降低70%
Codex处理复杂开发：成本降低40%（效率提升）
整体Token成本：降低50%，效率提升300%

“未来属于那些能够与AI协作的人。” —— 2026.03.16