关于AI的思考与未来方向
🤖 关于AI的思考与未来方向
基于三个月(2025.12-2026.03)的AI Coding深度实践,总结了对AI的认知升级、Skills体系化建设、全流程串联经验,以及对未来的规划与愿景。
AI专题导航
如果把这篇文章当成我博客里 AI 主题的入口页,那我更希望它承担的是“导航”而不只是“感想”。下面这几篇,可以按你关心的问题顺着读下去:
1. 先看整体认知
- AI理解与应用:偏基础梳理,适合先把 RAG、MCP、Agent 这些概念串起来。
- 关于AI的思考与未来方向:偏实践复盘,适合看我怎么把 AI Coding、Skills 和流程串起来。
2. 再看 OpenClaw 落地
- OpenClaw完全指南:从入门到精通:安装、命令、核心原理的一站式说明。
- OpenClaw:你的24小时AI合伙人,重新定义工作流:更偏真实工作场景,适合理解 OpenClaw 的价值边界。
- OpenClaw搭建AI特工团队:从单兵作战到协同作战:适合继续看多 Agent 协作和团队化配置。
3. 如果你关心模型选型
- GPT-5.5 vs GPT-6 vs Claude Opus 4.7 编码推理与记忆的全面对比:偏模型能力和开发者选型。
4. 如果你想研究 Agent 骨架
- Claude Code Agent Harness入门:从Skills、Session到Memory说起:适合先建立整体概念。
- Claude Code Agent Harness工程拆解:Skills、Session与记忆系统的实现骨架:适合进一步看工程层面的组织方式。
一、实践成果回顾
1️⃣ AI Coding深度实践
- ✅ 首次实现90%代码量由AI生成(2026-02-02本地生活项目)
- ✅ 跑通全流程:JIRA → Trace分析 → 代码修改 → CR → MR
- ✅ 多工具对比:Cursor(主力)+ Claude Code(文档)+ Codex(聪明)
- ✅ 模型认知升级:GPT-5.2 Codex > Opus 4.5 > GLM-4.7
关键里程碑:
- 12月:首次使用Cursor + Gemini分析Trace
- 1月:体验Skill-creator,做基于上下文驱动的代码审查
- 2月:第一次AI开发90%代码量,体验Codex 5.3模型的强大
- 3月:完成Dev-Skills仓库,跑通Agent Team多Agent协作
2️⃣ Skills体系化建设
- ✅ 创建30+个Skills(覆盖CR、开发、排障、文档等)
- ✅ 主协调器设计:多技能串联,渐进式披露
- ✅ 跨应用OpenSpec落地:解决AI识别应用范围问题
- ✅ Dev-Skills仓库:统一管理,一键安装,支持Cursor/CC/Codex
核心Skills清单:
- 开发类:sdd-dev-workflow, ai-pair-programmer, brainstorming
- CR类:team-cr, author-cr, full-review, code-review
- 排障类:zan-dev-flow, zan-log-query, jira-view, iot-print-troubleshooting
- 文档类:project-writer, tech-doc-template, diagram-creation
- 管理类:skill-usage-tracker, skill-creator, dev-lifecycle
3️⃣ 提效工具链闭环
1 | 需求分析 → 技术方案 → 代码开发 → Review → 测试 → 上车 |
二、核心思考与洞察
💡 1. Skills的定位与价值
Skills ≠ 静态文档,而是活的、会进化的知识库
本质:
- 通过prompt封装最佳实践,让AI”知道”什么时候用什么工具
- 不是简单的规则堆砌,而是经过实践检验的可复用经验
核心价值:
- 渐进式披露:按需加载,避免上下文爆炸
- 可迭代性:用完就优化,没有完美的skill,只有进化的skill
- 标准化输出:降低对模型能力的依赖,提升结果可预期性
Dev-Skills vs Helm的定位:
- Dev-Skills:适合开发者,快速迭代,本地调试
- Helm:适合统一管理,像ClawHub一样批量分发
迭代机制:
- 自动优化:主动发现改进点 → 提出建议 → 用户同意 → 立即更新
- 协作优化:用户反馈 → 调整描述和流程 → 优化原因记录
- 版本管理:每个SKILL.md顶部包含版本号和变更日志
💡 2. AI Coding的本质认知
AI不是替代开发者,而是放大器
能力边界:
- 1-N能力强大:给定详细文档,代码生成质量很高
- 0-1仍需人:需求理解、技术选型、架构设计需要人类决策
- 上下文至上:不是模型越强越好,而是prompt和skills越精准越好
模型使用策略:
- 简单任务:GLM-4.7(省钱,适合文档生成、简单CR)
- 复杂开发:Codex / GPT-5.2(聪明,适合复杂逻辑、跨应用开发)
- 文档生成:Claude / Opus 4.5(结构化输出能力强)
关键发现:
给Codex完美的文档,能打败用Opus盲写。上下文的质量比模型能力更重要。
💡 3. 全流程串联的关键
痛点:SDD经常被跳过,复杂需求直接开写,返工多
解决方案:智能路由
1 | 用户表达开发意图 |
已跑通闭环:1
2
3JIRA → zan-dev-flow → Trace分析 →
技术方案 → sdd-dev-workflow →
Codex开发 → CR → MR → 上车
三、未来方向与愿景
🎯 短期目标(1-3个月)
1. Skills持续迭代
- [ ] 优化高频Skills(基于使用率统计脚本)
- [ ] 完善”批量产虾”流程(新龙虾一键喂养Skills包)
- [ ] 技能质量审查机制(师、分析师、创建师Agent Team协作)
- [ ] Helm同步脚本优化(解决实时性问题,支持自动上传下载)
2. 全流程深度集成
- [ ] airbag-skill → sdd开发 → CR 串联
- [ ] Trace大师 → 代码修复 → CR → MR 闭环
- [ ] OpenSpec提案 → tasks.md → Codex开发自动化
- [ ] 集成测试用例生成 → 自动化测试 → 覆盖率报告
3. 工具链优化
- [ ] 技能使用率监控面板(可视化展示高频Skills)
- [ ] 多IDE统一配置方案(Cursor/CC/Codex一键同步)
- [ ] 技能推荐系统(根据需求类型自动推荐Skills)
- [ ] Token成本优化(GLM处理简单任务,节省成本)
🚀 中期目标(3-6个月)
1. Agent Team实践
打造多Agent协作系统:
需求分析Agent(brainstorming增强)
- 自动识别需求类型
- 生成技术方案草案
- 评估技术风险
代码开发Agent(门店规范 + SDD)
- 遵循团队编码规范
- 自动执行OpenSpec tasks
- 自我Code Review
CR审查Agent(full-review)
- 10个维度深度审查
- 生成CR报告
- 提出改进建议
目标:多Agent协作,一人就是一个团队
2. 知识库建设
三大知识库:
业务知识库(app-scanner自动生成SKILL.md)
- 应用架构
- 核心接口
- 数据模型
- 业务流程
技术方案库(标准化模板)
- 技术选型
- 架构设计
- 时序图、流程图
- 影响面分析
问题案例库(故障排查经验)
- JIRA案例
- Trace分析
- 解决方案
- 预防措施
目标:AI能自动检索上下文,降低人类干预
3. 研发流程标准化
SDD开发SOP(强制路由)
- 复杂度评估
- 技术方案评审
- OpenSpec提案
- 代码开发规范
CR审查规范(10个维度)
- 命名与可读性
- 逻辑正确性与健壮性
- 异常处理
- 并发、事务与一致性
- 兼容性与契约
- 性能与资源
- 架构与分层
- 安全性
- 测试
- 依赖与可观测性
发布流程自动化(CI/CD集成)
- 自动化测试
- 蓝绿发布
- 灰度切流
- 监控告警
目标:新人也能快速上手,输出质量可控
🌟 长期愿景(6-12个月)
愿景:打造像快手一样的Web平台,传PRD → 自动开发 → 自动测试 → 自动部署
1. 全流程自动化
1 | PRD输入 → AI理解 → 自动生成技术方案 → |
2. 规模化复制
- 批量产虾:一键喂养Skills给新同事
- 跨团队推广:Skills开源到ClawHub
- 行业标准输出:门店AI实践成为公司标杆
3. 人机协作新模式
- 开发者定位转变:从”写代码”到”设计系统”
- AI作为Partner:不是工具,而是结对编程对象
- 持续进化:每次使用都在优化AI能力
四、核心理念总结
✨ 我的AI观
1. 不要追求完美,追求快速迭代
- Skills没有完美版本,只有不断进化
- 今天能用,明天优化,后天颠覆
- 实践出真知:用过的Skill才有价值,写在文档里的Skill是死的
2. 上下文比模型能力更重要
- 给Codex完美的文档,能打败用Opus盲写
- Skills的价值就是提供精准上下文
- 渐进式披露:不要一股脑给所有信息,按需提供
3. 标准化是规模化的前提
- SDD流程、CR规范、发布标准
- AI能做的,必须标准化;AI做不了的,更要标准化
- 可复制性:一个人的经验,通过Skills变成团队的能力
4. 提效是手段,不是目的
- 真正的价值:让开发者从重复劳动中解放
- 去做更有创造性的事情:架构设计、业务创新、用户体验
- 时间重新分配:从写代码到思考系统设计
🎓 给团队的建议
1. 拥抱变化,快速试错
- 新工具出来就试,新模型发布就用
- 不怕用错,就怕不敢用
- 持续学习:AI领域变化太快,保持好奇心
2. 沉淀优于重复
- 遇到问题 → 解决 → 写成Skill → 分享给团队
- 一次解决,永久复用
- 知识复用:不要重复造轮子,而是优化轮子
3. AI不是替代,是放大
- 学会用AI的人,效率提升10倍
- 不会用AI的人,会被时代淘汰
- 人机协作:AI负责执行,人类负责决策
五、最终目标
让AI成为每个人的”超级实习生”,
我们负责思考方向,
AI负责落地执行,
共同创造更大的价值。🚀
附录:关键数据
提效数据
- 代码开发效率:提升3-5倍(90%代码由AI生成)
- CR效率:提升2-3倍(AI自动发现问题)
- 文档编写效率:提升5-10倍(从0到1的突破)
- 故障排查效率:提升3倍(Trace自动分析)
覆盖范围
- 应用数:10+个零售核心应用
- Skills数:30+个可复用技能
- JIRA数:50+个需求/故障处理
- 文档数:20+份技术方案/SKILL.md
Token成本优化
- GLM-4.7处理简单任务:成本降低70%
- Codex处理复杂开发:成本降低40%(效率提升)
- 整体Token成本:降低50%,效率提升300%
“未来属于那些能够与AI协作的人。” —— 2026.03.16
延伸阅读
- 想看 OpenClaw 在实际工作流里的落地形态,可以读 OpenClaw:你的24小时AI合伙人,重新定义工作流。
- 想看多 Agent 协作怎么从概念走到配置和分工,可以读 OpenClaw搭建AI特工团队:从单兵作战到协同作战。
- 想看 2026 年主流模型在编码和推理上的差异,可以读 GPT-5.5 vs GPT-6 vs Claude Opus 4.7 编码推理与记忆的全面对比。
- 想继续深挖 agent harness 的底层结构,可以读 Claude Code Agent Harness入门:从Skills、Session到Memory说起。




