🤖 关于AI的思考与未来方向

基于三个月(2025.12-2026.03)的AI Coding深度实践,总结了对AI的认知升级、Skills体系化建设、全流程串联经验,以及对未来的规划与愿景。


AI专题导航

如果把这篇文章当成我博客里 AI 主题的入口页,那我更希望它承担的是“导航”而不只是“感想”。下面这几篇,可以按你关心的问题顺着读下去:

1. 先看整体认知

2. 再看 OpenClaw 落地

3. 如果你关心模型选型

4. 如果你想研究 Agent 骨架


一、实践成果回顾

1️⃣ AI Coding深度实践

  • 首次实现90%代码量由AI生成(2026-02-02本地生活项目)
  • 跑通全流程:JIRA → Trace分析 → 代码修改 → CR → MR
  • 多工具对比:Cursor(主力)+ Claude Code(文档)+ Codex(聪明)
  • 模型认知升级:GPT-5.2 Codex > Opus 4.5 > GLM-4.7

关键里程碑

  • 12月:首次使用Cursor + Gemini分析Trace
  • 1月:体验Skill-creator,做基于上下文驱动的代码审查
  • 2月:第一次AI开发90%代码量,体验Codex 5.3模型的强大
  • 3月:完成Dev-Skills仓库,跑通Agent Team多Agent协作

2️⃣ Skills体系化建设

  • 创建30+个Skills(覆盖CR、开发、排障、文档等)
  • 主协调器设计:多技能串联,渐进式披露
  • 跨应用OpenSpec落地:解决AI识别应用范围问题
  • Dev-Skills仓库:统一管理,一键安装,支持Cursor/CC/Codex

核心Skills清单

  • 开发类:sdd-dev-workflow, ai-pair-programmer, brainstorming
  • CR类:team-cr, author-cr, full-review, code-review
  • 排障类:zan-dev-flow, zan-log-query, jira-view, iot-print-troubleshooting
  • 文档类:project-writer, tech-doc-template, diagram-creation
  • 管理类:skill-usage-tracker, skill-creator, dev-lifecycle

3️⃣ 提效工具链闭环

1
2
3
需求分析 → 技术方案 → 代码开发 → Code Review → 测试 → 上车
↓ ↓ ↓ ↓ ↓ ↓
brainstorm spec-md sdd-dev full-review 集成测试 发布流程

二、核心思考与洞察

💡 1. Skills的定位与价值

Skills ≠ 静态文档,而是活的、会进化的知识库

本质

  • 通过prompt封装最佳实践,让AI”知道”什么时候用什么工具
  • 不是简单的规则堆砌,而是经过实践检验的可复用经验

核心价值

  • 渐进式披露:按需加载,避免上下文爆炸
  • 可迭代性:用完就优化,没有完美的skill,只有进化的skill
  • 标准化输出:降低对模型能力的依赖,提升结果可预期性

Dev-Skills vs Helm的定位

  • Dev-Skills:适合开发者,快速迭代,本地调试
  • Helm:适合统一管理,像ClawHub一样批量分发

迭代机制

  • 自动优化:主动发现改进点 → 提出建议 → 用户同意 → 立即更新
  • 协作优化:用户反馈 → 调整描述和流程 → 优化原因记录
  • 版本管理:每个SKILL.md顶部包含版本号和变更日志

💡 2. AI Coding的本质认知

AI不是替代开发者,而是放大器

能力边界

  • 1-N能力强大:给定详细文档,代码生成质量很高
  • 0-1仍需人:需求理解、技术选型、架构设计需要人类决策
  • 上下文至上:不是模型越强越好,而是prompt和skills越精准越好

模型使用策略

  • 简单任务:GLM-4.7(省钱,适合文档生成、简单CR)
  • 复杂开发:Codex / GPT-5.2(聪明,适合复杂逻辑、跨应用开发)
  • 文档生成:Claude / Opus 4.5(结构化输出能力强)

关键发现

给Codex完美的文档,能打败用Opus盲写。上下文的质量比模型能力更重要。

💡 3. 全流程串联的关键

痛点:SDD经常被跳过,复杂需求直接开写,返工多

解决方案:智能路由

1
2
3
4
5
6
7
8
9
10
11
用户表达开发意图

sdd-intelligent-router(四维评分)
├─ 应用影响(25%):1个应用0/ 2-3个应用30/ 4+个应用60/ 跨团队100
├─ API变更(25%):无变更0/ 字段修改20/ 新增简单API 40/ 复杂API 70/ 破坏性100
├─ 数据模型(25%):无变化0/ 字段新增30/ 索引50/ 表结构80/ 新增表+关系100
└─ 业务复杂度(25%):简单CRUD 10/ 条件判断30/ 状态机60/ 复杂规则90/ 跨域100

├─ 🟢 0-30分:快速开发(ai-pair-programmer)
├─ 🟡 31-60分:询问用户选择
└─ 🔴 61-100分:强制SDD流程

已跑通闭环

1
2
3
JIRA → zan-dev-flow → Trace分析 →
技术方案 → sdd-dev-workflow →
Codex开发 → CR → MR → 上车


三、未来方向与愿景

🎯 短期目标(1-3个月)

1. Skills持续迭代

  • [ ] 优化高频Skills(基于使用率统计脚本)
  • [ ] 完善”批量产虾”流程(新龙虾一键喂养Skills包)
  • [ ] 技能质量审查机制(师、分析师、创建师Agent Team协作)
  • [ ] Helm同步脚本优化(解决实时性问题,支持自动上传下载)

2. 全流程深度集成

  • [ ] airbag-skill → sdd开发 → CR 串联
  • [ ] Trace大师 → 代码修复 → CR → MR 闭环
  • [ ] OpenSpec提案 → tasks.md → Codex开发自动化
  • [ ] 集成测试用例生成 → 自动化测试 → 覆盖率报告

3. 工具链优化

  • [ ] 技能使用率监控面板(可视化展示高频Skills)
  • [ ] 多IDE统一配置方案(Cursor/CC/Codex一键同步)
  • [ ] 技能推荐系统(根据需求类型自动推荐Skills)
  • [ ] Token成本优化(GLM处理简单任务,节省成本)

🚀 中期目标(3-6个月)

1. Agent Team实践

打造多Agent协作系统:

  • 需求分析Agent(brainstorming增强)

    • 自动识别需求类型
    • 生成技术方案草案
    • 评估技术风险
  • 代码开发Agent(门店规范 + SDD)

    • 遵循团队编码规范
    • 自动执行OpenSpec tasks
    • 自我Code Review
  • CR审查Agent(full-review)

    • 10个维度深度审查
    • 生成CR报告
    • 提出改进建议

目标:多Agent协作,一人就是一个团队

2. 知识库建设

三大知识库:

  • 业务知识库(app-scanner自动生成SKILL.md)

    • 应用架构
    • 核心接口
    • 数据模型
    • 业务流程
  • 技术方案库(标准化模板)

    • 技术选型
    • 架构设计
    • 时序图、流程图
    • 影响面分析
  • 问题案例库(故障排查经验)

    • JIRA案例
    • Trace分析
    • 解决方案
    • 预防措施

目标:AI能自动检索上下文,降低人类干预

3. 研发流程标准化

  • SDD开发SOP(强制路由)

    • 复杂度评估
    • 技术方案评审
    • OpenSpec提案
    • 代码开发规范
  • CR审查规范(10个维度)

    • 命名与可读性
    • 逻辑正确性与健壮性
    • 异常处理
    • 并发、事务与一致性
    • 兼容性与契约
    • 性能与资源
    • 架构与分层
    • 安全性
    • 测试
    • 依赖与可观测性
  • 发布流程自动化(CI/CD集成)

    • 自动化测试
    • 蓝绿发布
    • 灰度切流
    • 监控告警

目标:新人也能快速上手,输出质量可控

🌟 长期愿景(6-12个月)

愿景:打造像快手一样的Web平台,传PRD → 自动开发 → 自动测试 → 自动部署

1. 全流程自动化

1
2
3
PRD输入 → AI理解 → 自动生成技术方案 →
自动创建OpenSpec → 自动生成代码 →
自动CR → 自动测试 → 自动发布

2. 规模化复制

  • 批量产虾:一键喂养Skills给新同事
  • 跨团队推广:Skills开源到ClawHub
  • 行业标准输出:门店AI实践成为公司标杆

3. 人机协作新模式

  • 开发者定位转变:从”写代码”到”设计系统”
  • AI作为Partner:不是工具,而是结对编程对象
  • 持续进化:每次使用都在优化AI能力

四、核心理念总结

✨ 我的AI观

1. 不要追求完美,追求快速迭代

  • Skills没有完美版本,只有不断进化
  • 今天能用,明天优化,后天颠覆
  • 实践出真知:用过的Skill才有价值,写在文档里的Skill是死的

2. 上下文比模型能力更重要

  • 给Codex完美的文档,能打败用Opus盲写
  • Skills的价值就是提供精准上下文
  • 渐进式披露:不要一股脑给所有信息,按需提供

3. 标准化是规模化的前提

  • SDD流程、CR规范、发布标准
  • AI能做的,必须标准化;AI做不了的,更要标准化
  • 可复制性:一个人的经验,通过Skills变成团队的能力

4. 提效是手段,不是目的

  • 真正的价值:让开发者从重复劳动中解放
  • 去做更有创造性的事情:架构设计、业务创新、用户体验
  • 时间重新分配:从写代码到思考系统设计

🎓 给团队的建议

1. 拥抱变化,快速试错

  • 新工具出来就试,新模型发布就用
  • 不怕用错,就怕不敢用
  • 持续学习:AI领域变化太快,保持好奇心

2. 沉淀优于重复

  • 遇到问题 → 解决 → 写成Skill → 分享给团队
  • 一次解决,永久复用
  • 知识复用:不要重复造轮子,而是优化轮子

3. AI不是替代,是放大

  • 学会用AI的人,效率提升10倍
  • 不会用AI的人,会被时代淘汰
  • 人机协作:AI负责执行,人类负责决策

五、最终目标

让AI成为每个人的”超级实习生”,
我们负责思考方向,
AI负责落地执行,
共同创造更大的价值。🚀


附录:关键数据

提效数据

  • 代码开发效率:提升3-5倍(90%代码由AI生成)
  • CR效率:提升2-3倍(AI自动发现问题)
  • 文档编写效率:提升5-10倍(从0到1的突破)
  • 故障排查效率:提升3倍(Trace自动分析)

覆盖范围

  • 应用数:10+个零售核心应用
  • Skills数:30+个可复用技能
  • JIRA数:50+个需求/故障处理
  • 文档数:20+份技术方案/SKILL.md

Token成本优化

  • GLM-4.7处理简单任务:成本降低70%
  • Codex处理复杂开发:成本降低40%(效率提升)
  • 整体Token成本:降低50%,效率提升300%

“未来属于那些能够与AI协作的人。” —— 2026.03.16

延伸阅读