<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
  <channel>
    <title>AI - 分类 - cfanzp学习笔记</title>
    <link>https://cfanzp008.github.io/categories/ai/</link>
    <description>AI - 分类 - cfanzp学习笔记</description>
    <generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>cfan.zp@qq.com (cfanzp)</managingEditor>
      <webMaster>cfan.zp@qq.com (cfanzp)</webMaster><lastBuildDate>Wed, 08 Apr 2026 18:06:11 &#43;0800</lastBuildDate><atom:link href="https://cfanzp008.github.io/categories/ai/" rel="self" type="application/rss+xml" /><item>
  <title>OpenSpec 工程化规范总结</title>
  <link>https://cfanzp008.github.io/openspec-engineering-summary/</link>
  <pubDate>Wed, 08 Apr 2026 18:06:11 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/openspec-engineering-summary/</guid>
  <description><![CDATA[OpenSpec 工程化规范总结 什么是 OpenSpec OpenSpec 是一个面向 AI 编码助手的规范驱动开发框架（Spec-Driven Development，SDD）。它的核心理念是在编写任何代码之前，先创建可审查的规范（Spec），让人类开发者和 AI 编码助手能够就项目意图达成共识。
该项目在 GitHub 上已获得 37,000+ 颗星，是 AI 开发工具领域最受欢迎的项目之一。
核心价值 1. 解决 AI 编程的沟通问题 传统编程中，开发者通过代码表达意图。但 AI 编程助理解读代码时可能会产生偏差，导致：
实现与预期不符 重复修改 项目失控 OpenSpec 通过在编码前明确定义规范来解决这个问题。
2. 版本控制意图 OpenSpec 充当「意图的版本控制」：
规范文件可以被审查 可以版本化管理 可以追踪意图的演变 便于人类和 AI 协同理解 3. 防止「氛围编程」 「Vibe Coding」（氛围编程）是指盲目跟随 AI 生成代码，缺乏深思熟虑的设计。OpenSpec 强制要求在编码前思考和规划。
OpenSpec 规范结构 1. Project Spec（项目规范） 定义项目的整体结构和目标：
1 2 3 4 5 6 7 name: my-project description: A web application for task management version: 1.]]></description>
</item>
<item>
  <title>Superpowers 自动化使用指南</title>
  <link>https://cfanzp008.github.io/superpowers-automation-guide/</link>
  <pubDate>Wed, 08 Apr 2026 18:04:31 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/superpowers-automation-guide/</guid>
  <description><![CDATA[Superpowers 自动化使用指南 什么是 Superpowers Superpowers 是 OpenCode 平台推出的一套 AI 技能框架，旨在为 AI Agent 提供专家级能力。通过 Superpowers，用户可以将特定领域的知识和工作流封装为可重用的技能（Skills），让 AI 在执行任务时能够自动调用这些技能。
Superpowers 的核心理念是「让 AI 具备专业领域知识」，就像为 AI 配备了一个随身携带的专家团队。
Superpowers 架构 技能类型 Superpowers 将技能分为两类：
Rigid Skills（刚性技能）：严格遵循预设流程，如 TDD（测试驱动开发）、Debugging
使用时必须完全按照规范执行 不允许随意调整流程 Flexible Skills（柔性技能）：可以灵活适应上下文，如 Patterns
可以根据实际情况调整实现方式 需要理解技能背后的原理 技能层级 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 Superpowers ├── 基础技能（Built-in） │ ├── playwright │ ├── frontend-ui-ux │ ├── git-master │ ├── dev-browser │ ├── review-work │ └── ai-slop-remover │ ├── 用户技能（User-installed） │ ├── doc-coauthoring │ ├── blog-do-publish │ ├── pdf │ ├── docx │ ├── xlsx │ ├── pptx │ ├── mcp-builder │ └── article-writer │ └── 超级技能（Superpowers） ├── using-superpowers ├── brainstorming ├── test-driven-development ├── systematic-debugging ├── verification-before-completion ├── requesting-code-review ├── receiving-code-review ├── finishing-a-development-branch ├── writing-plans ├── executing-plans ├── subagent-driven-development ├── writing-skills ├── skill-creator ├── using-git-worktrees └── dispatching-parallel-agents 如何使用 Superpowers 1.]]></description>
</item>
<item>
  <title>Google Workspace CLI：统一管理 Google Workspace 的命令行工具</title>
  <link>https://cfanzp008.github.io/google-workspace-cli-introduction/</link>
  <pubDate>Wed, 08 Apr 2026 16:49:45 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/google-workspace-cli-introduction/</guid>
  <description><![CDATA[Google Workspace CLI：统一管理 Google Workspace 的命令行工具 引言 对于经常使用 Google Workspace（Google 工作空间）的用户来说，管理 Drive、Gmail、Calendar、Sheets、Docs、Chat 等多个服务往往需要在浏览器和多个应用之间切换。虽然 Google 提供了 Web 界面和各个服务的 API，但使用这些 API 需要编写大量重复的代码和配置。Google Workspace CLI（简称 gws）的出现改变了这一状况，它提供了一个统一的命令行界面，可以操控所有 Google Workspace 服务。
gws 在 GitHub 上已获得 24,000+ 颗星，是当前最受欢迎的 Google Workspace 命令行工具。它采用 Rust 语言开发，具有高性能和跨平台特性，同时支持人类用户和 AI 代理使用。
什么是 Google Workspace CLI Google Workspace CLI（gws）是一个统一的命令行工具，旨在为人类用户和 AI 代理提供一种简单、优雅的方式来管理所有 Google Workspace 服务。无论你是想查看 Drive 文件、发送 Gmail 邮件、管理 Calendar 事件，还是操作 Sheets 表格、Docs 文档、Chat 消息，一个 gws 命令就能搞定。
gws 的独特之处在于它采用了动态命令构建机制。它并不硬编码一组固定的命令，而是通过读取 Google 的 Discovery Service（发现服务）在运行时动态生成整个命令表面。这意味着当 Google 添加新的 API 端点或方法时，gws 会自动获取并可用，无需任何更新。]]></description>
</item>
<item>
  <title>Google NotebookLM：AI 驱动的智能笔记本详解</title>
  <link>https://cfanzp008.github.io/notebooklm-usage-guide/</link>
  <pubDate>Wed, 08 Apr 2026 15:47:49 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/notebooklm-usage-guide/</guid>
  <description><![CDATA[Google NotebookLM：AI 驱动的智能笔记本详解 什么是 NotebookLM NotebookLM 是 Google 实验室（Google Labs）推出的一款实验性 AI 笔记本工具。它的核心理念是「以 AI 为核心的笔记本」——从设计之初就将强大的语言模型融入其中，帮助用户更快地从信息中获取洞察。
与传统的 AI 聊天机器人不同，NotebookLM 的独特之处在于它的「源 grounding」机制。你可以将自己选择的文档作为 AI 的知识来源，让 AI 只基于你提供的资料来回答问题。这不仅大大减少了「幻觉」问题，还确保了答案的相关性和准确性。
NotebookLM 最初于 2023 年 7 月以「Project Tailwind」的名字在 Google I/O 大会上首次亮相，随后正式命名为 NotebookLM。经过几年发展，它已经从最初的文档摘要工具演变为一个功能强大的多模态学习和工作助手。
核心功能详解 1. 智能文档导入 NotebookLM 支持多种文档格式的导入：
Google Docs：可以直接关联你的 Google 文档 PDF 文件：上传 PDF 文档进行分析 网页内容：可以通过 URL 导入网页内容 音频文件：支持上传音频文件进行转录和分析 Markdown 和文本文件：支持纯文本格式 导入文档后，NotebookLM 会自动分析内容，生成摘要、关键主题和可能的问题，帮助你快速了解文档概况。
2. AI 问答功能 基于导入的文档，你可以向 NotebookLM 提问：
医学学生可以上传神经科学论文，让 AI「创建与多巴胺相关的术语表」 作者可以上传研究笔记，问「汇总霍迪尼和柯南·道尔的所有互动」 学生可以上传课堂笔记，让 AI 解释不清楚的概念 每个回答都会附带引用标注，直接指向原文中的相关段落，方便你核实信息的准确性。
3. 音频概览（Audio Overview） NotebookLM 最受欢迎的功能之一是「音频概览」。它可以将你的文档转换为一段由 AI 生成的对话式播客：]]></description>
</item>
<item>
  <title>Hermes Agent：会自我进化的 AI 智能体</title>
  <link>https://cfanzp008.github.io/hermes-agent-introduction/</link>
  <pubDate>Wed, 08 Apr 2026 13:43:55 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/hermes-agent-introduction/</guid>
  <description><![CDATA[Hermes Agent：会自我进化的 AI 智能体 引言 在人工智能快速发展的今天，AI 智能体（Agent）已经成为技术领域的热门话题。大多数 AI 智能体本质上只是「带有额外步骤的聊天机器人」——你与它们对话，它们忘记一切，下次重新开始。然而，Hermes Agent 采取了不同的方式，它致力于打造一个「与你共同成长的智能体」。
Hermes Agent 是由 Nous Research 开发的开源 AI 智能体，核心理念是「The agent that grows with you」（与你共同成长的智能体）。该项目在 GitHub 上已获得 33,000+ 颗星，是当前最受欢迎的自进化 AI 智能体之一。
什么是 Hermes Agent Hermes Agent 是一个功能强大的开源 autonomous AI agent，采用 MIT 许可证发布。与传统聊天机器人不同，它具有以下核心特性：
长期记忆：跨会话记住重要信息，自动保存学习到的知识 自我进化：从成功和失败中学习，逐渐适应用户的习惯和偏好 多平台运行：支持本地运行（保护隐私）、Ollama 部署、云端 API 调用 完全开源：社区活跃，持续迭代更新 核心功能详解 1. 持久记忆系统 Hermes Agent 拥有先进的持久记忆系统，通过 MEMORY.md 和 USER.md 文件保存用户偏好、项目信息和学习到的知识。这种有边界的、精心管理的记忆能够跨会话持久化，让 Agent 记住你的偏好、项目和环境设置。
2. 上下文文件 Hermes Agent 能够自动发现和加载项目上下文文件，包括：
.hermes.md AGENTS.md CLAUDE.md SOUL.md .cursorrules 这些文件会塑造 Agent 在项目中的行为方式，让它更好地理解你的项目规范和需求。]]></description>
</item>
<item>
  <title>Hermes Agent 深度用法指南：自我进化的 AI 智能体完全手册</title>
  <link>https://cfanzp008.github.io/hermes-agent-usage-guide/</link>
  <pubDate>Wed, 08 Apr 2026 13:19:33 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/hermes-agent-usage-guide/</guid>
  <description><![CDATA[Hermes Agent 深度用法指南：自我进化的 AI 智能体完全手册 背景简介 Hermes Agent 是由 Nous Research 开发的开源 AI 智能体，被称为&quot;会成长的智能体&quot;（The agent that grows with you）。截至目前，其 GitHub 仓库已获得超过 33000 颗星，是当前最受欢迎的自进化 AI 智能体之一。
与传统的 AI 助手不同，Hermes Agent 具备：
内置学习循环：从经验中创建 Skills，持续自我改进 持久记忆：跨会话记住重要信息，建立用户模型 多平台运行：本地、SSH、Docker、云端皆可运行 完全开源：MIT 许可证，社区活跃 思维导图：Hermes Agent 核心架构 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 ┌─────────────────────────────────────────┐ │ Hermes Agent 核心架构 │ └─────────────────────────────────────────┘ │ ┌─────────────────────────────────┼─────────────────────────────────┐ │ │ │ ▼ ▼ ▼ ┌─────────────────────┐ ┌─────────────────────┐ ┌─────────────────────┐ │ 运行模式 │ │ 核心系统 │ │ 接入平台 │ │ │ │ │ │ │ └─────────────────────┘ └─────────────────────┘ └─────────────────────┘ │ │ │ ├─CLI 终端 ├─Skills 系统 ├─Telegram ├─Gateway 网关 ├─Memory 记忆 ├─Discord ├─本地运行 ├─MCP 集成 ├─Slack ├─SSH 远程 ├─工具集 ├─WhatsApp └─Docker/云端 ├─计划任务 └─Email │ ▼ ┌─────────────────────────────────┐ │ 模型支持 │ ├─────────────────────────────────┤ │ • Nous Portal │ │ • OpenRouter (200+ 模型) │ │ • OpenAI / Anthropic │ │ • Kimi / MiniMax / GLM │ │ • 本地 Ollama │ └─────────────────────────────────┘ 安装与配置 快速安装 1 2 3 4 5 6 7 8 # 一键安装（Linux/macOS/WSL2） curl -fsSL https://raw.]]></description>
</item>
<item>
  <title>n8n 自部署指南：开源工作流自动化平台</title>
  <link>https://cfanzp008.github.io/n8n-deployment-guide/</link>
  <pubDate>Tue, 07 Apr 2026 18:22:15 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/n8n-deployment-guide/</guid>
  <description><![CDATA[n8n 自部署指南：开源工作流自动化平台 什么是 n8n n8n（发音为 &ldquo;n-eight-n&rdquo;）是一个开源的工作流自动化平台，被称为&quot;自托管的 Zapier 替代品&quot;。它允许用户通过可视化的节点编辑器创建自动化工作流，连接不同的应用程序和服务，实现业务流程的自动化。
n8n 的核心特点：
开源免费：MIT 许可证，可自托管 可视化编辑器：无需编码，通过拖拽创建工作流 丰富集成：支持 400+ 应用集成 灵活部署：支持 Docker、Kubernetes、本地部署 定时执行：支持手动、定时、事件触发 截至目前，n8n 在 GitHub 上已获得超过 37000 个 Star，是最受欢迎的自动化工作流工具之一。
部署方式选择 n8n 支持多种部署方式：
部署方式 适用场景 难度 Docker Compose（SQLite） 个人使用、小团队 简单 Docker Compose（PostgreSQL） 生产环境、多用户 中等 Node.js (npm) 本地开发测试 简单 Kubernetes 大规模生产部署 复杂 Docker Compose 部署（推荐） 环境要求 服务器：Ubuntu 22.04+ 或其他 Linux 发行版 资源：建议 2GB+ 内存，20GB+ 存储 Docker 和 Docker Compose 已安装 简单版（SQLite） 创建项目目录和配置文件：
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 mkdir -p ~/n8n &amp;&amp; cd ~/n8n cat &gt; docker-compose.]]></description>
</item>
<item>
  <title>OpenSpec：让 AI 编程助手遵循规范而非猜测</title>
  <link>https://cfanzp008.github.io/openspec-introduction/</link>
  <pubDate>Tue, 07 Apr 2026 14:28:22 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/openspec-introduction/</guid>
  <description><![CDATA[OpenSpec：让 AI 编程助手遵循规范而非猜测 背景简介 AI 编程助手最常见的问题不是它们不会写代码，而是它们写出的代码与你的预期不符。你说&quot;添加深色模式&quot;，它却重写了 CSS 变量、添加了切换按钮、还重构了布局——而你只是想改变颜色变量。下一次对话时，上下文丢失了，AI 又从零开始猜测你的意图。
OpenSpec 解决了这个问题：在 AI 开始写代码之前先生成规范文档。双方先对齐&quot;要做什么&quot;和&quot;怎么做&quot;，然后再按照规范实现。
截至目前，OpenSpec 在 GitHub 上已获得超过 36000 个 Star，成为 AI 驱动开发领域的标杆框架。
核心架构 OpenSpec 将项目知识分为两个部分：
1 2 3 4 5 6 7 8 9 openspec/ ├── specs/ ← 真实来源（当前行为） │ ├── auth/ │ │ └── spec.md │ └── payments/ │ └── spec.md └── changes/ ← 进行中的修改（每个变更一个文件夹） ├── add-dark-mode/ └── archive/ ← 已完成的变更归档 Specs 描述系统的当前行为，Changes 是提出的修改。分开管理，多个变更可以并行进行而不会冲突。
思维导图：OpenSpec 整体架构 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 ┌─────────────────────────────────────────┐ │ OpenSpec 框架 │ │ 规范驱动开发 (Spec-Driven Dev) │ └─────────────────────────────────────────┘ │ ┌─────────────────────────────────┼─────────────────────────────────┐ │ │ │ ▼ ▼ ▼ ┌─────────────────────┐ ┌─────────────────────┐ ┌─────────────────────┐ │ 真实来源 │ │ 变更管理 │ │ 工作流程 │ │ (Specs) │ │ (Changes) │ │ (Workflow) │ └─────────────────────┘ └─────────────────────┘ └─────────────────────┘ │ │ │ ├─系统当前行为 ├─proposal（提议） ├─propose ├─增量更新 ├─specs（增量规范） ├─apply └─版本历史 ├─design（设计） ├─archive └─tasks（任务清单） └─explore │ ├─ADDED（新增） ├─MODIFIED（修改） └─REMOVED（删除） ▼ ┌─────────────────────────────────┐ │ 四类产出物 │ ├─────────────────────────────────┤ │ • proposal.]]></description>
</item>
<item>
  <title>OpenCode Skill Creator 使用指南</title>
  <link>https://cfanzp008.github.io/opencode-skill-creator-guide/</link>
  <pubDate>Tue, 07 Apr 2026 14:19:21 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/opencode-skill-creator-guide/</guid>
  <description><![CDATA[OpenCode Skill Creator 使用指南 什么是 Skill Creator Skill Creator 是 Anthropic 官方提供的 Skill 开发助手，帮助开发者创建、优化和打包技能。它是 Claude Code 生态中用于扩展 Agent 能力的重要机制。
在 Claude Code / OpenCode 中，Skill（技能） 是一种可复用的能力扩展包，本质上是一个模块化知识包，可以给 AI 添加：
专业领域知识 固定工作流程 API / 工具使用方式 模板和脚本 简单理解：Skill = 给 AI 写的一份操作说明书
核心价值：
将工作流程固化为可复用的技能 让 AI 助手具备领域专业知识 提高团队协作效率 标准化工作流程 思维导图：Skill Creator 整体架构 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 ┌─────────────────────────────────────────┐ │ Skill Creator 框架 │ │ AI 技能开发与评估工具链 │ └─────────────────────────────────────────┘ │ ┌─────────────────────────────────┼─────────────────────────────────┐ │ │ │ ▼ ▼ ▼ ┌─────────────────────┐ ┌─────────────────────┐ ┌─────────────────────┐ │ 技能结构 │ │ 工作流程 │ │ 核心工具 │ │ (File Structure) │ │ (Workflow) │ │ (Tools) │ └─────────────────────┘ └─────────────────────┘ └─────────────────────┘ │ │ │ ├─SKILL.]]></description>
</item>
<item>
  <title>RAG检索增强生成分类详解</title>
  <link>https://cfanzp008.github.io/rag-classification-detailed-guide/</link>
  <pubDate>Tue, 07 Apr 2026 11:37:25 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/rag-classification-detailed-guide/</guid>
  <description><![CDATA[RAG检索增强生成分类详解 背景 随着大语言模型（LLM）的快速发展，如何让AI在生成内容时准确引用最新、最相关的信息成为一个核心挑战。检索增强生成（Retrieval-Augmented Generation，简称RAG）技术应运而生，它通过结合检索系统和生成模型的优势，显著提升了AI输出的准确性和可信度。本文将详细介绍RAG的分类体系，帮助读者根据不同场景选择合适的RAG方案。
RAG基本工作原理 RAG的核心思想是将用户查询与外部知识库相结合，其工作流程主要包括以下几个环节：
文档处理：将原始文档切分为Chunks（文本块），每个chunk经过Embedding模型转换为向量 向量存储：将向量存入向量数据库（如Milvus、Pinecone、Chroma等） 语义检索：用户查询同样被转换为向量，在向量数据库中检索最相关的Top-K个chunks 增强生成：将检索到的相关文档作为上下文，连同用户问题一起发送给LLM生成回答 1 用户问题 → 向量化 → 向量数据库检索 → 上下文组装 → LLM生成 → 回答输出 RAG分类体系 根据技术复杂度和应用场景，RAG可以分为以下几类：
1. 简单RAG（Naive RAG） 简单RAG是最基础的实现方式，采用&quot;检索-拼接-生成&quot;的直线路径。
工作流程：
用户输入查询 一次性从向量数据库检索Top-K相关文档 将检索结果与查询拼接后发送给LLM 优点：架构简单、实现成本低、延迟低
缺点：当检索结果不准确或包含噪声时，生成质量会明显下降；无法处理复杂的多跳推理问题
适用场景：文档问答、知识库查询、结构简单的FAQ系统
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 # 简单RAG实现示例 from langchain_ollama import OllamaLLM from langchain_chroma import Chroma from langchain_ollama import OllamaEmbeddings # 初始化组件 llm = OllamaLLM(model=&#34;qwen2.]]></description>
</item>
</channel>
</rss>
