<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
  <channel>
    <title>playwright - 标签 - cfanzp学习笔记</title>
    <link>https://cfanzp008.github.io/tags/playwright/</link>
    <description>playwright - 标签 - cfanzp学习笔记</description>
    <generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>cfan.zp@qq.com (cfanzp)</managingEditor>
      <webMaster>cfan.zp@qq.com (cfanzp)</webMaster><lastBuildDate>Wed, 29 Apr 2026 17:34:53 &#43;0800</lastBuildDate><atom:link href="https://cfanzp008.github.io/tags/playwright/" rel="self" type="application/rss+xml" /><item>
  <title>CDP (Chrome DevTools Protocol) 详解</title>
  <link>https://cfanzp008.github.io/chrome-devtools-protocol-introduction/</link>
  <pubDate>Wed, 29 Apr 2026 17:34:53 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/chrome-devtools-protocol-introduction/</guid>
  <description><![CDATA[CDP (Chrome DevTools Protocol) 详解 简介 Chrome DevTools Protocol（CDP） 是 Google Chrome / Chromium 提供的一套底层调试协议，允许外部工具通过 JSON 消息对浏览器进行检测、检查、调试和性能分析。
你可能不知道，平时用的 Chrome DevTools 开发者工具，底层就是靠 CDP 来和浏览器通信的。而现在，越来越多的自动化工具（Puppeteer、Playwright、browser-use 等）都基于 CDP 构建。
在上一篇 browser-use 实战总结 中，我们看到了 --remote-debugging-port=9222 这个参数，这正是启用 CDP 的关键。
什么是 CDP CDP 本质上是一个基于 WebSocket 的 JSON 消息协议。它将浏览器的各种能力划分为多个域（Domain），每个域定义了一组支持的命令（Commands）和事件（Events）。
协议架构 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 ┌──────────────────────────────────────────┐ │ Chrome / Chromium │ │ ┌────────────────────────────────┐ │ │ │ DOM Network Page .]]></description>
</item>
<item>
  <title>browser-use - AI 驱动的浏览器自动化工具</title>
  <link>https://cfanzp008.github.io/browser-use-introduction/</link>
  <pubDate>Wed, 29 Apr 2026 14:54:10 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/browser-use-introduction/</guid>
  <description><![CDATA[browser-use - AI 驱动的浏览器自动化工具 简介 browser-use 是一个开源的 Python 库，旨在让 AI 代理（Agent）能够自动化操作网页浏览器。它通过结合大语言模型（LLM）和浏览器自动化技术（基于 Playwright），使得开发者可以用自然语言描述任务，让 AI 自动完成复杂的网页操作。
该项目在 GitHub 上获得了超过 9.1 万星标，是当前最热门的 AI 浏览器自动化工具之一。无论是表单填写、信息抓取、在线购物，还是自动化测试，browser-use 都能通过简单的 Python 代码来实现。
核心特性 1. 自然语言驱动 不需要编写繁琐的 CSS 选择器或 XPath，只需用自然语言描述任务：
1 task = &#34;去 Hacker News 找到置顶帖子的标题和链接&#34; 2. 多 LLM 支持 支持多种主流大语言模型：
模型提供商 类名称 示例模型 Browser Use 专用 ChatBrowserUse browser-use/bu-30b-a3b-preview OpenAI ChatOpenAI gpt-4o, gpt-4.1-mini Anthropic ChatAnthropic claude-sonnet-4-0 Google ChatGoogle gemini-flash-latest 3. 两种使用方式 开源版本：完全自托管，可深度定制工具和行为。
Cloud 版本：托管在 Browser Use Cloud，提供更好的隐蔽性、代理轮换和验证码解决能力。
4. 丰富的功能 表单自动填写：自动识别表单字段并填写 多标签页管理：跨标签页操作和切换 结构化输出：使用 Pydantic 模型定义输出格式 自定义工具：扩展 Agent 能力 持久化浏览器会话：复用登录状态 CLI 工具：命令行快速操作 安装配置 环境要求 Python &gt;= 3.]]></description>
</item>
</channel>
</rss>
