<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
  <channel>
    <title>语音合成 - 标签 - cfanzp学习笔记</title>
    <link>https://cfanzp008.github.io/tags/%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90/</link>
    <description>语音合成 - 标签 - cfanzp学习笔记</description>
    <generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>cfan.zp@qq.com (cfanzp)</managingEditor>
      <webMaster>cfan.zp@qq.com (cfanzp)</webMaster><lastBuildDate>Sat, 04 Apr 2026 14:00:00 &#43;0800</lastBuildDate><atom:link href="https://cfanzp008.github.io/tags/%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90/" rel="self" type="application/rss+xml" /><item>
  <title>VibeVoice：Microsoft 开源的前沿语音 AI</title>
  <link>https://cfanzp008.github.io/vibevoice-introduction/</link>
  <pubDate>Sat, 04 Apr 2026 14:00:00 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/vibevoice-introduction/</guid>
  <description><![CDATA[VibeVoice：Microsoft 开源的前沿语音 AI 什么是 VibeVoice VibeVoice 是 Microsoft 于 2025 年 8 月发布的开源语音 AI 项目，可以生成长达 90 分钟的多说话者播客内容。该项目在 GitHub 上已获得 35,900+ 颗星，是当前最受欢迎的开源语音合成项目之一。
VibeVoice 的核心能力是表达性长文本对话语音合成，能够生成自然流畅的多人对话播客。
核心特性 1. 超长语音生成 支持生成长达 90 分钟的连续语音内容 适合播客、有声书、长对话场景 保持一致的语音质量 2. 多说话者支持 支持多个说话者同时对话 区分不同角色的声音和情感 自然的对话节奏 3. 表达性语音 情感丰富的语音输出 自然的语调变化 支持多种说话风格 4. 开源免费 MIT 许可证 - 完全开源 免费商用 社区活跃（社区 fork 版本有 1000+ 星） 5. Python 实现 纯 Python 实现 易于集成和扩展 丰富的 API 接口 安装配置 环境要求 Python 3.8+ CUDA（推荐用于 GPU 加速） 16GB+ RAM 安装步骤 1 2 3 4 5 6 7 8 9 # 克隆仓库 git clone https://github.]]></description>
</item>
</channel>
</rss>
