admin 管理员组

文章数量: 1184232

Windows 11 安装、使用 IndexTTS2

  • 对应视频教程:
    • B站:https://www.bilibili/video/BV1r9pvzkEYm/
    • 抖音:https://v.douyin/6mp7_4cd1Gk/
    • 小红书:http://xhslink/o/8yTE6duFdAh

文章目录

  • Windows 11 安装、使用 IndexTTS2
    • 1. IndexTTS2 简介
    • 2. 准备工作
      • 2.1. 检查硬件是否满足要求
      • 2.2. 安装 Git
      • 2.3. 安装 uv
    • 3. 安装 IndexTTS2
      • 3.1. 获取源码和依赖
      • 3.2. 配置模型下载工具环境变量
      • 3.3. 下载模型
    • 4. 使用 IndexTTS2
      • 4.1. 启动
      • 4.2. 基础方法
      • 4.3. 高级用法

1. IndexTTS2 简介

IndexTTS2 是哔哩哔哩(B站)语音团队在2025年9月开源的一款新一代文本转语音(TTS)模型。它在情感表达和语音时长控制方面取得了关键性突破。

技术原理: IndexTTS2的核心技术架构主要包括:

  • 模块化设计:由文本到语义(T2S)、语义到旋律(S2M) 以及高性能声码器三大模块构成,逐层处理文本并生成高质量语音。
  • 情感与音色解耦:利用梯度反转层(Gradient Reversal Layer)等先进技术,有效分离音色与情感特征,从而实现了独立的精准调控。
  • 多阶段训练策略:通过分阶段训练方法,缓解了高质量带标注情感数据稀缺的问题,显著提升了模型对复杂情绪的理解与再现能力。
  • 时间编码机制:首次在自回归TTS架构中引入时间编码,有效解决了传统模型在语音时长控制上精度不足的问题,实现了更

本文标签: Windows