配置

本指南将引导您配置语音服务，其中包括文本转语音和语音转文本设置。以下列出每个服务的可用选项。

文本转语音配置

OpenAI 文本转语音配置

要使用 OpenAI 进行文本转语音转换，您必须设置 OpenAI API 密钥。

请按照以下步骤配置 OpenAI：

获取您的 OpenAI API 密钥。
在常规设置中输入您的 OpenAI API 密钥。
在您的应用程序中导航至语音设置。
在“OpenAI 语音配置”部分下，您可以更改语音类型。

备注

有关如何访问配置面板的更详细说明，请参阅配置面板访问指南。

GPT-SoVits 配置

本节概述如何配置 GPT-SoVits 端口，以及如何使用高级设置设置新语音。

1. 确保 GPT-SoVits 端口已设置

首先，确保 GPT-SoVits 端口已在常规设置中正确设置。

GPT-SoVits-port-setting

您可以在 GPT-SoVits 安装中找到有关如何构建和配置端口的说明。

2. 导航至语音设置

设置端口后，请按照下列步骤执行：

在应用程序中导航至“语音设置”菜单。
找到并单击“GPT-SoVits 高级设置”选项。

3. 创建新语音

打开“GPT-SoVits 高级设置”后，您可以通过提供以下详细信息来创建新的语音配置文件：

名称：稍后将在语音选择列表中显示的名称。
参考 WAV 路径：参考语音文件的 .wav 格式路径。此文件将用于建模新语音。
参考文本：参考 WAV 文件中所说内容的转录。
提示语言：参考 WAV 文件中使用的语言（例如：英语、中文、日语等）。

提示

如果您的参考 WAV 文件是中文，则转录将同时适用于中文和英文。

填写这些字段后，保存您的新语音配置文件。

4. 配置语音

创建新语音后，请导航回“语音设置”菜单。在“GPT-SoVits 语音配置”部分下，从列表中选择新创建的语音，以便在您的操作中使用。 GPT-SoVits-Voice-Selection

按照这些步骤操作，您将能够正确配置 GPT-SoVits 并创建新的语音配置文件。

语音转文本配置

OpenAI 和 Groq 语音转文本配置

1. 检查是否已安装和配置 SoX

在运行 Groq 或 OpenAI 语音转文本之前，务必确保您的系统环境中已安装并正确配置 SoX (Sound eXchange)。您可以执行以下命令来验证：

sox --version

2. 运行 Groq 或 OpenAI 语音转文本服务

安装并正确配置 SoX 后，即可执行 Groq 或 OpenAI 音频录制。如果 SoX 未正确设置，Groq 或 OpenAI 很可能会显示与音频处理相关的错误消息。如果您在 SoX 安装期间或运行 Groq 或 OpenAI 时遇到任何错误，并需要进一步帮助，请先查看 SoX 安装。

VSCode 内置配置

要使用 VSCode 内置功能进行语音转文本，请按照下列步骤执行：

打开 VS Code。
在 VS Code Marketplace 上导航至 VS Code Speech 扩展。
单击“安装”按钮来安装扩展。
安装后，根据需要在 VSCode 设置中配置扩展。

备注

请务必在安装扩展后重新启动 VS Code，以应用更改。

目录​

文本转语音配置​

OpenAI 文本转语音配置​

GPT-SoVits 配置​

1. 确保 GPT-SoVits 端口已设置​

2. 导航至语音设置​

3. 创建新语音​

4. 配置语音​

语音转文本配置​

OpenAI 和 Groq 语音转文本配置​

VSCode 内置配置​

目录