mirror of
https://github.com/fumiama/Retrieval-based-Voice-Conversion-WebUI.git
synced 2026-06-05 01:10:22 +08:00
docs: remove every ffmpeg mention in the documentation to avoid confusion
This commit is contained in:
2
.gitignore
vendored
2
.gitignore
vendored
@@ -12,5 +12,3 @@ xcuserdata
|
|||||||
/logs
|
/logs
|
||||||
|
|
||||||
/assets/weights/*
|
/assets/weights/*
|
||||||
ffmpeg.*
|
|
||||||
ffprobe.*
|
|
||||||
|
|||||||
25
README.md
25
README.md
@@ -126,27 +126,7 @@ sh ./run.sh
|
|||||||
rvcmd assets/v2 # RVC-Models-Downloader command
|
rvcmd assets/v2 # RVC-Models-Downloader command
|
||||||
```
|
```
|
||||||
|
|
||||||
### 2. 安装 ffmpeg 工具
|
### 2. 下载 rmvpe 人声音高提取算法所需文件
|
||||||
若已安装`ffmpeg`和`ffprobe`则可跳过此步骤。
|
|
||||||
|
|
||||||
#### Ubuntu/Debian 用户
|
|
||||||
```bash
|
|
||||||
sudo apt install ffmpeg
|
|
||||||
```
|
|
||||||
#### MacOS 用户
|
|
||||||
```bash
|
|
||||||
brew install ffmpeg
|
|
||||||
```
|
|
||||||
#### Windows 用户
|
|
||||||
下载后放置在根目录。
|
|
||||||
```bash
|
|
||||||
rvcmd tools/ffmpeg # RVC-Models-Downloader command
|
|
||||||
```
|
|
||||||
- 下载[ffmpeg.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe)
|
|
||||||
|
|
||||||
- 下载[ffprobe.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe)
|
|
||||||
|
|
||||||
### 3. 下载 rmvpe 人声音高提取算法所需文件
|
|
||||||
|
|
||||||
如果你想使用最新的RMVPE人声音高提取算法,则你需要下载音高提取模型参数并放置于`assets/rmvpe`。
|
如果你想使用最新的RMVPE人声音高提取算法,则你需要下载音高提取模型参数并放置于`assets/rmvpe`。
|
||||||
|
|
||||||
@@ -162,7 +142,7 @@ rvcmd tools/ffmpeg # RVC-Models-Downloader command
|
|||||||
rvcmd assets/rmvpe # RVC-Models-Downloader command
|
rvcmd assets/rmvpe # RVC-Models-Downloader command
|
||||||
```
|
```
|
||||||
|
|
||||||
### 4. AMD显卡Rocm(可选, 仅Linux)
|
### 3. AMD显卡Rocm(可选, 仅Linux)
|
||||||
|
|
||||||
如果你想基于AMD的Rocm技术在Linux系统上运行RVC,请先在[这里](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)安装所需的驱动。
|
如果你想基于AMD的Rocm技术在Linux系统上运行RVC,请先在[这里](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)安装所需的驱动。
|
||||||
|
|
||||||
@@ -207,7 +187,6 @@ rvcmd packs/general/latest # RVC-Models-Downloader command
|
|||||||
+ [VITS](https://github.com/jaywalnut310/vits)
|
+ [VITS](https://github.com/jaywalnut310/vits)
|
||||||
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
||||||
+ [Gradio](https://github.com/gradio-app/gradio)
|
+ [Gradio](https://github.com/gradio-app/gradio)
|
||||||
+ [FFmpeg](https://github.com/FFmpeg/FFmpeg)
|
|
||||||
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
||||||
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
||||||
+ [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
|
+ [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
|
||||||
|
|||||||
@@ -1,10 +1,3 @@
|
|||||||
## Q1:ffmpeg error/utf8 error.
|
|
||||||
|
|
||||||
大概率不是ffmpeg问题,而是音频路径问题;
|
|
||||||
|
|
||||||
ffmpeg读取路径带空格、()等特殊符号,可能出现ffmpeg error;训练集音频带中文路径,在写入filelist.txt的时候可能出现utf8 error;
|
|
||||||
|
|
||||||
|
|
||||||
## Q2:一键训练结束没有索引
|
## Q2:一键训练结束没有索引
|
||||||
|
|
||||||
显示"Training is done. The program is closed."则模型训练成功,后续紧邻的报错是假的;
|
显示"Training is done. The program is closed."则模型训练成功,后续紧邻的报错是假的;
|
||||||
|
|||||||
@@ -128,26 +128,7 @@ If you want to use the v2 version of the model, you need to download additional
|
|||||||
rvcmd assets/v2 # RVC-Models-Downloader command
|
rvcmd assets/v2 # RVC-Models-Downloader command
|
||||||
```
|
```
|
||||||
|
|
||||||
### 2. Install ffmpeg tool
|
### 2. Download the required files for the rmvpe vocal pitch extraction algorithm
|
||||||
If `ffmpeg` and `ffprobe` have already been installed, you can skip this step.
|
|
||||||
#### Ubuntu/Debian
|
|
||||||
```bash
|
|
||||||
sudo apt install ffmpeg
|
|
||||||
```
|
|
||||||
#### MacOS
|
|
||||||
```bash
|
|
||||||
brew install ffmpeg
|
|
||||||
```
|
|
||||||
#### Windows
|
|
||||||
After downloading, place it in the root directory.
|
|
||||||
```bash
|
|
||||||
rvcmd tools/ffmpeg # RVC-Models-Downloader command
|
|
||||||
```
|
|
||||||
- [ffmpeg.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe)
|
|
||||||
|
|
||||||
- [ffprobe.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe)
|
|
||||||
|
|
||||||
### 3. Download the required files for the rmvpe vocal pitch extraction algorithm
|
|
||||||
|
|
||||||
If you want to use the latest RMVPE vocal pitch extraction algorithm, you need to download the pitch extraction model parameters and place them in `assets/rmvpe`.
|
If you want to use the latest RMVPE vocal pitch extraction algorithm, you need to download the pitch extraction model parameters and place them in `assets/rmvpe`.
|
||||||
|
|
||||||
@@ -163,7 +144,7 @@ If you want to use the latest RMVPE vocal pitch extraction algorithm, you need t
|
|||||||
rvcmd assets/rmvpe # RVC-Models-Downloader command
|
rvcmd assets/rmvpe # RVC-Models-Downloader command
|
||||||
```
|
```
|
||||||
|
|
||||||
### 4. AMD ROCM (optional, Linux only)
|
### 3. AMD ROCM (optional, Linux only)
|
||||||
|
|
||||||
If you want to run RVC on a Linux system based on AMD's ROCM technology, please first install the required drivers [here](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html).
|
If you want to run RVC on a Linux system based on AMD's ROCM technology, please first install the required drivers [here](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html).
|
||||||
|
|
||||||
@@ -207,7 +188,6 @@ rvcmd packs/general/latest # RVC-Models-Downloader command
|
|||||||
+ [VITS](https://github.com/jaywalnut310/vits)
|
+ [VITS](https://github.com/jaywalnut310/vits)
|
||||||
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
||||||
+ [Gradio](https://github.com/gradio-app/gradio)
|
+ [Gradio](https://github.com/gradio-app/gradio)
|
||||||
+ [FFmpeg](https://github.com/FFmpeg/FFmpeg)
|
|
||||||
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
||||||
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
||||||
+ [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
|
+ [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
|
||||||
|
|||||||
@@ -1,8 +1,3 @@
|
|||||||
## Q1:ffmpeg error/utf8 error.
|
|
||||||
It is most likely not a FFmpeg issue, but rather an audio path issue;
|
|
||||||
|
|
||||||
FFmpeg may encounter an error when reading paths containing special characters like spaces and (), which may cause an FFmpeg error; and when the training set's audio contains Chinese paths, writing it into filelist.txt may cause a utf8 error.<br>
|
|
||||||
|
|
||||||
## Q2:Cannot find index file after "One-click Training".
|
## Q2:Cannot find index file after "One-click Training".
|
||||||
If it displays "Training is done. The program is closed," then the model has been trained successfully, and the subsequent errors are fake;
|
If it displays "Training is done. The program is closed," then the model has been trained successfully, and the subsequent errors are fake;
|
||||||
|
|
||||||
|
|||||||
@@ -20,9 +20,6 @@ Loads and preprocesses audio.
|
|||||||
If you specify a folder with audio, the audio files in that folder will be read automatically.
|
If you specify a folder with audio, the audio files in that folder will be read automatically.
|
||||||
For example, if you specify `C:Users\hoge\voices`, `C:Users\hoge\voices\voice.mp3` will be loaded, but `C:Users\hoge\voices\dir\voice.mp3` will Not loaded.
|
For example, if you specify `C:Users\hoge\voices`, `C:Users\hoge\voices\voice.mp3` will be loaded, but `C:Users\hoge\voices\dir\voice.mp3` will Not loaded.
|
||||||
|
|
||||||
Since ffmpeg is used internally for reading audio, if the extension is supported by ffmpeg, it will be read automatically.
|
|
||||||
After converting to int16 with ffmpeg, convert to float32 and normalize between -1 to 1.
|
|
||||||
|
|
||||||
### denoising
|
### denoising
|
||||||
The audio is smoothed by scipy's filtfilt.
|
The audio is smoothed by scipy's filtfilt.
|
||||||
|
|
||||||
|
|||||||
@@ -112,16 +112,6 @@ Voici une liste des modèles et autres fichiers requis par RVC :
|
|||||||
|
|
||||||
./assets/pretrained_v2
|
./assets/pretrained_v2
|
||||||
|
|
||||||
# Si vous utilisez Windows, vous pourriez avoir besoin de ces fichiers pour ffmpeg et ffprobe, sautez cette étape si vous avez déjà installé ffmpeg et ffprobe. Les utilisateurs d'ubuntu/debian peuvent installer ces deux bibliothèques avec apt install ffmpeg. Les utilisateurs de Mac peuvent les installer avec brew install ffmpeg (prérequis : avoir installé brew).
|
|
||||||
|
|
||||||
# ./ffmpeg
|
|
||||||
|
|
||||||
https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe
|
|
||||||
|
|
||||||
# ./ffprobe
|
|
||||||
|
|
||||||
https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe
|
|
||||||
|
|
||||||
# Si vous souhaitez utiliser le dernier algorithme RMVPE de pitch vocal, téléchargez les paramètres du modèle de pitch et placez-les dans le répertoire racine de RVC.
|
# Si vous souhaitez utiliser le dernier algorithme RMVPE de pitch vocal, téléchargez les paramètres du modèle de pitch et placez-les dans le répertoire racine de RVC.
|
||||||
|
|
||||||
https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.pt
|
https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.pt
|
||||||
@@ -167,7 +157,6 @@ python web.py
|
|||||||
+ [VITS](https://github.com/jaywalnut310/vits)
|
+ [VITS](https://github.com/jaywalnut310/vits)
|
||||||
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
||||||
+ [Gradio](https://github.com/gradio-app/gradio)
|
+ [Gradio](https://github.com/gradio-app/gradio)
|
||||||
+ [FFmpeg](https://github.com/FFmpeg/FFmpeg)
|
|
||||||
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
||||||
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
||||||
+ [Extraction de la hauteur vocale : RMVPE](https://github.com/Dream-High/RMVPE)
|
+ [Extraction de la hauteur vocale : RMVPE](https://github.com/Dream-High/RMVPE)
|
||||||
|
|||||||
@@ -1,8 +1,3 @@
|
|||||||
## Q1: Erreur ffmpeg/erreur utf8.
|
|
||||||
Il s'agit très probablement non pas d'un problème lié à FFmpeg, mais d'un problème lié au chemin de l'audio ;
|
|
||||||
|
|
||||||
FFmpeg peut rencontrer une erreur lors de la lecture de chemins contenant des caractères spéciaux tels que des espaces et (), ce qui peut provoquer une erreur FFmpeg ; et lorsque l'audio du jeu d'entraînement contient des chemins en chinois, l'écrire dans filelist.txt peut provoquer une erreur utf8.<br>
|
|
||||||
|
|
||||||
## Q2: Impossible de trouver le fichier index après "Entraînement en un clic".
|
## Q2: Impossible de trouver le fichier index après "Entraînement en un clic".
|
||||||
Si l'affichage indique "L'entraînement est terminé. Le programme est fermé", alors le modèle a été formé avec succès, et les erreurs subséquentes sont fausses ;
|
Si l'affichage indique "L'entraînement est terminé. Le programme est fermé", alors le modèle a été formé avec succès, et les erreurs subséquentes sont fausses ;
|
||||||
|
|
||||||
|
|||||||
@@ -20,9 +20,6 @@ Charge et pré-traite l'audio.
|
|||||||
Si vous spécifiez un dossier avec de l'audio, les fichiers audio de ce dossier seront lus automatiquement.
|
Si vous spécifiez un dossier avec de l'audio, les fichiers audio de ce dossier seront lus automatiquement.
|
||||||
Par exemple, si vous spécifiez `C:Users\hoge\voices`, `C:Users\hoge\voices\voice.mp3` sera chargé, mais `C:Users\hoge\voices\dir\voice.mp3` ne sera pas chargé.
|
Par exemple, si vous spécifiez `C:Users\hoge\voices`, `C:Users\hoge\voices\voice.mp3` sera chargé, mais `C:Users\hoge\voices\dir\voice.mp3` ne sera pas chargé.
|
||||||
|
|
||||||
Comme ffmpeg est utilisé en interne pour lire l'audio, si l'extension est prise en charge par ffmpeg, elle sera lue automatiquement.
|
|
||||||
Après la conversion en int16 avec ffmpeg, convertir en float32 et normaliser entre -1 et 1.
|
|
||||||
|
|
||||||
### débruitage
|
### débruitage
|
||||||
L'audio est lissé par filtfilt de scipy.
|
L'audio est lissé par filtfilt de scipy.
|
||||||
|
|
||||||
|
|||||||
@@ -130,27 +130,7 @@ v2バージョンのモデルを使用したい場合は、追加ダウンロー
|
|||||||
rvcmd assets/v2 # RVC-Models-Downloader command
|
rvcmd assets/v2 # RVC-Models-Downloader command
|
||||||
```
|
```
|
||||||
|
|
||||||
### 2. ffmpegツールのインストール
|
### 2. RMVPE人声音高抽出アルゴリズムに必要なファイルのダウンロード
|
||||||
`ffmpeg`と`ffprobe`がすでにインストールされている場合は、このステップをスキップできます。
|
|
||||||
|
|
||||||
#### Ubuntu/Debian
|
|
||||||
```bash
|
|
||||||
sudo apt install ffmpeg
|
|
||||||
```
|
|
||||||
#### MacOS
|
|
||||||
```bash
|
|
||||||
brew install ffmpeg
|
|
||||||
```
|
|
||||||
#### Windows
|
|
||||||
ダウンロード後、ルートディレクトリに配置しましょう。
|
|
||||||
```bash
|
|
||||||
rvcmd tools/ffmpeg # RVC-Models-Downloader command
|
|
||||||
```
|
|
||||||
- [ffmpeg.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe)
|
|
||||||
|
|
||||||
- [ffprobe.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe)
|
|
||||||
|
|
||||||
### 3. RMVPE人声音高抽出アルゴリズムに必要なファイルのダウンロード
|
|
||||||
|
|
||||||
最新のRMVPE人声音高抽出アルゴリズムを使用したい場合は、音高抽出モデルをダウンロードし、`assets/rmvpe`に配置する必要があります。
|
最新のRMVPE人声音高抽出アルゴリズムを使用したい場合は、音高抽出モデルをダウンロードし、`assets/rmvpe`に配置する必要があります。
|
||||||
|
|
||||||
@@ -166,7 +146,7 @@ rvcmd tools/ffmpeg # RVC-Models-Downloader command
|
|||||||
rvcmd assets/rmvpe # RVC-Models-Downloader command
|
rvcmd assets/rmvpe # RVC-Models-Downloader command
|
||||||
```
|
```
|
||||||
|
|
||||||
### 4. AMD ROCM(オプション、Linuxのみ)
|
### 3. AMD ROCM(オプション、Linuxのみ)
|
||||||
|
|
||||||
AMDのRocm技術を基にLinuxシステムでRVCを実行したい場合は、まず[ここ](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)で必要なドライバをインストールしてください。
|
AMDのRocm技術を基にLinuxシステムでRVCを実行したい場合は、まず[ここ](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)で必要なドライバをインストールしてください。
|
||||||
|
|
||||||
@@ -211,7 +191,6 @@ rvcmd packs/general/latest # RVC-Models-Downloader command
|
|||||||
- [VITS](https://github.com/jaywalnut310/vits)
|
- [VITS](https://github.com/jaywalnut310/vits)
|
||||||
- [HIFIGAN](https://github.com/jik876/hifi-gan)
|
- [HIFIGAN](https://github.com/jik876/hifi-gan)
|
||||||
- [Gradio](https://github.com/gradio-app/gradio)
|
- [Gradio](https://github.com/gradio-app/gradio)
|
||||||
- [FFmpeg](https://github.com/FFmpeg/FFmpeg)
|
|
||||||
- [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
- [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
||||||
- [audio-slicer](https://github.com/openvpi/audio-slicer)
|
- [audio-slicer](https://github.com/openvpi/audio-slicer)
|
||||||
- [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
|
- [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
|
||||||
|
|||||||
@@ -1,8 +1,3 @@
|
|||||||
## Q1: ffmpeg error/utf8 error
|
|
||||||
|
|
||||||
大体の場合、ffmpeg の問題ではなく、音声パスの問題です。<br>
|
|
||||||
ffmpeg は空白や()などの特殊文字を含むパスを読み込む際に ffmpeg error が発生する可能性があります。トレーニングセットの音声が中国語のパスを含む場合、filelist.txt に書き込む際に utf8 error が発生する可能性があります。<br>
|
|
||||||
|
|
||||||
## Q2: ワンクリックトレーニングが終わってもインデックスがない
|
## Q2: ワンクリックトレーニングが終わってもインデックスがない
|
||||||
|
|
||||||
"Training is done. The program is closed."と表示された場合、モデルトレーニングは成功しています。その直後のエラーは誤りです。<br>
|
"Training is done. The program is closed."と表示された場合、モデルトレーニングは成功しています。その直後のエラーは誤りです。<br>
|
||||||
|
|||||||
@@ -19,8 +19,6 @@ GUIの訓練タブのstepに沿って説明します。
|
|||||||
音声のあるフォルダを指定すると、そのフォルダ内にある音声ファイルを自動で読み込みます。
|
音声のあるフォルダを指定すると、そのフォルダ内にある音声ファイルを自動で読み込みます。
|
||||||
例えば`C:Users\hoge\voices`を指定した場合、`C:Users\hoge\voices\voice.mp3`は読み込まれますが、`C:Users\hoge\voices\dir\voice.mp3`は読み込まれません。
|
例えば`C:Users\hoge\voices`を指定した場合、`C:Users\hoge\voices\voice.mp3`は読み込まれますが、`C:Users\hoge\voices\dir\voice.mp3`は読み込まれません。
|
||||||
|
|
||||||
音声の読み込みには内部でffmpegを利用しているので、ffmpegで対応している拡張子であれば自動的に読み込まれます。
|
|
||||||
ffmpegでint16に変換した後、float32に変換し、-1 ~ 1の間に正規化されます。
|
|
||||||
|
|
||||||
### denoising
|
### denoising
|
||||||
音声についてscipyのfiltfiltによる平滑化を行います。
|
音声についてscipyのfiltfiltによる平滑化を行います。
|
||||||
|
|||||||
@@ -81,8 +81,6 @@ V2 버전 모델을 테스트하려면 추가 다운로드가 필요합니다.
|
|||||||
|
|
||||||
./assets/pretrained_v2
|
./assets/pretrained_v2
|
||||||
|
|
||||||
# Windows를 使用하는境遇 이 사전도 必要할 수 있습니다. FFmpeg가 設置되어 있으면 건너뛰어도 됩니다.
|
|
||||||
ffmpeg.exe
|
|
||||||
```
|
```
|
||||||
그後 以下의 命令을 使用하여 WebUI를 始作할 수 있습니다:
|
그後 以下의 命令을 使用하여 WebUI를 始作할 수 있습니다:
|
||||||
```bash
|
```bash
|
||||||
@@ -95,7 +93,6 @@ Windows를 使用하는境遇 `RVC-beta.7z`를 다운로드 및 壓縮解除하
|
|||||||
+ [VITS](https://github.com/jaywalnut310/vits)
|
+ [VITS](https://github.com/jaywalnut310/vits)
|
||||||
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
||||||
+ [Gradio](https://github.com/gradio-app/gradio)
|
+ [Gradio](https://github.com/gradio-app/gradio)
|
||||||
+ [FFmpeg](https://github.com/FFmpeg/FFmpeg)
|
|
||||||
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
||||||
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
||||||
## 모든寄與者분들의勞力에感謝드립니다
|
## 모든寄與者분들의勞力에感謝드립니다
|
||||||
|
|||||||
@@ -156,27 +156,7 @@ sh ./run.sh
|
|||||||
rvcmd assets/v2 # RVC-Models-Downloader command
|
rvcmd assets/v2 # RVC-Models-Downloader command
|
||||||
```
|
```
|
||||||
|
|
||||||
### 2. 安装 ffmpeg 工具
|
### 2. 下载 rmvpe 人声音高提取算法所需文件
|
||||||
若已安装`ffmpeg`和`ffprobe`则可跳过此步骤。
|
|
||||||
|
|
||||||
#### Ubuntu/Debian 用户
|
|
||||||
```bash
|
|
||||||
sudo apt install ffmpeg
|
|
||||||
```
|
|
||||||
#### MacOS 用户
|
|
||||||
```bash
|
|
||||||
brew install ffmpeg
|
|
||||||
```
|
|
||||||
#### Windows 用户
|
|
||||||
下载后放置在根目录。
|
|
||||||
```bash
|
|
||||||
rvcmd tools/ffmpeg # RVC-Models-Downloader command
|
|
||||||
```
|
|
||||||
- 下载[ffmpeg.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe)
|
|
||||||
|
|
||||||
- 下载[ffprobe.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe)
|
|
||||||
|
|
||||||
### 3. 下载 rmvpe 人声音高提取算法所需文件
|
|
||||||
|
|
||||||
如果你想使用最新的RMVPE人声音高提取算法,则你需要下载音高提取模型参数并放置于`assets/rmvpe`。
|
如果你想使用最新的RMVPE人声音高提取算法,则你需要下载音高提取模型参数并放置于`assets/rmvpe`。
|
||||||
|
|
||||||
@@ -192,7 +172,7 @@ rvcmd tools/ffmpeg # RVC-Models-Downloader command
|
|||||||
rvcmd assets/rmvpe # RVC-Models-Downloader command
|
rvcmd assets/rmvpe # RVC-Models-Downloader command
|
||||||
```
|
```
|
||||||
|
|
||||||
### 4. AMD显卡Rocm(可选, 仅Linux)
|
### 3. AMD显卡Rocm(可选, 仅Linux)
|
||||||
|
|
||||||
如果你想基于AMD的Rocm技术在Linux系统上运行RVC,请先在[这里](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)安装所需的驱动。
|
如果你想基于AMD的Rocm技术在Linux系统上运行RVC,请先在[这里](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)安装所需的驱动。
|
||||||
|
|
||||||
@@ -237,7 +217,6 @@ rvcmd packs/general/latest # RVC-Models-Downloader command
|
|||||||
+ [VITS](https://github.com/jaywalnut310/vits)
|
+ [VITS](https://github.com/jaywalnut310/vits)
|
||||||
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
||||||
+ [Gradio](https://github.com/gradio-app/gradio)
|
+ [Gradio](https://github.com/gradio-app/gradio)
|
||||||
+ [FFmpeg](https://github.com/FFmpeg/FFmpeg)
|
|
||||||
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
||||||
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
||||||
+ [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
|
+ [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
|
||||||
@@ -298,31 +277,7 @@ v2 버전 모델을 사용하려면 추가로 다음을 다운로드해야 합
|
|||||||
rvcmd assets/v2 # RVC-Models-Downloader command
|
rvcmd assets/v2 # RVC-Models-Downloader command
|
||||||
```
|
```
|
||||||
|
|
||||||
### 2. ffmpeg 설치
|
### 2. RMVPE 인간 음성 피치 추출 알고리즘에 필요한 파일 다운로드
|
||||||
|
|
||||||
`ffmpeg`와 `ffprobe`가 이미 설치되어 있다면 건너뜁니다.
|
|
||||||
|
|
||||||
#### Ubuntu/Debian 사용자
|
|
||||||
|
|
||||||
```bash
|
|
||||||
sudo apt install ffmpeg
|
|
||||||
```
|
|
||||||
|
|
||||||
#### MacOS 사용자
|
|
||||||
|
|
||||||
```bash
|
|
||||||
brew install ffmpeg
|
|
||||||
```
|
|
||||||
|
|
||||||
#### Windows 사용자
|
|
||||||
|
|
||||||
다운로드 후 루트 디렉토리에 배치.
|
|
||||||
|
|
||||||
- [ffmpeg.exe 다운로드](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe)
|
|
||||||
|
|
||||||
- [ffprobe.exe 다운로드](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe)
|
|
||||||
|
|
||||||
### 3. RMVPE 인간 음성 피치 추출 알고리즘에 필요한 파일 다운로드
|
|
||||||
|
|
||||||
최신 RMVPE 인간 음성 피치 추출 알고리즘을 사용하려면 음피치 추출 모델 매개변수를 다운로드하고 RVC 루트 디렉토리에 배치해야 합니다.
|
최신 RMVPE 인간 음성 피치 추출 알고리즘을 사용하려면 음피치 추출 모델 매개변수를 다운로드하고 RVC 루트 디렉토리에 배치해야 합니다.
|
||||||
|
|
||||||
@@ -332,7 +287,7 @@ brew install ffmpeg
|
|||||||
|
|
||||||
- [rmvpe.onnx 다운로드](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.onnx)
|
- [rmvpe.onnx 다운로드](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.onnx)
|
||||||
|
|
||||||
### 4. AMD 그래픽 카드 Rocm(선택사항, Linux만 해당)
|
### 3. AMD 그래픽 카드 Rocm(선택사항, Linux만 해당)
|
||||||
|
|
||||||
Linux 시스템에서 AMD의 Rocm 기술을 기반으로 RVC를 실행하려면 [여기](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)에서 필요한 드라이버를 먼저 설치하세요.
|
Linux 시스템에서 AMD의 Rocm 기술을 기반으로 RVC를 실행하려면 [여기](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)에서 필요한 드라이버를 먼저 설치하세요.
|
||||||
|
|
||||||
@@ -392,7 +347,6 @@ source /opt/intel/oneapi/setvars.sh
|
|||||||
- [VITS](https://github.com/jaywalnut310/vits)
|
- [VITS](https://github.com/jaywalnut310/vits)
|
||||||
- [HIFIGAN](https://github.com/jik876/hifi-gan)
|
- [HIFIGAN](https://github.com/jik876/hifi-gan)
|
||||||
- [Gradio](https://github.com/gradio-app/gradio)
|
- [Gradio](https://github.com/gradio-app/gradio)
|
||||||
- [FFmpeg](https://github.com/FFmpeg/FFmpeg)
|
|
||||||
- [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
- [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
||||||
- [audio-slicer](https://github.com/openvpi/audio-slicer)
|
- [audio-slicer](https://github.com/openvpi/audio-slicer)
|
||||||
- [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
|
- [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
|
||||||
|
|||||||
@@ -1,8 +1,3 @@
|
|||||||
## Q1:ffmpeg 오류/utf8 오류
|
|
||||||
|
|
||||||
대부분의 경우 ffmpeg 문제가 아니라 오디오 경로 문제입니다. <br>
|
|
||||||
ffmpeg가 공백, () 등의 특수 문자가 포함된 경로를 읽을 때 ffmpeg 오류가 발생할 수 있습니다. 트레이닝 세트 오디오가 중문 경로일 때 filelist.txt에 쓸 때 utf8 오류가 발생할 수 있습니다. <br>
|
|
||||||
|
|
||||||
## Q2:일괄 트레이닝이 끝나고 인덱스가 없음
|
## Q2:일괄 트레이닝이 끝나고 인덱스가 없음
|
||||||
|
|
||||||
"Training is done. The program is closed."라고 표시되면 모델 트레이닝이 성공한 것이며, 이어지는 오류는 가짜입니다. <br>
|
"Training is done. The program is closed."라고 표시되면 모델 트레이닝이 성공한 것이며, 이어지는 오류는 가짜입니다. <br>
|
||||||
|
|||||||
@@ -16,9 +16,6 @@ GUI의 훈련 탭의 단계를 따라 설명합니다.
|
|||||||
음성 파일이 있는 폴더를 지정하면 해당 폴더에 있는 음성 파일이 자동으로 가져와집니다.
|
음성 파일이 있는 폴더를 지정하면 해당 폴더에 있는 음성 파일이 자동으로 가져와집니다.
|
||||||
예를 들어 `C:Users\hoge\voices`를 지정하면 `C:Users\hoge\voices\voice.mp3`가 읽히지만 `C:Users\hoge\voices\dir\voice.mp3`는 읽히지 않습니다.
|
예를 들어 `C:Users\hoge\voices`를 지정하면 `C:Users\hoge\voices\voice.mp3`가 읽히지만 `C:Users\hoge\voices\dir\voice.mp3`는 읽히지 않습니다.
|
||||||
|
|
||||||
음성 로드에는 내부적으로 ffmpeg를 이용하고 있으므로, ffmpeg로 대응하고 있는 확장자라면 자동적으로 읽힙니다.
|
|
||||||
ffmpeg에서 int16으로 변환한 후 float32로 변환하고 -1과 1 사이에 정규화됩니다.
|
|
||||||
|
|
||||||
### 잡음 제거
|
### 잡음 제거
|
||||||
음성 파일에 대해 scipy의 filtfilt를 이용하여 잡음을 처리합니다.
|
음성 파일에 대해 scipy의 filtfilt를 이용하여 잡음을 처리합니다.
|
||||||
|
|
||||||
|
|||||||
@@ -123,15 +123,6 @@ Se você deseja testar o modelo da versão v2 (o modelo da versão v2 alterou a
|
|||||||
|
|
||||||
./assets/pretrained_v2
|
./assets/pretrained_v2
|
||||||
|
|
||||||
#Se você estiver usando Windows, também pode precisar desses dois arquivos, pule se FFmpeg e FFprobe estiverem instalados
|
|
||||||
ffmpeg.exe
|
|
||||||
|
|
||||||
https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe
|
|
||||||
|
|
||||||
ffprobe.exe
|
|
||||||
|
|
||||||
https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe
|
|
||||||
|
|
||||||
Se quiser usar o algoritmo de extração de tom vocal SOTA RMVPE mais recente, você precisa baixar os pesos RMVPE e colocá-los no diretório raiz RVC
|
Se quiser usar o algoritmo de extração de tom vocal SOTA RMVPE mais recente, você precisa baixar os pesos RMVPE e colocá-los no diretório raiz RVC
|
||||||
|
|
||||||
https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.pt
|
https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.pt
|
||||||
@@ -179,7 +170,6 @@ python web.py
|
|||||||
+ [VITS](https://github.com/jaywalnut310/vits)
|
+ [VITS](https://github.com/jaywalnut310/vits)
|
||||||
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
||||||
+ [Gradio](https://github.com/gradio-app/gradio)
|
+ [Gradio](https://github.com/gradio-app/gradio)
|
||||||
+ [FFmpeg](https://github.com/FFmpeg/FFmpeg)
|
|
||||||
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
||||||
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
||||||
+ [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
|
+ [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
|
||||||
|
|||||||
@@ -100,10 +100,6 @@ Primeira coisa que gostaria de lembrar, não necessariamente quanto mais epochs
|
|||||||
|
|
||||||
|
|
||||||
# <b>FAQ Original traduzido</b>
|
# <b>FAQ Original traduzido</b>
|
||||||
## <b><span style="color: #337dff;">Q1: erro ffmpeg/erro utf8.</span></b>
|
|
||||||
Provavelmente não é um problema do FFmpeg, mas sim um problema de caminho de áudio;
|
|
||||||
|
|
||||||
O FFmpeg pode encontrar um erro ao ler caminhos contendo caracteres especiais como spaces e (), o que pode causar um erro FFmpeg; e quando o áudio do conjunto de treinamento contém caminhos chineses, gravá-lo em filelist.txt pode causar um erro utf8.<hr>
|
|
||||||
|
|
||||||
## <b><span style="color: #337dff;">Q2:Não é possível encontrar o arquivo de Index após "Treinamento com um clique".</span></b>
|
## <b><span style="color: #337dff;">Q2:Não é possível encontrar o arquivo de Index após "Treinamento com um clique".</span></b>
|
||||||
Se exibir "O treinamento está concluído. O programa é fechado ", então o modelo foi treinado com sucesso e os erros subsequentes são falsos;
|
Se exibir "O treinamento está concluído. O programa é fechado ", então o modelo foi treinado com sucesso e os erros subsequentes são falsos;
|
||||||
|
|||||||
@@ -20,9 +20,6 @@ Carrega e pré-processa áudio.
|
|||||||
Se você especificar uma pasta com áudio, os arquivos de áudio dessa pasta serão lidos automaticamente.
|
Se você especificar uma pasta com áudio, os arquivos de áudio dessa pasta serão lidos automaticamente.
|
||||||
Por exemplo, se você especificar `C:Users\hoge\voices`, `C:Users\hoge\voices\voice.mp3` será carregado, mas `C:Users\hoge\voices\dir\voice.mp3` será Não carregado.
|
Por exemplo, se você especificar `C:Users\hoge\voices`, `C:Users\hoge\voices\voice.mp3` será carregado, mas `C:Users\hoge\voices\dir\voice.mp3` será Não carregado.
|
||||||
|
|
||||||
Como o ffmpeg é usado internamente para leitura de áudio, se a extensão for suportada pelo ffmpeg, ela será lida automaticamente.
|
|
||||||
Após converter para int16 com ffmpeg, converta para float32 e normalize entre -1 e 1.
|
|
||||||
|
|
||||||
### Eliminar ruído
|
### Eliminar ruído
|
||||||
O áudio é suavizado pelo filtfilt do scipy.
|
O áudio é suavizado pelo filtfilt do scipy.
|
||||||
|
|
||||||
|
|||||||
@@ -108,15 +108,6 @@ V2 sürüm modelini test etmek isterseniz (v2 sürüm modeli, 9 katmanlı Hubert
|
|||||||
|
|
||||||
./assets/pretrained_v2
|
./assets/pretrained_v2
|
||||||
|
|
||||||
Eğer Windows kullanıyorsanız, FFmpeg ve FFprobe kurulu değilse bu iki dosyayı da indirmeniz gerekebilir.
|
|
||||||
ffmpeg.exe
|
|
||||||
|
|
||||||
https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe
|
|
||||||
|
|
||||||
ffprobe.exe
|
|
||||||
|
|
||||||
https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe
|
|
||||||
|
|
||||||
En son SOTA RMVPE vokal ton çıkarma algoritmasını kullanmak istiyorsanız, RMVPE ağırlıklarını indirip RVC kök dizinine koymalısınız.
|
En son SOTA RMVPE vokal ton çıkarma algoritmasını kullanmak istiyorsanız, RMVPE ağırlıklarını indirip RVC kök dizinine koymalısınız.
|
||||||
|
|
||||||
https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.pt
|
https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.pt
|
||||||
@@ -140,7 +131,6 @@ Windows veya macOS kullanıyorsanız, `RVC-beta.7z` dosyasını indirip çıkara
|
|||||||
+ [VITS](https://github.com/jaywalnut310/vits)
|
+ [VITS](https://github.com/jaywalnut310/vits)
|
||||||
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
|
||||||
+ [Gradio](https://github.com/gradio-app/gradio)
|
+ [Gradio](https://github.com/gradio-app/gradio)
|
||||||
+ [FFmpeg](https://github.com/FFmpeg/FFmpeg)
|
|
||||||
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
||||||
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
|
||||||
+ [Vokal ton çıkarma:RMVPE](https://github.com/Dream-High/RMVPE)
|
+ [Vokal ton çıkarma:RMVPE](https://github.com/Dream-High/RMVPE)
|
||||||
|
|||||||
@@ -1,8 +1,3 @@
|
|||||||
## Q1: FFmpeg Hatası/UTF8 Hatası
|
|
||||||
Büyük olasılıkla bu bir FFmpeg sorunu değil, daha çok ses dosyası yolunda bir sorun;
|
|
||||||
|
|
||||||
FFmpeg, boşluklar ve () gibi özel karakterler içeren yolları okurken bir hata ile karşılaşabilir; ve eğitim setinin ses dosyaları Çin karakterleri içeriyorsa, bunlar filelist.txt'ye yazıldığında utf8 hatasına neden olabilir.<br>
|
|
||||||
|
|
||||||
## Q2: "Tek Tıklamayla Eğitim" Sonrası İndeks Dosyası Bulunamıyor
|
## Q2: "Tek Tıklamayla Eğitim" Sonrası İndeks Dosyası Bulunamıyor
|
||||||
Eğer "Eğitim tamamlandı. Program kapatıldı." mesajını görüyorsa, model başarıyla eğitilmiş demektir ve sonraki hatalar sahte;
|
Eğer "Eğitim tamamlandı. Program kapatıldı." mesajını görüyorsa, model başarıyla eğitilmiş demektir ve sonraki hatalar sahte;
|
||||||
|
|
||||||
|
|||||||
@@ -20,9 +20,6 @@ Ses yüklenir ve ön işleme yapılır.
|
|||||||
Ses içeren bir klasör belirtirseniz, bu klasördeki ses dosyaları otomatik olarak okunur.
|
Ses içeren bir klasör belirtirseniz, bu klasördeki ses dosyaları otomatik olarak okunur.
|
||||||
Örneğin, `C:Users\hoge\voices` belirtirseniz, `C:Users\hoge\voices\voice.mp3` yüklenecek, ancak `C:Users\hoge\voices\dir\voice.mp3` yüklenmeyecektir.
|
Örneğin, `C:Users\hoge\voices` belirtirseniz, `C:Users\hoge\voices\voice.mp3` yüklenecek, ancak `C:Users\hoge\voices\dir\voice.mp3` yüklenmeyecektir.
|
||||||
|
|
||||||
Ses okumak için dahili olarak ffmpeg kullanıldığından, uzantı ffmpeg tarafından destekleniyorsa otomatik olarak okunacaktır.
|
|
||||||
ffmpeg ile int16'ya dönüştürüldükten sonra float32'ye dönüştürülüp -1 ile 1 arasında normalize edilir.
|
|
||||||
|
|
||||||
### Gürültü Temizleme
|
### Gürültü Temizleme
|
||||||
Ses scipy'nin filtfilt işlevi ile yumuşatılır.
|
Ses scipy'nin filtfilt işlevi ile yumuşatılır.
|
||||||
|
|
||||||
|
|||||||
Reference in New Issue
Block a user