mirror of
https://github.com/fumiama/Retrieval-based-Voice-Conversion-WebUI.git
synced 2026-06-06 01:30:24 +08:00
docs: remove every ffmpeg mention in the documentation to avoid confusion
This commit is contained in:
@@ -130,27 +130,7 @@ v2バージョンのモデルを使用したい場合は、追加ダウンロー
|
||||
rvcmd assets/v2 # RVC-Models-Downloader command
|
||||
```
|
||||
|
||||
### 2. ffmpegツールのインストール
|
||||
`ffmpeg`と`ffprobe`がすでにインストールされている場合は、このステップをスキップできます。
|
||||
|
||||
#### Ubuntu/Debian
|
||||
```bash
|
||||
sudo apt install ffmpeg
|
||||
```
|
||||
#### MacOS
|
||||
```bash
|
||||
brew install ffmpeg
|
||||
```
|
||||
#### Windows
|
||||
ダウンロード後、ルートディレクトリに配置しましょう。
|
||||
```bash
|
||||
rvcmd tools/ffmpeg # RVC-Models-Downloader command
|
||||
```
|
||||
- [ffmpeg.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe)
|
||||
|
||||
- [ffprobe.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe)
|
||||
|
||||
### 3. RMVPE人声音高抽出アルゴリズムに必要なファイルのダウンロード
|
||||
### 2. RMVPE人声音高抽出アルゴリズムに必要なファイルのダウンロード
|
||||
|
||||
最新のRMVPE人声音高抽出アルゴリズムを使用したい場合は、音高抽出モデルをダウンロードし、`assets/rmvpe`に配置する必要があります。
|
||||
|
||||
@@ -166,7 +146,7 @@ rvcmd tools/ffmpeg # RVC-Models-Downloader command
|
||||
rvcmd assets/rmvpe # RVC-Models-Downloader command
|
||||
```
|
||||
|
||||
### 4. AMD ROCM(オプション、Linuxのみ)
|
||||
### 3. AMD ROCM(オプション、Linuxのみ)
|
||||
|
||||
AMDのRocm技術を基にLinuxシステムでRVCを実行したい場合は、まず[ここ](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)で必要なドライバをインストールしてください。
|
||||
|
||||
@@ -211,7 +191,6 @@ rvcmd packs/general/latest # RVC-Models-Downloader command
|
||||
- [VITS](https://github.com/jaywalnut310/vits)
|
||||
- [HIFIGAN](https://github.com/jik876/hifi-gan)
|
||||
- [Gradio](https://github.com/gradio-app/gradio)
|
||||
- [FFmpeg](https://github.com/FFmpeg/FFmpeg)
|
||||
- [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
|
||||
- [audio-slicer](https://github.com/openvpi/audio-slicer)
|
||||
- [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
|
||||
|
||||
@@ -1,8 +1,3 @@
|
||||
## Q1: ffmpeg error/utf8 error
|
||||
|
||||
大体の場合、ffmpeg の問題ではなく、音声パスの問題です。<br>
|
||||
ffmpeg は空白や()などの特殊文字を含むパスを読み込む際に ffmpeg error が発生する可能性があります。トレーニングセットの音声が中国語のパスを含む場合、filelist.txt に書き込む際に utf8 error が発生する可能性があります。<br>
|
||||
|
||||
## Q2: ワンクリックトレーニングが終わってもインデックスがない
|
||||
|
||||
"Training is done. The program is closed."と表示された場合、モデルトレーニングは成功しています。その直後のエラーは誤りです。<br>
|
||||
|
||||
@@ -19,8 +19,6 @@ GUIの訓練タブのstepに沿って説明します。
|
||||
音声のあるフォルダを指定すると、そのフォルダ内にある音声ファイルを自動で読み込みます。
|
||||
例えば`C:Users\hoge\voices`を指定した場合、`C:Users\hoge\voices\voice.mp3`は読み込まれますが、`C:Users\hoge\voices\dir\voice.mp3`は読み込まれません。
|
||||
|
||||
音声の読み込みには内部でffmpegを利用しているので、ffmpegで対応している拡張子であれば自動的に読み込まれます。
|
||||
ffmpegでint16に変換した後、float32に変換し、-1 ~ 1の間に正規化されます。
|
||||
|
||||
### denoising
|
||||
音声についてscipyのfiltfiltによる平滑化を行います。
|
||||
|
||||
Reference in New Issue
Block a user