Revert "docs: remove every ffmpeg mention in the documentation to avoid confusion"

This reverts commit 1e05bbce03.
2026-06-05 17:20:25 +08:00 · 2024-06-11 18:03:32 +07:00
parent 2574ce5ea2
commit 1d5d41b09c
22 changed files with 207 additions and 10 deletions
--- a/docs/jp/README.ja.md
+++ b/docs/jp/README.ja.md
@@ -130,7 +130,27 @@ v2バージョンのモデルを使用したい場合は、追加ダウンロー
 	rvcmd assets/v2 # RVC-Models-Downloader command
 	```

-### 2. RMVPE人声音高抽出アルゴリズムに必要なファイルのダウンロード
+### 2. ffmpegツールのインストール
+`ffmpeg`と`ffprobe`がすでにインストールされている場合は、このステップをスキップできます。
+
+#### Ubuntu/Debian
+```bash
+sudo apt install ffmpeg
+```
+#### MacOS
+```bash
+brew install ffmpeg
+```
+#### Windows
+ダウンロード後、ルートディレクトリに配置しましょう。
+```bash
+rvcmd tools/ffmpeg # RVC-Models-Downloader command
+```
+- [ffmpeg.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe)
+
+- [ffprobe.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe)
+
+### 3. RMVPE人声音高抽出アルゴリズムに必要なファイルのダウンロード

 最新のRMVPE人声音高抽出アルゴリズムを使用したい場合は、音高抽出モデルをダウンロードし、`assets/rmvpe`に配置する必要があります。

@@ -146,7 +166,7 @@ v2バージョンのモデルを使用したい場合は、追加ダウンロー
 	rvcmd assets/rmvpe # RVC-Models-Downloader command
 	```

-### 3. AMD ROCM（オプション、Linuxのみ）
+### 4. AMD ROCM（オプション、Linuxのみ）

 AMDのRocm技術を基にLinuxシステムでRVCを実行したい場合は、まず[ここ](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)で必要なドライバをインストールしてください。

@@ -191,6 +211,7 @@ rvcmd packs/general/latest # RVC-Models-Downloader command
 - [VITS](https://github.com/jaywalnut310/vits)
 - [HIFIGAN](https://github.com/jik876/hifi-gan)
 - [Gradio](https://github.com/gradio-app/gradio)
+- [FFmpeg](https://github.com/FFmpeg/FFmpeg)
 - [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
 - [audio-slicer](https://github.com/openvpi/audio-slicer)
 - [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
--- a/docs/jp/faq_ja.md
+++ b/docs/jp/faq_ja.md
@@ -1,3 +1,8 @@
+## Q1: ffmpeg error/utf8 error
+
+大体の場合、ffmpeg の問題ではなく、音声パスの問題です。<br>
+ffmpeg は空白や()などの特殊文字を含むパスを読み込む際に ffmpeg error が発生する可能性があります。トレーニングセットの音声が中国語のパスを含む場合、filelist.txt に書き込む際に utf8 error が発生する可能性があります。<br>
+
 ## Q2: ワンクリックトレーニングが終わってもインデックスがない

 "Training is done. The program is closed."と表示された場合、モデルトレーニングは成功しています。その直後のエラーは誤りです。<br>
--- a/docs/jp/training_tips_ja.md
+++ b/docs/jp/training_tips_ja.md
@@ -19,6 +19,8 @@ GUIの訓練タブのstepに沿って説明します。
 音声のあるフォルダを指定すると、そのフォルダ内にある音声ファイルを自動で読み込みます。
 例えば`C:Users\hoge\voices`を指定した場合、`C:Users\hoge\voices\voice.mp3`は読み込まれますが、`C:Users\hoge\voices\dir\voice.mp3`は読み込まれません。

+音声の読み込みには内部でffmpegを利用しているので、ffmpegで対応している拡張子であれば自動的に読み込まれます。
+ffmpegでint16に変換した後、float32に変換し、-1 ~ 1の間に正規化されます。

 ### denoising
 音声についてscipyのfiltfiltによる平滑化を行います。