Revert "docs: remove every ffmpeg mention in the documentation to avoid confusion"

This reverts commit 1e05bbce03.
2026-06-05 17:20:25 +08:00 · 2024-06-11 18:03:32 +07:00
parent 2574ce5ea2
commit 1d5d41b09c
22 changed files with 207 additions and 10 deletions
--- a/docs/kr/README.ko.han.md
+++ b/docs/kr/README.ko.han.md
@@ -81,6 +81,8 @@ V2 버전 모델을 테스트하려면 추가 다운로드가 필요합니다.

 ./assets/pretrained_v2

+# Windows를 使用하는境遇 이 사전도 必要할 수 있습니다. FFmpeg가 設置되어 있으면 건너뛰어도 됩니다.
+ffmpeg.exe
 ```
 그後 以下의 命令을 使用하여 WebUI를 始作할 수 있습니다:
 ```bash
@@ -93,6 +95,7 @@ Windows를 使用하는境遇 `RVC-beta.7z`를 다운로드 및 壓縮解除하
 + [VITS](https://github.com/jaywalnut310/vits)
 + [HIFIGAN](https://github.com/jik876/hifi-gan)
 + [Gradio](https://github.com/gradio-app/gradio)
+ [FFmpeg](https://github.com/FFmpeg/FFmpeg)
 + [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
 + [audio-slicer](https://github.com/openvpi/audio-slicer)
 ## 모든寄與者분들의勞力에感謝드립니다
--- a/docs/kr/README.ko.md
+++ b/docs/kr/README.ko.md
@@ -156,7 +156,27 @@ sh ./run.sh
 	rvcmd assets/v2 # RVC-Models-Downloader command
 	```

-### 2. 下载 rmvpe 人声音高提取算法所需文件
+### 2. 安装 ffmpeg 工具
+若已安装`ffmpeg`和`ffprobe`则可跳过此步骤。
+
+#### Ubuntu/Debian 用户
+```bash
+sudo apt install ffmpeg
+```
+#### MacOS 用户
+```bash
+brew install ffmpeg
+```
+#### Windows 用户
+下载后放置在根目录。
+```bash
+rvcmd tools/ffmpeg # RVC-Models-Downloader command
+```
+- 下载[ffmpeg.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe)
+
+- 下载[ffprobe.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe)
+
+### 3. 下载 rmvpe 人声音高提取算法所需文件

 如果你想使用最新的RMVPE人声音高提取算法，则你需要下载音高提取模型参数并放置于`assets/rmvpe`。

@@ -172,7 +192,7 @@ sh ./run.sh
 	rvcmd assets/rmvpe # RVC-Models-Downloader command
 	```

-### 3. AMD显卡Rocm(可选, 仅Linux)
+### 4. AMD显卡Rocm(可选, 仅Linux)

 如果你想基于AMD的Rocm技术在Linux系统上运行RVC，请先在[这里](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)安装所需的驱动。

@@ -217,6 +237,7 @@ rvcmd packs/general/latest # RVC-Models-Downloader command
 + [VITS](https://github.com/jaywalnut310/vits)
 + [HIFIGAN](https://github.com/jik876/hifi-gan)
 + [Gradio](https://github.com/gradio-app/gradio)
+ [FFmpeg](https://github.com/FFmpeg/FFmpeg)
 + [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
 + [audio-slicer](https://github.com/openvpi/audio-slicer)
 + [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
@@ -277,7 +298,31 @@ v2 버전 모델을 사용하려면 추가로 다음을 다운로드해야 합
  rvcmd assets/v2 # RVC-Models-Downloader command
  ```

-### 2. RMVPE 인간 음성 피치 추출 알고리즘에 필요한 파일 다운로드
+### 2. ffmpeg 설치
+
+`ffmpeg`와 `ffprobe`가 이미 설치되어 있다면 건너뜁니다.
+
+#### Ubuntu/Debian 사용자
+
+```bash
+sudo apt install ffmpeg
+```
+
+#### MacOS 사용자
+
+```bash
+brew install ffmpeg
+```
+
+#### Windows 사용자
+
+다운로드 후 루트 디렉토리에 배치.
+
+- [ffmpeg.exe 다운로드](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe)
+
+- [ffprobe.exe 다운로드](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe)
+
+### 3. RMVPE 인간 음성 피치 추출 알고리즘에 필요한 파일 다운로드

 최신 RMVPE 인간 음성 피치 추출 알고리즘을 사용하려면 음피치 추출 모델 매개변수를 다운로드하고 RVC 루트 디렉토리에 배치해야 합니다.

@@ -287,7 +332,7 @@ v2 버전 모델을 사용하려면 추가로 다음을 다운로드해야 합

 - [rmvpe.onnx 다운로드](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.onnx)

-### 3. AMD 그래픽 카드 Rocm(선택사항, Linux만 해당)
+### 4. AMD 그래픽 카드 Rocm(선택사항, Linux만 해당)

 Linux 시스템에서 AMD의 Rocm 기술을 기반으로 RVC를 실행하려면 [여기](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)에서 필요한 드라이버를 먼저 설치하세요.

@@ -347,6 +392,7 @@ source /opt/intel/oneapi/setvars.sh
 - [VITS](https://github.com/jaywalnut310/vits)
 - [HIFIGAN](https://github.com/jik876/hifi-gan)
 - [Gradio](https://github.com/gradio-app/gradio)
+- [FFmpeg](https://github.com/FFmpeg/FFmpeg)
 - [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
 - [audio-slicer](https://github.com/openvpi/audio-slicer)
 - [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
--- a/docs/kr/faq_ko.md
+++ b/docs/kr/faq_ko.md
@@ -1,3 +1,8 @@
+## Q1:ffmpeg 오류/utf8 오류
+
+대부분의 경우 ffmpeg 문제가 아니라 오디오 경로 문제입니다. <br>
+ffmpeg가 공백, () 등의 특수 문자가 포함된 경로를 읽을 때 ffmpeg 오류가 발생할 수 있습니다. 트레이닝 세트 오디오가 중문 경로일 때 filelist.txt에 쓸 때 utf8 오류가 발생할 수 있습니다. <br>
+
 ## Q2:일괄 트레이닝이 끝나고 인덱스가 없음

 "Training is done. The program is closed."라고 표시되면 모델 트레이닝이 성공한 것이며, 이어지는 오류는 가짜입니다. <br>
--- a/docs/kr/training_tips_ko.md
+++ b/docs/kr/training_tips_ko.md
@@ -16,6 +16,9 @@ GUI의 훈련 탭의 단계를 따라 설명합니다.
 음성 파일이 있는 폴더를 지정하면 해당 폴더에 있는 음성 파일이 자동으로 가져와집니다.
 예를 들어 `C:Users\hoge\voices`를 지정하면 `C:Users\hoge\voices\voice.mp3`가 읽히지만 `C:Users\hoge\voices\dir\voice.mp3`는 읽히지 않습니다.

+음성 로드에는 내부적으로 ffmpeg를 이용하고 있으므로, ffmpeg로 대응하고 있는 확장자라면 자동적으로 읽힙니다.
+ffmpeg에서 int16으로 변환한 후 float32로 변환하고 -1과 1 사이에 정규화됩니다.
+
 ### 잡음 제거
 음성 파일에 대해 scipy의 filtfilt를 이용하여 잡음을 처리합니다.