|
|
|
@ -1,109 +1,178 @@
|
|
|
|
|
### 20240121 업데이트
|
|
|
|
|
|
|
|
|
|
1. `config`에 `is_share` 추가, Colab 등의 환경에서 이를 `True`로 설정하여 webui를 공용 네트워크에 매핑되도록 할 수 있습니다.
|
|
|
|
|
2. WebUI에 영어 번역이 추가되었습니다.
|
|
|
|
|
3. `cmd-asr`은 damo 모델이 이미 포함되어 있는지 자동으로 확인하고, 기본 경로에 없는 경우 modelscope에서 자동 다운로드 되도록 수정하였습니다.
|
|
|
|
|
4. [SoVITS 학습 중 ZeroDivisionError가 발생](https://github.com/RVC-Boss/GPT-SoVITS/issues/79)하는 경우 복구를 시도합니다. (길이가 0인 샘플 필터링 등)
|
|
|
|
|
5. TEMP 파일 폴더에서 오디오 및 기타 파일을 정리하여 최적화합니다.
|
|
|
|
|
6. 합성 오디오가 레퍼런스 오디오의 끝부분을 포함하는 문제를 개선하였습니다.
|
|
|
|
|
1. `config`에 `is_share`를 추가했습니다. Colab과 같은 시나리오에서는 이 값을 `True`로 설정하여 WebUI를 공개 네트워크에 매핑할 수 있습니다.
|
|
|
|
|
2. WebUI에 영어 시스템 번역 지원을 추가했습니다.
|
|
|
|
|
3. `cmd-asr`이 FunASR 모델이 포함되어 있는지 자동으로 감지합니다; 기본 디렉토리에서 찾을 수 없으면 ModelScope에서 다운로드됩니다.
|
|
|
|
|
4. [Issue 79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79)에서 보고된 SoVITS 훈련의 ZeroDivisionError를 필터링 샘플 등으로 해결하려고 시도했습니다.
|
|
|
|
|
5. `TEMP` 폴더의 캐시된 오디오 파일 및 기타 파일을 정리했습니다.
|
|
|
|
|
6. 참조 오디오의 끝이 포함된 합성 오디오 문제를 크게 줄였습니다.
|
|
|
|
|
|
|
|
|
|
### 20240122 업데이트
|
|
|
|
|
|
|
|
|
|
1. 너무 짧은 출력 파일이 중복된 레퍼런스 오디오를 반환하는 문제 수정하였습니다.
|
|
|
|
|
2. 영어-일본어 학습이 원활하게 진행되는 QA를 완료하였습니다. (다만, 일본어 학습은 루트 디렉토리에 영어 이외의 문자가 없어야 합니다)
|
|
|
|
|
3. 오디오 경로를 검사합니다. 잘못된 경로를 읽으려고 할 때 '경로가 존재하지 않습니다'라는 에러 메시지를 반환하도록 수정하였습니다. 이는 ffmpeg 모듈의 에러가 아닙니다.
|
|
|
|
|
1. 지나치게 짧은 출력 파일로 인해 참조 오디오가 반복되는 문제를 수정했습니다.
|
|
|
|
|
2. 영어 및 일본어 훈련의 네이티브 지원을 테스트했습니다 (일본어 훈련 시 루트 디렉토리에 비영어 특수 문자가 없어야 합니다).
|
|
|
|
|
3. 오디오 경로 확인을 개선했습니다. 잘못된 입력 경로에서 읽으려는 시도가 있을 경우, ffmpeg 오류 대신 경로가 존재하지 않는다고 보고합니다.
|
|
|
|
|
|
|
|
|
|
### 20240123 업데이트
|
|
|
|
|
|
|
|
|
|
1. hubert에서 nan 추출로 인한 SoVITS/GPT 학습 중 ZeroDivisionError 관련 에러를 해결하였습니다.
|
|
|
|
|
2. 추론 인터페이스에서 모델을 빠르게 전환할 수 있도록 지원하도록 수정되었습니다.
|
|
|
|
|
3. 모델 파일 정렬 로직 최적화하였습니다.
|
|
|
|
|
4. 중문 분석에 `jieba_fast`를 `jieba`로 대체하였습니다.
|
|
|
|
|
1. Hubert 추출로 인해 NaN 오류가 발생하여 SoVITS/GPT 훈련에서 ZeroDivisionError가 발생하는 문제를 해결했습니다.
|
|
|
|
|
2. 추론 WebUI에서 빠른 모델 전환 지원을 추가했습니다.
|
|
|
|
|
3. 모델 파일 정렬 로직을 최적화했습니다.
|
|
|
|
|
4. 중국어 단어 분할을 위해 `jieba`를 `jieba_fast`로 교체했습니다.
|
|
|
|
|
|
|
|
|
|
### 20240126 업데이트
|
|
|
|
|
|
|
|
|
|
1. 중국어와 영어, 일본어와 영어가 혼합된 출력 텍스트를 지원합니다.
|
|
|
|
|
2. 출력에서 선택적 분할 모드를 지원합니다.
|
|
|
|
|
3. uvr5가 디렉토리를 읽고 자동으로 종료되는 문제를 수정하였습니다.
|
|
|
|
|
4. 여러 줄바꿈으로 인한 추론 오류를 수정하였습니다.
|
|
|
|
|
5. 추론 인터페이스에서 불필요한 로그 제거하였습니다.
|
|
|
|
|
6. MacOS에서의 학습 및 추론을 지원합니다.
|
|
|
|
|
7. 반정밀을 지원하지 않는 카드를 자동으로 식별하여 단일 정밀도를 강제 적용하고, CPU 추론에서 단일 정밀도를 강제 적용합니다.
|
|
|
|
|
1. 중국어-영어 혼합 및 일본어-영어 혼합 출력 텍스트를 지원합니다.
|
|
|
|
|
2. 출력에 대한 선택적 분할 모드를 추가했습니다.
|
|
|
|
|
3. UVR5 읽기 문제 및 디렉토리 자동 탈출 문제를 수정했습니다.
|
|
|
|
|
4. 추론 오류를 일으키는 여러 줄 바꿈 문제를 수정했습니다.
|
|
|
|
|
5. 추론 WebUI 에서 중복 로그를 제거했습니다.
|
|
|
|
|
6. Mac에서 훈련 및 추론을 지원합니다.
|
|
|
|
|
7. 절반 정밀도를 지원하지 않는 GPU에 대해 자동으로 단정밀도를 강제하며, CPU 추론 시 단정밀도를 적용합니다.
|
|
|
|
|
|
|
|
|
|
### 20240128 업데이트
|
|
|
|
|
|
|
|
|
|
1. 숫자를 한자로 읽는 문제를 수정했습니다.
|
|
|
|
|
2. 문장 시작 부분의 일부 단어가 누락되는 문제 수정하였습니다.
|
|
|
|
|
3. 부적절한 길이의 레퍼런스 오디오를 제한하였습니다.
|
|
|
|
|
4. GPT 학습 시 ckpt가 저장되지 않는 문제 수정하였습니다.
|
|
|
|
|
5. Dockerfile에서 모델 다운로드 프로세스 개선하였습니다.
|
|
|
|
|
1. 숫자의 발음이 중국어 문자로 변환되는 문제를 수정했습니다.
|
|
|
|
|
2. 문장 시작 부분에서 몇 개의 문자가 누락되는 문제를 수정했습니다.
|
|
|
|
|
3. 비합리적인 참조 오디오 길이를 설정하여 제외했습니다.
|
|
|
|
|
4. GPT 훈련 시 체크포인트가 저장되지 않는 문제를 수정했습니다.
|
|
|
|
|
5. Dockerfile 에서 모델 다운로드 프로세스를 완료했습니다.
|
|
|
|
|
|
|
|
|
|
### 20240129 업데이트
|
|
|
|
|
|
|
|
|
|
1. 반정밀도 훈련에 문제가 있는 16 시리즈 및 기타 그래픽 카드의 훈련 구성을 단정밀도 훈련으로 변경했습니다.
|
|
|
|
|
2. Colab에서도 사용이 가능한 버전을 테스트 및 업데이트 하였습니다.
|
|
|
|
|
3. `git clone modelscope funasr` 저장소와 오래된 버전의 funasr 사용으로 인해 인터페이스가 일치하지 않는 오류를 수정하였습니다.
|
|
|
|
|
1. 절반 정밀도 훈련에 문제가 있는 16 시리즈와 같은 GPU의 훈련 구성을 단정밀도로 변경했습니다.
|
|
|
|
|
2. 사용 가능한 Colab 버전을 테스트하고 업데이트했습니다.
|
|
|
|
|
3. 이전 버전의 FunASR 로 인해 인터페이스 정렬 오류가 발생하는 ModelScope FunASR 저장소의 git 클로닝 문제를 수정했습니다.
|
|
|
|
|
|
|
|
|
|
### 20240130 업데이트
|
|
|
|
|
|
|
|
|
|
1. 경로와 관련된 문자열을 파싱하여 큰따옴표를 자동으로 제거합니다. 또한, 경로를 복사하는 경우 큰따옴표가 포함되어도 오류가 발생하지 않습니다.
|
|
|
|
|
2. 중국어 및 영어 문자열의 문장 부호가 잘리는 문제 및 문장의 시작과 끝에 문장 부호가 추가되는 문제를 수정했습니다.
|
|
|
|
|
3. 문장 부호의 수를 확장하였습니다.
|
|
|
|
|
1. 모든 경로 관련 항목에서 이중 따옴표를 자동으로 제거하여 초보자가 이중 따옴표가 포함된 경로를 복사하는 오류를 방지했습니다.
|
|
|
|
|
2. 중국어 및 영어 문장 부호 분할 문제를 수정하고 문장 시작과 끝에 부호를 추가했습니다.
|
|
|
|
|
3. 부호에 의한 분할을 추가했습니다.
|
|
|
|
|
|
|
|
|
|
### 20240201 업데이트
|
|
|
|
|
|
|
|
|
|
1. uvr5가 잘못된 형식으로 읽어들이는 문제를 수정하였습니다.
|
|
|
|
|
2. 중국어, 일본어, 영어가 혼합된 여러 텍스트를 자동으로 분리하여 언어를 인식합니다.
|
|
|
|
|
1. 분리 실패를 일으킨 UVR5 형식 읽기 오류를 수정했습니다.
|
|
|
|
|
2. 혼합된 중국어-일본어-영어 텍스트에 대한 자동 분할 및 언어 인식을 지원합니다.
|
|
|
|
|
|
|
|
|
|
### 20240202 업데이트
|
|
|
|
|
|
|
|
|
|
1. asr 경로의 끝에 `/`가 포함되어 있는 경우 오류가 발생하는 문제를 수정하였습니다.
|
|
|
|
|
2. paddlespeech의 Normalizer를 도입하여 [문제를 해결](https://github.com/RVC-Boss/GPT-SoVITS/pull/377)하여, 예를 들어 xx.xx%(백분율), 元/吨이 元吨으로 읽히는 문제를 해결하였습니다. 또한, 밑줄이 더 이상 오류를 발생시키지 않습니다.
|
|
|
|
|
1. `/` 로 끝나는 ASR 경로가 파일 이름 저장 시 오류를 발생시키는 문제를 수정했습니다.
|
|
|
|
|
2. [PR 377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) 에서는 PaddleSpeech 의 Normalizer 를 도입하여 "xx.xx%" (백분율 기호)와 "元/吨"이 "元吨"으로 읽히는 문제를 "元每吨"으로 수정하고, 밑줄 오류를 수정했습니다.
|
|
|
|
|
|
|
|
|
|
### 20240207 업데이트
|
|
|
|
|
|
|
|
|
|
1. 언어 전달 매개변수가 혼란스러워져 [중국어 추론 효과가 저하되는 문제](https://github.com/RVC-Boss/GPT-SoVITS/issues/391)를 수정하였습니다.
|
|
|
|
|
2. uvr5가 `inf everywhere` [오류를 반환하는 문제](https://github.com/RVC-Boss/GPT-SoVITS/pull/403)를 수정하였습니다.
|
|
|
|
|
3. uvr5의 `is_half` 매개변수가 bool로 변환되지 않아 항상 반정밀도 추론으로 설정되어 16 시리즈 그래픽 카드에서 `inf`가 반환되는 [문제](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8)를 수정하였습니다.
|
|
|
|
|
4. 영어 텍스트 입력을 최적화하였습니다.
|
|
|
|
|
5. gradio 종속성을 지원합니다.
|
|
|
|
|
6. 루트 디렉토리가 비어 있으면 `.list` 전체 경로를 자동으로 읽습니다.
|
|
|
|
|
7. faster whisper ASR 일본어 및 영어를 지원합니다.
|
|
|
|
|
1. [Issue 391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391) 에서 보고된 중국어 추론 품질 저하를 일으킨 언어 매개변수 혼동을 수정했습니다.
|
|
|
|
|
2. [PR 403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) 에서는 UVR5 를 높은 버전의 librosa에 맞게 조정했습니다.
|
|
|
|
|
3. [Commit 14a2851](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8)에서는 `is_half` 매개변수가 불리언으로 변환되지 않아 발생한 UVR5 `inf` 오류를 수정했습니다. 이로 인해 16 시리즈 GPU에서 `inf` 가 발생했습니다.
|
|
|
|
|
4. 영어 텍스트 프론트엔드를 최적화했습니다.
|
|
|
|
|
5. Gradio 종속성 문제를 수정했습니다.
|
|
|
|
|
6. 데이터셋 준비 시 루트 디렉토리를 비워두면 `.list` 전체 경로를 자동으로 읽도록 지원합니다.
|
|
|
|
|
7. 일본어와 영어에 대한 Faster Whisper ASR을 통합했습니다.
|
|
|
|
|
|
|
|
|
|
### 20240208 업데이트
|
|
|
|
|
|
|
|
|
|
1. GPT 학습이 카드에 따라 멈추는 문제와 [GPT 학습 중 ZeroDivisionError](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) 문제를 수정하였습니다.
|
|
|
|
|
1. [Commit 59f35ad](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b)에서는 Windows 10 1909와 [Issue 232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) (전통 중국어 시스템 언어)에서 GPT 훈련 멈춤 문제를 수정하려고 했습니다.
|
|
|
|
|
|
|
|
|
|
### 20240212 업데이트
|
|
|
|
|
|
|
|
|
|
1. faster whisper 및 funasr 로직을 최적화하였습니다. faster whisper는 이미지 스토어에서 다운로드하여 huggingface에 연결하지 못하는 문제를 회피합니다.
|
|
|
|
|
2. DPO Loss 실험적 학습 옵션을 활성화하여 부정적 샘플을 생성하여 [GPT 반복 및 누락 문자 문제](https://github.com/RVC-Boss/GPT-SoVITS/pull/457)를 완화합니다. 추론 인터페이스에 몇 가지 추론 매개변수를 공개합니다.
|
|
|
|
|
1. Faster Whisper와 FunASR의 로직을 최적화하고, Faster Whisper를 미러 다운로드로 전환하여 Hugging Face 연결 문제를 피했습니다.
|
|
|
|
|
2. [PR 457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457)은 DPO Loss 실험적 훈련 옵션을 활성화하여 GPT의 반복 및 문자 누락 문제를 완화하고, 훈련 중 부정 샘플을 구성하며 여러 추론 매개변수를 추론 WebUI에서 사용할 수 있게 했습니다.
|
|
|
|
|
|
|
|
|
|
### 20240214 업데이트
|
|
|
|
|
|
|
|
|
|
1. 학습에서 중국어 실험 이름을 지원합니다. (이전에 오류가 발생했습니다)
|
|
|
|
|
2. DPO 학습을 선택적으로 설정할 수 있도록 변경하였습니다. 배치 크기를 선택하면 자동으로 절반으로 줄어듭니다. 추론 인터페이스에서 새로운 매개변수를 전달하지 않는 문제를 수정하였습니다.
|
|
|
|
|
1. 훈련 시 중국어 실험 이름을 지원합니다 (이전에는 오류가 발생했습니다).
|
|
|
|
|
2. DPO 훈련을 필수 기능 대신 선택적 기능으로 변경했습니다. 선택 시, 배치 크기가 자동으로 절반으로 줄어듭니다. 추론 WebUI에서 새로운 매개변수가 전달되지 않는 문제를 수정했습니다.
|
|
|
|
|
|
|
|
|
|
### 20240216 업데이트
|
|
|
|
|
|
|
|
|
|
1. 참조 텍스트 입력을 지원합니다.
|
|
|
|
|
2. 프론트엔드에 있던 중국어 텍스트 입력 버그를 수정하였습니다.
|
|
|
|
|
1. 참조 텍스트 없이 입력을 지원합니다.
|
|
|
|
|
2. [Issue 475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475)에서 보고된 중국어 프론트엔드의 버그를 수정했습니다.
|
|
|
|
|
|
|
|
|
|
### 20240221 업데이트
|
|
|
|
|
|
|
|
|
|
1. 데이터 처리에 음성 노이즈 감소 옵션을 추가하였습니다. (노이즈 감소는 16k 샘플링률만 남기며, 노이즈가 크지 않다면 사용하지 마십시오.)
|
|
|
|
|
2. 중국어 및 일본어 프론트엔드 처리를 최적화하였습니다. https://github.com/RVC-Boss/GPT-SoVITS/pull/559 https://github.com/RVC-Boss/GPT-SoVITS/pull/556 https://github.com/RVC-Boss/GPT-SoVITS/pull/532 https://github.com/RVC-Boss/GPT-SoVITS/pull/507 https://github.com/RVC-Boss/GPT-SoVITS/pull/509
|
|
|
|
|
3. Mac에서 CPU 추론이 더 빨라졌으므로 추론 장치를 mps에서 CPU로 변경하였습니다.
|
|
|
|
|
4. colab에서 공용 URL을 열지 않는 문제를 수정하였습니다.
|
|
|
|
|
1. 데이터 처리 중 노이즈 감소 옵션을 추가했습니다 (노이즈 감소는 16kHz 샘플링 비율만 남깁니다; 배경 노이즈가 심한 경우에만 사용하십시오).
|
|
|
|
|
2. [PR 559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559), [PR 556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR 532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR 507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR 509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509) 중국어 및 일본어 프론트엔드 처리를 최적화했습니다.
|
|
|
|
|
3. Mac CPU 추론을 MPS 대신 CPU를 사용하도록 전환하여 성능을 향상시켰습니다.
|
|
|
|
|
4. Colab 공개 URL 문제를 수정했습니다.
|
|
|
|
|
|
|
|
|
|
### 20240306 업데이트
|
|
|
|
|
|
|
|
|
|
1. 추론 속도를 50% 빠르게 하였습니다. (RTX3090+pytorch2.2.1+cu11.8+win10+py39 테스트 완료) https://github.com/RVC-Boss/GPT-SoVITS/pull/672
|
|
|
|
|
2. faster whisper를 사용할 때 중국어 ASR을 먼저 다운로드할 필요가 없습니다.
|
|
|
|
|
3. uvr5의 잔향 제거 모델이 잔향이 있는지 여부를 반대로 반환하는 문제를 수정하였습니다.
|
|
|
|
|
4. faster whisper가 CUDA를 사용할 수 없는 경우 자동으로 CPU 추론을 사용하도록 수정하였습니다.
|
|
|
|
|
5. is_half의 판단을 수정하여 Mac에서 CPU 추론이 정상적으로 작동하도록 수정하였습니다.
|
|
|
|
|
1. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)는 추론 속도를 50% 가속화했습니다 (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39에서 테스트됨).
|
|
|
|
|
2. Faster Whisper의 비중국어 ASR을 사용할 때 중국어 FunASR 모델을 먼저 다운로드할 필요가 없습니다.
|
|
|
|
|
3. [PR 610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610)은 UVR5 리버브 제거 모델에서 설정이 반대로 되어 있는 문제를 수정했습니다.
|
|
|
|
|
4. [PR 675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675)는 CUDA가 없는 경우 Faster Whisper의 자동 CPU 추론을 가능하게 했습니다.
|
|
|
|
|
5. [PR 573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573)은 Mac에서 올바른 CPU 추론을 보장하기 위해 `is_half` 체크를 수정했습니다.
|
|
|
|
|
|
|
|
|
|
todolist:
|
|
|
|
|
### 202403/202404/202405 업데이트
|
|
|
|
|
|
|
|
|
|
1. 중국어 다양한 발음 단어 추론 최적화(테스트 결과를 작성하시는 분은 pr 코멘트 영역에 작성해주시면 감사하겠습니다)
|
|
|
|
|
#### 사소한 수정:
|
|
|
|
|
|
|
|
|
|
1. 참조 텍스트 없는 모드의 문제를 수정했습니다.
|
|
|
|
|
2. 중국어 및 영어 텍스트 프론트엔드를 최적화했습니다.
|
|
|
|
|
3. API 형식을 개선했습니다.
|
|
|
|
|
4. CMD 형식 문제를 수정했습니다.
|
|
|
|
|
5. 훈련 데이터 처리 중 지원되지 않는 언어에 대한 오류 프롬프트를 추가했습니다.
|
|
|
|
|
6. Hubert 추출의 버그를 수정했습니다.
|
|
|
|
|
|
|
|
|
|
#### 주요 수정:
|
|
|
|
|
|
|
|
|
|
1. VQ를 고정하지 않고 SoVITS 훈련의 문제를 수정했습니다(품질 저하를 일으킬 수 있음).
|
|
|
|
|
2. 빠른 추론 분기를 추가했습니다.
|
|
|
|
|
|
|
|
|
|
### 20240610 업데이트
|
|
|
|
|
|
|
|
|
|
#### 사소한 수정:
|
|
|
|
|
|
|
|
|
|
1. [PR 1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168) & [PR 1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) 순수 구두점 및 다중 구두점 텍스트 입력 로직을 개선했습니다.
|
|
|
|
|
2. [Commit 501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) UVR5에서 MDXNet 디러버브를 위한 CMD 형식을 수정하고 공백이 있는 경로를 지원했습니다.
|
|
|
|
|
3. [PR 1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) `s2_train.py`에서 SoVITS 훈련을 위한 진행률 표시줄 로직을 수정했습니다.
|
|
|
|
|
|
|
|
|
|
#### 주요 수정:
|
|
|
|
|
|
|
|
|
|
4. [Commit 99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) WebUI의 GPT 미세 조정이 중국어 입력 텍스트의 BERT 기능을 읽지 않아 추론과 불일치 및 잠재적 품질 저하를 일으키는 문제를 수정했습니다.
|
|
|
|
|
**주의: 이전에 많은 양의 데이터로 미세 조정한 경우 품질을 향상시키기 위해 모델을 다시 조정하는 것이 좋습니다.**
|
|
|
|
|
|
|
|
|
|
### 20240706 업데이트
|
|
|
|
|
|
|
|
|
|
#### 사소한 수정:
|
|
|
|
|
|
|
|
|
|
1. [Commit 1250670](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) CPU 추론에서 기본 배치 크기 소수점 문제를 수정했습니다.
|
|
|
|
|
2. [PR 1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR 1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR 1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) 노이즈 제거 또는 ASR이 예외를 만나면 모든 보류 중인 오디오 파일이 종료되는 문제를 수정했습니다.
|
|
|
|
|
3. [PR 1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) 구두점으로 분할할 때 소수점 분할 문제를 수정했습니다.
|
|
|
|
|
4. [Commit a208698](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) 다중 GPU 훈련을 위한 다중 프로세스 저장 로직을 수정했습니다.
|
|
|
|
|
5. [PR 1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) 불필요한 `my_utils`를 제거했습니다.
|
|
|
|
|
|
|
|
|
|
#### 주요 수정:
|
|
|
|
|
|
|
|
|
|
6. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)의 가속 추론 코드가 검증되어 메인 브랜치에 병합되었으며, 기본과 일관된 추론 효과를 보장합니다.
|
|
|
|
|
또한 참조 텍스트 없는 모드에서 가속 추론을 지원합니다.
|
|
|
|
|
|
|
|
|
|
**향후 업데이트에서는 `fast_inference` 브랜치의 변경 사항의 일관성을 계속 검증할 것입니다**.
|
|
|
|
|
|
|
|
|
|
### 20240727 업데이트
|
|
|
|
|
|
|
|
|
|
#### 사소한 수정:
|
|
|
|
|
|
|
|
|
|
1. [PR 1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) 불필요한 i18n 코드를 정리했습니다.
|
|
|
|
|
2. [PR 1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) 사용자 파일 경로의 후행 슬래시가 명령줄 오류를 일으키는 문제를 수정했습니다.
|
|
|
|
|
3. [PR 756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) GPT 훈련의 단계 계산 로직을 수정했습니다.
|
|
|
|
|
|
|
|
|
|
#### 주요 수정:
|
|
|
|
|
|
|
|
|
|
4. [Commit 9588a3c](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2) 합성을 위한 음성 속도 조절을 지원했습니다.
|
|
|
|
|
음성 속도만 조절하면서 무작위성을 고정할 수 있습니다.
|
|
|
|
|
|
|
|
|
|
### 20240806 업데이트
|
|
|
|
|
|
|
|
|
|
1. [PR 1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR 1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356) BS RoFormer 보컬 반주 분리 모델에 대한 지원을 추가했습니다. [Commit e62e965](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c) FP16 추론을 활성화했습니다.
|
|
|
|
|
2. 중국어 텍스트 프론트엔드를 개선했습니다.
|
|
|
|
|
- [PR 488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488) 중국어 다의자 지원 (v2 전용);
|
|
|
|
|
- [PR 987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987) 추가된 양자;
|
|
|
|
|
- [PR 1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351) 사칙연산 및 기본 수학 공식을 지원합니다;
|
|
|
|
|
- [PR 1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404) 혼합 텍스트 오류를 수정했습니다.
|
|
|
|
|
3. [PR 1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356) WebUI 에서 오디오를 처리할 때 경로를 자동으로 채웠습니다.
|
|
|
|
|
4. [Commit bce451a](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit 4c8b761](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78) GPU 인식 로직을 최적화했습니다.
|
|
|
|
|
5. [Commit 8a10147](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3) 광동어 ASR 지원을 추가했습니다.
|
|
|
|
|
6. GPT-SoVITS v2 지원을 추가했습니다.
|
|
|
|
|
7. [PR 1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387) 타이밍 로직을 최적화했습니다.
|