[논문 정리] NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAMPREDICTIONS
Keyword Mel Spectogram WaveNet Tacotron2 한줄 요약: Tacotron이라는 모델을 통해 Mel Spectogram을 생성하고 이를 WaveNet의 입력으로 주어 음성 합성을 하니 기존보다 성능이 크게 개선되었다. Abstract seq2seq network + WaveNet(Vocoder, WaveNet이 Vocoder 역할을 한다) Vocoder를 활용하여 MelSpectogram으로부터 시간 영역의 파동을 합성 WaveNet 아키텍쳐의 크기를 상당히 줄일 수 있다. 4.53의 MOS 달성 1. Introduction 기존의 방식은 사전 녹음된 Waveform의 작은 단위를 이어붙이는 단위 선택을 통한 연결적 합성 예를 들면, '안', '녕', '하', '세', '요'를..
2023.05.07