DeepLearning

声質変換論文まとめ3

WaveNet Vocoder with Limited Training Data for Voice Conversion, 2018_9 概要 複数話者コーパスと少数のターゲット音声を利用してWaveNet-Vocoderを構成する。 これによって行われる声質変換はSTRAIGHTなどの従来のボコーダーより優れていた。 VCC 2018…

声質変換論文まとめ2

PARALLEL-DATA-FREE VOICE CONVERSION USING CYCLE-CONSISTENT ADVERSARIAL NETWORKS, 2017_12 概要 Cycle-GAN + Gated CNN でノンパラレル声質変換を行った。 客観的な評価により、変換された特徴シーケンスは、グローバル分散と変調スペクトルの点でほぼ自…

声質変換論文まとめ1

Voice Conversion from Unaligned Corpora using Variational Autoencoding Wasserstein Generative Adversarial Networks, 2017_6 概要 非並列データ学習によるVAW-GAN(W距離を使用したVAE-GAN)の声質変換手法を提案する. 貢献 W-GANを非並列音声合成に導入…

GAN実験2

GANのいろんなパーツについて効果を確認しながら実験していく記事の2 前回はGenerator:Discriminator=1:1で訓練してたらDiscriminatorが圧勝してしまったので、今回はDiscriminatorを抑えて実験してみる。 「Discriminator Lossが0.6以上の場合のみDiscrim…

GAN実験1

GANのいろんなパーツについて効果を確認しながら実験していく記事の1 まずは最も基本ということでDCGAN。 勉強のために論文やらを見ながら自分でコード書いてみた。 とはいえGenerator、DiscriminatorともにConvolution -> Batch Norm -> (Leaky) ReLUを繰り…