Debug

2023-05-29 02:23:11 +08:00 · 2023-05-29 02:23:11 +08:00 · dfc2b6a628
parent 5f25534081
commit dfc2b6a628
2 changed files with 3 additions and 3 deletions
--- a/data_utils.py
+++ b/data_utils.py
@ -23,7 +23,7 @@ class TextAudioSpeakerLoader(torch.utils.data.Dataset):
        3) computes spectrograms from audio files.
    """

-    def __init__(self, audiopaths, hparams, all_in_mem: bool = False):
+    def __init__(self, audiopaths, hparams, all_in_mem: bool = False, vol_aug: bool = True):
        self.audiopaths = load_filepaths_and_text(audiopaths)
        self.hparams = hparams
        self.max_wav_value = hparams.data.max_wav_value
@ -36,7 +36,7 @@ class TextAudioSpeakerLoader(torch.utils.data.Dataset):
        self.spec_len = hparams.train.max_speclen
        self.spk_map = hparams.spk
        self.vol_emb = hparams.model.vol_embedding
-        self.vol_aug = hparams.train.vol_aug
+        self.vol_aug = hparams.train.vol_aug and vol_aug
        random.seed(1234)
        random.shuffle(self.audiopaths)
        
--- a/train.py
+++ b/train.py
@ -75,7 +75,7 @@ def run(rank, n_gpus, hps):
    train_loader = DataLoader(train_dataset, num_workers=num_workers, shuffle=False, pin_memory=True,
                              batch_size=hps.train.batch_size, collate_fn=collate_fn)
    if rank == 0:
-        eval_dataset = TextAudioSpeakerLoader(hps.data.validation_files, hps, all_in_mem=all_in_mem)
+        eval_dataset = TextAudioSpeakerLoader(hps.data.validation_files, hps, all_in_mem=all_in_mem,vol_aug = False)
        eval_loader = DataLoader(eval_dataset, num_workers=1, shuffle=False,
                                 batch_size=1, pin_memory=False,
                                 drop_last=False, collate_fn=collate_fn)