chore: code cleanup by `ruff fix`

2023-06-26 14:57:53 +08:00 · 2023-06-26 14:57:53 +08:00 · a5f0e911ed
parent 88be2098fd
commit a5f0e911ed
78 changed files with 305 additions and 222 deletions
--- a/.ruff.toml
+++ b/.ruff.toml
@ -1 +1,4 @@
+select = ["E", "F", "I"]

+# Never enforce `E501` (line length violations).
+ignore = ["E501"]
--- a/cluster/init.py
+++ b/cluster/init.py
@ -1,6 +1,7 @@
 import torch
 from sklearn.cluster import KMeans

+
 def get_cluster_model(ckpt_path):
    checkpoint = torch.load(ckpt_path)
    kmeans_dict = {}
--- a/cluster/kmeans.py
+++ b/cluster/kmeans.py
@ -1,7 +1,11 @@
-import torch,pynvml
-from torch.nn.functional import normalize
 from time import time
+
 import numpy as np
+import pynvml
+import torch
+from torch.nn.functional import normalize
+
+
 # device=torch.device("cuda:0")
 def _kpp(data: torch.Tensor, k: int, sample_size: int = -1):
    """ Picks k points in the data based on the kmeans++ method.
--- a/cluster/train_cluster.py
+++ b/cluster/train_cluster.py
@ -1,17 +1,17 @@
-import time
-import tqdm
-import os
-from pathlib import Path
-import logging
 import argparse
-from kmeans import KMeansGPU
-import torch
+import logging
+import os
+import time
+from pathlib import Path
+
 import numpy as np
-from sklearn.cluster import KMeans,MiniBatchKMeans
+import torch
+import tqdm
+from kmeans import KMeansGPU
+from sklearn.cluster import KMeans, MiniBatchKMeans

 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
-import torch

 def train_cluster(in_dir, n_clusters, use_minibatch=True, verbose=False,use_gpu=False):#gpu_minibatch真拉，虽然库支持但是也不考虑
    logger.info(f"Loading features from {in_dir}")
--- a/data_utils.py
+++ b/data_utils.py
@ -1,12 +1,13 @@
 import os
 import random
+
 import numpy as np
 import torch
 import torch.utils.data

 import utils
-from modules.mel_processing import spectrogram_torch, spectrogram_torch
-from utils import load_wav_to_torch, load_filepaths_and_text
+from modules.mel_processing import spectrogram_torch
+from utils import load_filepaths_and_text, load_wav_to_torch

 # import h5py

--- a/diffusion/data_loaders.py
+++ b/diffusion/data_loaders.py
@ -1,12 +1,14 @@
 import os
 import random
-import numpy as np
+
 import librosa
+import numpy as np
 import torch
-import random
-from utils import repeat_expand_2d
-from tqdm import tqdm
 from torch.utils.data import Dataset
+from tqdm import tqdm
+
+from utils import repeat_expand_2d
+

 def traverse_dir(
        root_dir,
--- a/diffusion/diffusion.py
+++ b/diffusion/diffusion.py
@ -1,9 +1,10 @@
 from collections import deque
 from functools import partial
 from inspect import isfunction
-import torch.nn.functional as F
+
 import numpy as np
 import torch
+import torch.nn.functional as F
 from torch import nn
 from tqdm import tqdm

@ -254,7 +255,11 @@ class GaussianDiffusion(nn.Module):
                        
            if method is not None and infer_speedup > 1:
                if method == 'dpm-solver' or method == 'dpm-solver++':
-                    from .dpm_solver_pytorch import NoiseScheduleVP, model_wrapper, DPM_Solver
+                    from .dpm_solver_pytorch import (
+                        DPM_Solver,
+                        NoiseScheduleVP,
+                        model_wrapper,
+                    )
                    # 1. Define the noise schedule.
                    noise_schedule = NoiseScheduleVP(schedule='discrete', betas=self.betas[:t])

@ -332,7 +337,7 @@ class GaussianDiffusion(nn.Module):
                                infer_speedup, cond=cond
                            )
                elif method == 'unipc':
-                    from .uni_pc import NoiseScheduleVP, model_wrapper, UniPC
+                    from .uni_pc import NoiseScheduleVP, UniPC, model_wrapper
                    # 1. Define the noise schedule.
                    noise_schedule = NoiseScheduleVP(schedule='discrete', betas=self.betas[:t])

--- a/diffusion/diffusion_onnx.py
+++ b/diffusion/diffusion_onnx.py
@ -1,14 +1,14 @@
+import math
 from collections import deque
 from functools import partial
 from inspect import isfunction
-import torch.nn.functional as F
+
 import numpy as np
-from torch.nn import Conv1d
-from torch.nn import Mish
 import torch
+import torch.nn.functional as F
 from torch import nn
+from torch.nn import Conv1d, Mish
 from tqdm import tqdm
-import math


 def exists(x):
@ -390,7 +390,11 @@ class GaussianDiffusion(nn.Module):
                        
            if method is not None and infer_speedup > 1:
                if method == 'dpm-solver':
-                    from .dpm_solver_pytorch import NoiseScheduleVP, model_wrapper, DPM_Solver
+                    from .dpm_solver_pytorch import (
+                        DPM_Solver,
+                        NoiseScheduleVP,
+                        model_wrapper,
+                    )
                    # 1. Define the noise schedule.
                    noise_schedule = NoiseScheduleVP(schedule='discrete', betas=self.betas[:t])

--- a/diffusion/infer_gt_mel.py
+++ b/diffusion/infer_gt_mel.py
@ -1,5 +1,6 @@
 import torch
 import torch.nn.functional as F
+
 from diffusion.unit2mel import load_model_vocoder


--- a/diffusion/logger/saver.py
+++ b/diffusion/logger/saver.py
@ -2,14 +2,16 @@
 author: wayn391@mastertones
 '''

+import datetime
 import os
 import time
-import yaml
-import datetime
-import torch
+
 import matplotlib.pyplot as plt
+import torch
+import yaml
 from torch.utils.tensorboard import SummaryWriter

+
 class Saver(object):
    def __init__(
            self, 
--- a/diffusion/logger/utils.py
+++ b/diffusion/logger/utils.py
@ -1,7 +1,9 @@
-import os
-import yaml
 import json
+import os
+
 import torch
+import yaml
+

 def traverse_dir(
        root_dir,
--- a/diffusion/onnx_export.py
+++ b/diffusion/onnx_export.py
@ -1,10 +1,12 @@
-from diffusion_onnx import GaussianDiffusion
 import os
-import yaml
+
+import numpy as np
 import torch
 import torch.nn as nn
-import numpy as np
 import torch.nn.functional as F
+import yaml
+from diffusion_onnx import GaussianDiffusion
+

 class DotDict(dict):
    def __getattr__(*args):         
--- a/diffusion/solver.py
+++ b/diffusion/solver.py
@ -1,12 +1,15 @@
 import time
+
+import librosa
 import numpy as np
 import torch
-import librosa
-from diffusion.logger.saver import Saver
-from diffusion.logger import utils
 from torch import autocast
 from torch.cuda.amp import GradScaler

+from diffusion.logger import utils
+from diffusion.logger.saver import Saver
+
+
 def test(args, model, vocoder, loader_test, saver):
    print(' [*] testing...')
    model.eval()
--- a/diffusion/uni_pc.py
+++ b/diffusion/uni_pc.py
@ -1,6 +1,7 @@
-import torch
 import math

+import torch
+

 class NoiseScheduleVP:
    def __init__(
--- a/diffusion/unit2mel.py
+++ b/diffusion/unit2mel.py
@ -1,11 +1,14 @@
 import os
-import yaml
+
+import numpy as np
 import torch
 import torch.nn as nn
-import numpy as np
+import yaml
+
 from .diffusion import GaussianDiffusion
-from .wavenet import WaveNet
 from .vocoder import Vocoder
+from .wavenet import WaveNet
+

 class DotDict(dict):
    def __getattr__(*args):         
--- a/diffusion/vocoder.py
+++ b/diffusion/vocoder.py
@ -1,9 +1,10 @@
 import torch
-from vdecoder.nsf_hifigan.nvSTFT import STFT
-from vdecoder.nsf_hifigan.models import load_model,load_config
 from torchaudio.transforms import Resample

-    
+from vdecoder.nsf_hifigan.models import load_config, load_model
+from vdecoder.nsf_hifigan.nvSTFT import STFT
+
+
 class Vocoder:
    def __init__(self, vocoder_type, vocoder_ckpt, device = None):
        if device is None:
--- a/flask_api.py
+++ b/flask_api.py
@ -7,7 +7,7 @@ import torchaudio
 from flask import Flask, request, send_file
 from flask_cors import CORS

-from inference.infer_tool import Svc, RealTimeVC
+from inference.infer_tool import RealTimeVC, Svc

 app = Flask(__name__)

--- a/flask_api_full_song.py
+++ b/flask_api_full_song.py
@ -1,10 +1,10 @@
 import io
+
 import numpy as np
 import soundfile
 from flask import Flask, request, send_file

-from inference import infer_tool
-from inference import slicer
+from inference import infer_tool, slicer

 app = Flask(__name__)

--- a/inference/infer_tool.py
+++ b/inference/infer_tool.py
@ -1,15 +1,16 @@
+import gc
 import hashlib
 import io
 import json
 import logging
 import os
+import pickle
 import time
 from pathlib import Path
-from inference import slicer
-import gc

 import librosa
 import numpy as np
+
 # import onnxruntime
 import soundfile
 import torch
@ -17,10 +18,9 @@ import torchaudio

 import cluster
 import utils
-from models import SynthesizerTrn
-import pickle
-
 from diffusion.unit2mel import load_model_vocoder
+from inference import slicer
+from models import SynthesizerTrn

 logging.getLogger('matplotlib').setLevel(logging.WARNING)

--- a/inference/infer_tool_grad.py
+++ b/inference/infer_tool_grad.py
@ -1,16 +1,18 @@
+import io
 import logging
 import os
-import io
+
 import librosa
 import numpy as np
-from inference import slicer
 import parselmouth
 import soundfile
 import torch
 import torchaudio

 import utils
+from inference import slicer
 from models import SynthesizerTrn
+
 logging.getLogger('numba').setLevel(logging.WARNING)
 logging.getLogger('matplotlib').setLevel(logging.WARNING)

--- a/inference_main.py
+++ b/inference_main.py
@ -1,8 +1,10 @@
 import logging
-from spkmix import spk_mix_map
+
 import soundfile
+
 from inference import infer_tool
 from inference.infer_tool import Svc
+from spkmix import spk_mix_map

 logging.getLogger('numba').setLevel(logging.WARNING)
 chunks_dict = infer_tool.read_temp("inference/chunks_temp.json")
--- a/models.py
+++ b/models.py
@ -1,18 +1,17 @@
 import torch
 from torch import nn
+from torch.nn import Conv1d, Conv2d
 from torch.nn import functional as F
+from torch.nn.utils import spectral_norm, weight_norm

 import modules.attentions as attentions
 import modules.commons as commons
 import modules.modules as modules
-
-from torch.nn import Conv1d, Conv2d
-from torch.nn.utils import weight_norm, spectral_norm
-
 import utils
 from modules.commons import get_padding
 from utils import f0_to_coarse

+
 class ResidualCouplingBlock(nn.Module):
    def __init__(self,
                 channels,
--- a/modules/F0Predictor/CrepeF0Predictor.py
+++ b/modules/F0Predictor/CrepeF0Predictor.py
@ -1,7 +1,9 @@
-from modules.F0Predictor.F0Predictor import F0Predictor
-from modules.F0Predictor.crepe import CrepePitchExtractor
 import torch

+from modules.F0Predictor.crepe import CrepePitchExtractor
+from modules.F0Predictor.F0Predictor import F0Predictor
+
+
 class CrepeF0Predictor(F0Predictor):
    def __init__(self,hop_length=512,f0_min=50,f0_max=1100,device=None,sampling_rate=44100,threshold=0.05,model="full"):
        self.F0Creper = CrepePitchExtractor(hop_length=hop_length,f0_min=f0_min,f0_max=f0_max,device=device,threshold=threshold,model=model)
--- a/modules/F0Predictor/DioF0Predictor.py
+++ b/modules/F0Predictor/DioF0Predictor.py
@ -1,6 +1,8 @@
-from modules.F0Predictor.F0Predictor import F0Predictor
-import pyworld
 import numpy as np
+import pyworld
+
+from modules.F0Predictor.F0Predictor import F0Predictor
+

 class DioF0Predictor(F0Predictor):
    def __init__(self,hop_length=512,f0_min=50,f0_max=1100,sampling_rate=44100):
--- a/modules/F0Predictor/HarvestF0Predictor.py
+++ b/modules/F0Predictor/HarvestF0Predictor.py
@ -1,6 +1,8 @@
-from modules.F0Predictor.F0Predictor import F0Predictor
-import pyworld
 import numpy as np
+import pyworld
+
+from modules.F0Predictor.F0Predictor import F0Predictor
+

 class HarvestF0Predictor(F0Predictor):
    def __init__(self,hop_length=512,f0_min=50,f0_max=1100,sampling_rate=44100):
--- a/modules/F0Predictor/PMF0Predictor.py
+++ b/modules/F0Predictor/PMF0Predictor.py
@ -1,6 +1,8 @@
-from modules.F0Predictor.F0Predictor import F0Predictor
-import parselmouth
 import numpy as np
+import parselmouth
+
+from modules.F0Predictor.F0Predictor import F0Predictor
+

 class PMF0Predictor(F0Predictor):
    def __init__(self,hop_length=512,f0_min=50,f0_max=1100,sampling_rate=44100):
--- a/modules/F0Predictor/crepe.py
+++ b/modules/F0Predictor/crepe.py
@ -1,4 +1,5 @@
-from typing import Optional,Union
+from typing import Optional, Union
+
 try:
    from typing import Literal
 except Exception:
--- a/modules/attentions.py
+++ b/modules/attentions.py
@ -1,4 +1,5 @@
 import math
+
 import torch
 from torch import nn
 from torch.nn import functional as F
--- a/modules/commons.py
+++ b/modules/commons.py
@ -1,7 +1,9 @@
 import math
+
 import torch
 from torch.nn import functional as F

+
 def slice_pitch_segments(x, ids_str, segment_size=4):
  ret = torch.zeros_like(x[:, :segment_size])
  for i in range(x.size(0)):
--- a/modules/enhancer.py
+++ b/modules/enhancer.py
@ -1,10 +1,12 @@
 import numpy as np
 import torch
 import torch.nn.functional as F
-from vdecoder.nsf_hifigan.nvSTFT import STFT
-from vdecoder.nsf_hifigan.models import load_model
 from torchaudio.transforms import Resample

+from vdecoder.nsf_hifigan.models import load_model
+from vdecoder.nsf_hifigan.nvSTFT import STFT
+
+
 class Enhancer:
    def __init__(self, enhancer_type, enhancer_ckpt, device=None):
        if device is None:
--- a/modules/losses.py
+++ b/modules/losses.py
@ -1,5 +1,4 @@
-import torch 
-
+import torch


 def feature_loss(fmap_r, fmap_g):
--- a/modules/modules.py
+++ b/modules/modules.py
@ -1,13 +1,11 @@
 import torch
 from torch import nn
-from torch.nn import functional as F
-
 from torch.nn import Conv1d
-from torch.nn.utils import weight_norm, remove_weight_norm
+from torch.nn import functional as F
+from torch.nn.utils import remove_weight_norm, weight_norm

 import modules.commons as commons
-from modules.commons import init_weights, get_padding
-
+from modules.commons import get_padding, init_weights

 LRELU_SLOPE = 0.1

--- a/onnx_export.py
+++ b/onnx_export.py
@ -1,6 +1,8 @@
 import torch
-from onnxexport.model_onnx import SynthesizerTrn
+
 import utils
+from onnxexport.model_onnx import SynthesizerTrn
+

 def main(NetExport):
    path = "SoVits4.0"
--- a/onnx_export_speaker_mix.py
+++ b/onnx_export_speaker_mix.py
@ -1,8 +1,11 @@
-import torch
-from onnxexport.model_onnx_speaker_mix import SynthesizerTrn
-import utils
 import json

+import torch
+
+import utils
+from onnxexport.model_onnx_speaker_mix import SynthesizerTrn
+
+
 def main():
    path = "crs"

--- a/onnxexport/model_onnx.py
+++ b/onnxexport/model_onnx.py
@ -1,18 +1,16 @@
 import torch
 from torch import nn
+from torch.nn import Conv1d, Conv2d
 from torch.nn import functional as F
+from torch.nn.utils import spectral_norm, weight_norm

 import modules.attentions as attentions
 import modules.commons as commons
 import modules.modules as modules
-
-from torch.nn import Conv1d, Conv2d
-from torch.nn.utils import weight_norm, spectral_norm
-
 import utils
 from modules.commons import get_padding
-from vdecoder.hifigan.models import Generator
 from utils import f0_to_coarse
+from vdecoder.hifigan.models import Generator


 class ResidualCouplingBlock(nn.Module):
--- a/onnxexport/model_onnx_speaker_mix.py
+++ b/onnxexport/model_onnx_speaker_mix.py
@ -4,10 +4,9 @@ from torch.nn import functional as F

 import modules.attentions as attentions
 import modules.modules as modules
-
-
 from utils import f0_to_coarse

+
 class ResidualCouplingBlock(nn.Module):
    def __init__(self,
                 channels,
--- a/preprocess_flist_config.py
+++ b/preprocess_flist_config.py
@ -1,11 +1,11 @@
-import os
 import argparse
+import json
+import os
 import re
+import wave
+from random import shuffle

 from tqdm import tqdm
-from random import shuffle
-import json
-import wave

 import diffusion.logger.utils as du

--- a/preprocess_hubert_f0.py
+++ b/preprocess_hubert_f0.py
@ -1,19 +1,20 @@
-import os
-import utils
-import torch
-import random
-import librosa
-import logging
 import argparse
+import logging
 import multiprocessing
-import numpy as np
-import diffusion.logger.utils as du
-
-from glob import glob
-from tqdm import tqdm
-from random import shuffle
-from diffusion.vocoder import Vocoder
+import os
+import random
 from concurrent.futures import ProcessPoolExecutor
+from glob import glob
+from random import shuffle
+
+import librosa
+import numpy as np
+import torch
+from tqdm import tqdm
+
+import diffusion.logger.utils as du
+import utils
+from diffusion.vocoder import Vocoder
 from modules.mel_processing import spectrogram_torch

 logging.getLogger("numba").setLevel(logging.WARNING)
--- a/resample.py
+++ b/resample.py
@ -1,10 +1,11 @@
-import os
 import argparse
-import librosa
-import numpy as np
 import concurrent.futures
+import os
 from concurrent.futures import ProcessPoolExecutor
 from multiprocessing import cpu_count
+
+import librosa
+import numpy as np
 from scipy.io import wavfile
 from tqdm import tqdm

--- a/train.py
+++ b/train.py
@ -6,27 +6,24 @@ logging.getLogger('matplotlib').setLevel(logging.WARNING)
 logging.getLogger('numba').setLevel(logging.WARNING)

 import os
+
 import torch
+import torch.distributed as dist
+import torch.multiprocessing as mp
+from torch.cuda.amp import GradScaler, autocast
 from torch.nn import functional as F
+from torch.nn.parallel import DistributedDataParallel as DDP
 from torch.utils.data import DataLoader
 from torch.utils.tensorboard import SummaryWriter
-import torch.multiprocessing as mp
-import torch.distributed as dist
-from torch.nn.parallel import DistributedDataParallel as DDP
-from torch.cuda.amp import autocast, GradScaler

 import modules.commons as commons
 import utils
-from data_utils import TextAudioSpeakerLoader, TextAudioCollate
+from data_utils import TextAudioCollate, TextAudioSpeakerLoader
 from models import (
-    SynthesizerTrn,
    MultiPeriodDiscriminator,
+    SynthesizerTrn,
 )
-from modules.losses import (
-    kl_loss,
-    generator_loss, discriminator_loss, feature_loss
-)
-
+from modules.losses import discriminator_loss, feature_loss, generator_loss, kl_loss
 from modules.mel_processing import mel_spectrogram_torch, spec_to_mel_torch

 torch.backends.cudnn.benchmark = True
--- a/train_diff.py
+++ b/train_diff.py
@ -1,8 +1,10 @@
 import argparse
+
 import torch
 from torch.optim import lr_scheduler
-from diffusion.logger import utils
+
 from diffusion.data_loaders import get_data_loaders
+from diffusion.logger import utils
 from diffusion.solver import train
 from diffusion.unit2mel import Unit2Mel
 from diffusion.vocoder import Vocoder
--- a/train_index.py
+++ b/train_index.py
@ -1,8 +1,8 @@
-import utils
-import pickle
-import os
 import argparse
+import os
+import pickle

+import utils

 if __name__ == "__main__":
    parser = argparse.ArgumentParser()
--- a/utils.py
+++ b/utils.py
@ -1,17 +1,18 @@
-import os
-import glob
-import re
-import sys
 import argparse
-import logging
+import glob
 import json
+import logging
+import os
+import re
 import subprocess
+import sys
+
+import faiss
 import librosa
 import numpy as np
-from scipy.io.wavfile import read
 import torch
+from scipy.io.wavfile import read
 from torch.nn import functional as F
-import faiss

 MATPLOTLIB_FLAG = False

--- a/vdecoder/hifigan/models.py
+++ b/vdecoder/hifigan/models.py
@ -1,13 +1,15 @@
-import os
 import json
-from .env import AttrDict
+import os
+
 import numpy as np
 import torch
-import torch.nn.functional as F
 import torch.nn as nn
-from torch.nn import Conv1d, ConvTranspose1d, AvgPool1d, Conv2d
-from torch.nn.utils import weight_norm, remove_weight_norm, spectral_norm
-from .utils import init_weights, get_padding
+import torch.nn.functional as F
+from torch.nn import AvgPool1d, Conv1d, Conv2d, ConvTranspose1d
+from torch.nn.utils import remove_weight_norm, spectral_norm, weight_norm
+
+from .env import AttrDict
+from .utils import get_padding, init_weights

 LRELU_SLOPE = 0.1

--- a/vdecoder/hifigan/nvSTFT.py
+++ b/vdecoder/hifigan/nvSTFT.py
@ -1,11 +1,13 @@
 import os
-os.environ["LRU_CACHE_CAPACITY"] = "3"
+
+import librosa
+import numpy as np
+import soundfile as sf
 import torch
 import torch.utils.data
-import numpy as np
-import librosa
 from librosa.filters import mel as librosa_mel_fn
-import soundfile as sf
+
+os.environ["LRU_CACHE_CAPACITY"] = "3"

 def load_wav_to_torch(full_path, target_sr=None, return_empty_on_exception=False):
    sampling_rate = None
--- a/vdecoder/hifigan/utils.py
+++ b/vdecoder/hifigan/utils.py
@ -1,9 +1,10 @@
 import glob
 import os
-import torch
-from torch.nn.utils import weight_norm
+
 # matplotlib.use("Agg")
 import matplotlib.pylab as plt
+import torch
+from torch.nn.utils import weight_norm


 def plot_spectrogram(spectrogram):
--- a/vdecoder/hifiganwithsnake/alias/init.py
+++ b/vdecoder/hifiganwithsnake/alias/init.py
@ -1,6 +1,6 @@
 # Adapted from https://github.com/junjun3518/alias-free-torch under the Apache License 2.0
 #   LICENSE is in incl_licenses directory.

+from .act import *
 from .filter import *
 from .resample import *
-from .act import *
--- a/vdecoder/hifiganwithsnake/alias/act.py
+++ b/vdecoder/hifiganwithsnake/alias/act.py
@ -4,10 +4,10 @@
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
-
-from torch import sin, pow
+from torch import pow, sin
 from torch.nn import Parameter
-from .resample import UpSample1d, DownSample1d
+
+from .resample import DownSample1d, UpSample1d


 class Activation1d(nn.Module):
--- a/vdecoder/hifiganwithsnake/alias/filter.py
+++ b/vdecoder/hifiganwithsnake/alias/filter.py
@ -1,10 +1,11 @@
 # Adapted from https://github.com/junjun3518/alias-free-torch under the Apache License 2.0
 #   LICENSE is in incl_licenses directory.

+import math
+
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
-import math

 if 'sinc' in dir(torch):
    sinc = torch.sinc
--- a/vdecoder/hifiganwithsnake/alias/resample.py
+++ b/vdecoder/hifiganwithsnake/alias/resample.py
@ -3,8 +3,8 @@

 import torch.nn as nn
 from torch.nn import functional as F
-from .filter import LowPassFilter1d
-from .filter import kaiser_sinc_filter1d
+
+from .filter import LowPassFilter1d, kaiser_sinc_filter1d


 class UpSample1d(nn.Module):
--- a/vdecoder/hifiganwithsnake/models.py
+++ b/vdecoder/hifiganwithsnake/models.py
@ -1,15 +1,18 @@
-import os
 import json
-from .env import AttrDict
+import os
+
 import numpy as np
 import torch
-import torch.nn.functional as F
 import torch.nn as nn
-from torch.nn import Conv1d, ConvTranspose1d, AvgPool1d, Conv2d
-from torch.nn.utils import weight_norm, remove_weight_norm, spectral_norm
-from .utils import init_weights, get_padding
+import torch.nn.functional as F
+from torch.nn import AvgPool1d, Conv1d, Conv2d, ConvTranspose1d
+from torch.nn.utils import remove_weight_norm, spectral_norm, weight_norm
+
 from vdecoder.hifiganwithsnake.alias.act import SnakeAlias

+from .env import AttrDict
+from .utils import get_padding, init_weights
+
 LRELU_SLOPE = 0.1


--- a/vdecoder/hifiganwithsnake/nvSTFT.py
+++ b/vdecoder/hifiganwithsnake/nvSTFT.py
@ -1,11 +1,13 @@
 import os
-os.environ["LRU_CACHE_CAPACITY"] = "3"
+
+import librosa
+import numpy as np
+import soundfile as sf
 import torch
 import torch.utils.data
-import numpy as np
-import librosa
 from librosa.filters import mel as librosa_mel_fn
-import soundfile as sf
+
+os.environ["LRU_CACHE_CAPACITY"] = "3"

 def load_wav_to_torch(full_path, target_sr=None, return_empty_on_exception=False):
    sampling_rate = None
--- a/vdecoder/hifiganwithsnake/utils.py
+++ b/vdecoder/hifiganwithsnake/utils.py
@ -1,9 +1,10 @@
 import glob
 import os
-import torch
-from torch.nn.utils import weight_norm
+
 # matplotlib.use("Agg")
 import matplotlib.pylab as plt
+import torch
+from torch.nn.utils import weight_norm


 def plot_spectrogram(spectrogram):
--- a/vdecoder/nsf_hifigan/models.py
+++ b/vdecoder/nsf_hifigan/models.py
@ -1,13 +1,15 @@
-import os
 import json
-from .env import AttrDict
+import os
+
 import numpy as np
 import torch
-import torch.nn.functional as F
 import torch.nn as nn
-from torch.nn import Conv1d, ConvTranspose1d, AvgPool1d, Conv2d
-from torch.nn.utils import weight_norm, remove_weight_norm, spectral_norm
-from .utils import init_weights, get_padding
+import torch.nn.functional as F
+from torch.nn import AvgPool1d, Conv1d, Conv2d, ConvTranspose1d
+from torch.nn.utils import remove_weight_norm, spectral_norm, weight_norm
+
+from .env import AttrDict
+from .utils import get_padding, init_weights

 LRELU_SLOPE = 0.1

--- a/vdecoder/nsf_hifigan/nvSTFT.py
+++ b/vdecoder/nsf_hifigan/nvSTFT.py
@ -1,12 +1,14 @@
 import os
-os.environ["LRU_CACHE_CAPACITY"] = "3"
-import torch
-import torch.utils.data
-import numpy as np
+
 import librosa
-from librosa.filters import mel as librosa_mel_fn
+import numpy as np
 import soundfile as sf
+import torch
 import torch.nn.functional as F
+import torch.utils.data
+from librosa.filters import mel as librosa_mel_fn
+
+os.environ["LRU_CACHE_CAPACITY"] = "3"

 def load_wav_to_torch(full_path, target_sr=None, return_empty_on_exception=False):
    sampling_rate = None
--- a/vdecoder/nsf_hifigan/utils.py
+++ b/vdecoder/nsf_hifigan/utils.py
@ -1,10 +1,12 @@
 import glob
 import os
+
 import matplotlib
+import matplotlib.pylab as plt
 import torch
 from torch.nn.utils import weight_norm
+
 matplotlib.use("Agg")
-import matplotlib.pylab as plt


 def plot_spectrogram(spectrogram):
--- a/vencoder/CNHubertLarge.py
+++ b/vencoder/CNHubertLarge.py
@ -1,7 +1,8 @@
-from vencoder.encoder import SpeechEncoder
 import torch
 from fairseq import checkpoint_utils

+from vencoder.encoder import SpeechEncoder
+

 class CNHubertLarge(SpeechEncoder):
    def __init__(self, vec_path="pretrain/chinese-hubert-large-fairseq-ckpt.pt", device=None):
--- a/vencoder/ContentVec256L12_Onnx.py
+++ b/vencoder/ContentVec256L12_Onnx.py
@ -1,7 +1,8 @@
-from vencoder.encoder import SpeechEncoder
 import onnxruntime
 import torch

+from vencoder.encoder import SpeechEncoder
+

 class ContentVec256L12_Onnx(SpeechEncoder):
    def __init__(self, vec_path="pretrain/vec-256-layer-12.onnx", device=None):
--- a/vencoder/ContentVec256L9.py
+++ b/vencoder/ContentVec256L9.py
@ -1,7 +1,8 @@
-from vencoder.encoder import SpeechEncoder
 import torch
 from fairseq import checkpoint_utils

+from vencoder.encoder import SpeechEncoder
+

 class ContentVec256L9(SpeechEncoder):
    def __init__(self, vec_path="pretrain/checkpoint_best_legacy_500.pt", device=None):
--- a/vencoder/ContentVec256L9_Onnx.py
+++ b/vencoder/ContentVec256L9_Onnx.py
@ -1,7 +1,9 @@
-from vencoder.encoder import SpeechEncoder
 import onnxruntime
 import torch

+from vencoder.encoder import SpeechEncoder
+
+
 class ContentVec256L9_Onnx(SpeechEncoder):
    def __init__(self, vec_path="pretrain/vec-256-layer-9.onnx", device=None):
        super().__init__()
--- a/vencoder/ContentVec768L12.py
+++ b/vencoder/ContentVec768L12.py
@ -1,7 +1,8 @@
-from vencoder.encoder import SpeechEncoder
 import torch
 from fairseq import checkpoint_utils

+from vencoder.encoder import SpeechEncoder
+

 class ContentVec768L12(SpeechEncoder):
    def __init__(self, vec_path="pretrain/checkpoint_best_legacy_500.pt", device=None):
--- a/vencoder/ContentVec768L12_Onnx.py
+++ b/vencoder/ContentVec768L12_Onnx.py
@ -1,7 +1,8 @@
-from vencoder.encoder import SpeechEncoder
 import onnxruntime
 import torch

+from vencoder.encoder import SpeechEncoder
+

 class ContentVec768L12_Onnx(SpeechEncoder):
    def __init__(self, vec_path="pretrain/vec-768-layer-12.onnx", device=None):
--- a/vencoder/ContentVec768L9_Onnx.py
+++ b/vencoder/ContentVec768L9_Onnx.py
@ -1,7 +1,8 @@
-from vencoder.encoder import SpeechEncoder
 import onnxruntime
 import torch

+from vencoder.encoder import SpeechEncoder
+

 class ContentVec768L9_Onnx(SpeechEncoder):
    def __init__(self,vec_path = "pretrain/vec-768-layer-9.onnx",device=None):
--- a/vencoder/DPHubert.py
+++ b/vencoder/DPHubert.py
@ -1,6 +1,7 @@
-from vencoder.encoder import SpeechEncoder
 import torch
+
 from vencoder.dphubert.model import wav2vec2_model
+from vencoder.encoder import SpeechEncoder


 class DPHubert(SpeechEncoder):
--- a/vencoder/HubertSoft.py
+++ b/vencoder/HubertSoft.py
@ -1,5 +1,6 @@
-from vencoder.encoder import SpeechEncoder
 import torch
+
+from vencoder.encoder import SpeechEncoder
 from vencoder.hubert import hubert_model


--- a/vencoder/HubertSoft_Onnx.py
+++ b/vencoder/HubertSoft_Onnx.py
@ -1,7 +1,8 @@
-from vencoder.encoder import SpeechEncoder
 import onnxruntime
 import torch

+from vencoder.encoder import SpeechEncoder
+

 class HubertSoft_Onnx(SpeechEncoder):
    def __init__(self, vec_path="pretrain/hubert-soft.onnx", device=None):
--- a/vencoder/WavLMBasePlus.py
+++ b/vencoder/WavLMBasePlus.py
@ -1,5 +1,6 @@
-from vencoder.encoder import SpeechEncoder
 import torch
+
+from vencoder.encoder import SpeechEncoder
 from vencoder.wavlm.WavLM import WavLM, WavLMConfig


--- a/vencoder/WhisperPPG.py
+++ b/vencoder/WhisperPPG.py
@ -1,8 +1,8 @@
-from vencoder.encoder import SpeechEncoder
 import torch

-from vencoder.whisper.model import Whisper, ModelDimensions
-from vencoder.whisper.audio import pad_or_trim, log_mel_spectrogram
+from vencoder.encoder import SpeechEncoder
+from vencoder.whisper.audio import log_mel_spectrogram, pad_or_trim
+from vencoder.whisper.model import ModelDimensions, Whisper


 class WhisperPPG(SpeechEncoder):
--- a/vencoder/WhisperPPGLarge.py
+++ b/vencoder/WhisperPPGLarge.py
@ -1,8 +1,8 @@
-from vencoder.encoder import SpeechEncoder
 import torch

-from vencoder.whisper.model import Whisper, ModelDimensions
-from vencoder.whisper.audio import pad_or_trim, log_mel_spectrogram
+from vencoder.encoder import SpeechEncoder
+from vencoder.whisper.audio import log_mel_spectrogram, pad_or_trim
+from vencoder.whisper.model import ModelDimensions, Whisper


 class WhisperPPGLarge(SpeechEncoder):
--- a/vencoder/dphubert/components.py
+++ b/vencoder/dphubert/components.py
@ -5,19 +5,19 @@ https://github.com/pytorch/audio/blob/main/torchaudio/models/wav2vec2/components

 """

+import math
 from collections import defaultdict
 from typing import List, Optional, Tuple
-import math

 import torch
-from torch import nn, Tensor
+from torch import Tensor, nn
 from torch.nn import Module

 from .hardconcrete import HardConcrete
 from .pruning_utils import (
-    prune_linear_layer,
    prune_conv1d_layer,
    prune_layer_norm,
+    prune_linear_layer,
 )


--- a/vencoder/dphubert/utils/import_huggingface_wavlm.py
+++ b/vencoder/dphubert/utils/import_huggingface_wavlm.py
@ -10,7 +10,7 @@ from typing import Any, Dict

 from torch.nn import Module

-from ..model import wav2vec2_model, Wav2Vec2Model, wavlm_model
+from ..model import Wav2Vec2Model, wav2vec2_model, wavlm_model

 _LG = logging.getLogger(__name__)

--- a/vencoder/wavlm/WavLM.py
+++ b/vencoder/wavlm/WavLM.py
@ -7,26 +7,26 @@
 # https://github.com/pytorch/fairseq
 # --------------------------------------------------------

-import math
 import logging
+import math
 from typing import List, Optional, Tuple

 import numpy as np
-
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
 from torch.nn import LayerNorm
+
 from vencoder.wavlm.modules import (
    Fp32GroupNorm,
    Fp32LayerNorm,
+    GLU_Linear,
    GradMultiply,
    MultiheadAttention,
    SamePad,
-    init_bert_params,
-    get_activation_fn,
    TransposeLast,
-    GLU_Linear,
+    get_activation_fn,
+    init_bert_params,
 )

 logger = logging.getLogger(__name__)
--- a/vencoder/wavlm/modules.py
+++ b/vencoder/wavlm/modules.py
@ -10,10 +10,11 @@
 import math
 import warnings
 from typing import Dict, Optional, Tuple
+
 import torch
+import torch.nn.functional as F
 from torch import Tensor, nn
 from torch.nn import Parameter
-import torch.nn.functional as F


 class TransposeLast(nn.Module):
--- a/vencoder/whisper/audio.py
+++ b/vencoder/whisper/audio.py
@ -5,11 +5,10 @@ import ffmpeg
 import numpy as np
 import torch
 import torch.nn.functional as F
+from librosa.filters import mel as librosa_mel_fn

 from .utils import exact_div

-from librosa.filters import mel as librosa_mel_fn
-
 # hard-coded audio hyperparameters
 SAMPLE_RATE = 16000
 N_FFT = 400
--- a/vencoder/whisper/decoding.py
+++ b/vencoder/whisper/decoding.py
@ -1,5 +1,5 @@
 from dataclasses import dataclass, field
-from typing import Dict, List, Tuple, Iterable, Optional, Sequence, Union, TYPE_CHECKING
+from typing import TYPE_CHECKING, Dict, Iterable, List, Optional, Sequence, Tuple, Union

 import numpy as np
 import torch
--- a/vencoder/whisper/model.py
+++ b/vencoder/whisper/model.py
@ -1,14 +1,13 @@
 from dataclasses import dataclass
-from typing import Dict
-from typing import Iterable, Optional
+from typing import Dict, Iterable, Optional

 import numpy as np
 import torch
 import torch.nn.functional as F
-from torch import Tensor
-from torch import nn
+from torch import Tensor, nn

-from .decoding import detect_language as detect_language_function, decode as decode_function
+from .decoding import decode as decode_function
+from .decoding import detect_language as detect_language_function


@dataclass
--- a/wav_upload.py
+++ b/wav_upload.py
@ -1,7 +1,9 @@
-from google.colab import files
-import shutil
-import os
 import argparse
+import os
+import shutil
+
+from google.colab import files
+
 if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--type", type=str, required=True, help="type of file to upload")
--- a/webUI.py
+++ b/webUI.py
@ -1,4 +1,11 @@
+import json
+import logging
 import os
+import re
+import subprocess
+import time
+import traceback
+from itertools import chain

 # os.system("wget -P cvec/ https://huggingface.co/spaces/innnky/nanami/resolve/main/checkpoint_best_legacy_500.pt")
 import gradio as gr
@ -6,20 +13,12 @@ import gradio.processing_utils as gr_pu
 import librosa
 import numpy as np
 import soundfile
-from inference.infer_tool import Svc
-import logging
-import re
-import json
-
-import subprocess
-from scipy.io import wavfile
-import librosa
 import torch
-import time
-import traceback
-from itertools import chain
-from utils import mix_model
+from scipy.io import wavfile
+
 from compress_model import removeOptimizer
+from inference.infer_tool import Svc
+from utils import mix_model

 logging.getLogger('numba').setLevel(logging.WARNING)
 logging.getLogger('markdown_it').setLevel(logging.WARNING)