Shi Xian
2024-01-15 ddbc8b5eded1fff6084001d160d46b532020ecb7
funasr/datasets/audio_datasets/datasets.py
@@ -1,15 +1,8 @@
import torch
import json
import torch.distributed as dist
import numpy as np
import kaldiio
import librosa
import torchaudio
import time
import logging
from funasr.utils.load_utils import load_audio_text_image_video, extract_fbank
from funasr.register import tables
from funasr.utils.load_utils import extract_fbank
@tables.register("dataset_classes", "AudioDataset")
class AudioDataset(torch.utils.data.Dataset):
@@ -82,8 +75,6 @@
   
   
   def collator(self, samples: list=None):
      outputs = {}
      for sample in samples:
         for key in sample.keys():