python/FunASR-XL.git

			@@ -56,7 +56,7 @@
			self.shuffle = shuffle and is_training
			self.drop_last = drop_last

			self.total_size = len(self.dataset)
			# self.total_size = len(self.dataset)
			# self.num_samples = int(math.ceil(self.total_size / self.num_replicas))
			self.epoch = 0
			self.sort_size = sort_size * num_replicas
			@@ -71,10 +71,10 @@
			g = torch.Generator()
			g.manual_seed(self.epoch)
			random.seed(self.epoch)
			indices = torch.randperm(self.total_size, generator=g).tolist()
			indices = torch.randperm(len(self.dataset), generator=g).tolist()
			else:
			indices = list(range(self.total_size))

			indices = list(range(len(self.dataset)))

			# Sort indices by sample length
			sorted_indices = sorted(indices, key=lambda idx: self.dataset.get_source_len(idx))

			@@ -323,8 +323,8 @@
			self.shuffle = shuffle and is_training
			self.drop_last = drop_last

			self.total_size = len(self.dataset)
			# self.num_samples = int(math.ceil(self.total_size / self.num_replicas))
			# self.total_size = len(self.dataset)
			self.num_samples = int(math.ceil(self.total_size / self.num_replicas))
			self.epoch = 0
			self.sort_size = sort_size * num_replicas
			self.max_token_length = kwargs.get("max_token_length", 2048)

	funasr/datasets/audio_datasets/espnet_samplers.py	8 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	funasr/datasets/audio_datasets/samplers.py	4 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史