python/FunASR-XL.git

			@@ -6,7 +6,6 @@
			import torch
			import torch.nn as nn
			import torch.nn.functional as F
			from typeguard import check_argument_types

			from funasr.models.base_model import FunASRModel
			from funasr.models.frontend.wav_frontend import WavFrontendMel23
			@@ -70,8 +69,6 @@
			mapping_dict=None,
			**kwargs,
			):
			assert check_argument_types()

			super().__init__()
			self.frontend = frontend
			self.enc = encoder
			@@ -157,12 +154,11 @@

			def estimate_sequential(self,
			speech: torch.Tensor,
			speech_lengths: torch.Tensor,
			n_speakers: int = None,
			shuffle: bool = True,
			threshold: float = 0.5,
			**kwargs):
			speech = [s[:s_len] for s, s_len in zip(speech, speech_lengths)]
			speech_lengths = torch.tensor([len(sph) for sph in speech]).to(torch.int64)
			emb = self.forward_encoder(speech, speech_lengths)
			if shuffle:
			orders = [np.arange(e.shape[0]) for e in emb]