python/FunASR-XL.git

			@@ -12,7 +12,7 @@
			from funasr.models.specaug.abs_specaug import AbsSpecAug
			from funasr.models.decoder.rnnt_decoder import RNNTDecoder
			from funasr.models.decoder.abs_decoder import AbsDecoder as AbsAttDecoder
			from funasr.models.encoder.conformer_encoder import ConformerChunkEncoder as Encoder
			from funasr.models.encoder.abs_encoder import AbsEncoder
			from funasr.models.joint_net.joint_network import JointNetwork
			from funasr.modules.nets_utils import get_transducer_task_io
			from funasr.layers.abs_normalize import AbsNormalize
			@@ -62,7 +62,7 @@
			frontend: Optional[AbsFrontend],
			specaug: Optional[AbsSpecAug],
			normalize: Optional[AbsNormalize],
			encoder: Encoder,
			encoder: AbsEncoder,
			decoder: RNNTDecoder,
			joint_network: JointNetwork,
			att_decoder: Optional[AbsAttDecoder] = None,
			@@ -286,7 +286,7 @@
			feats, feats_lengths = self.normalize(feats, feats_lengths)

			# 4. Forward encoder
			encoder_out, encoder_out_lens = self.encoder(feats, feats_lengths)
			encoder_out, encoder_out_lens, _ = self.encoder(feats, feats_lengths)

			assert encoder_out.size(0) == speech.size(0), (
			encoder_out.size(),
			@@ -386,7 +386,7 @@

			if not self.training and (self.report_cer or self.report_wer):
			if self.error_calculator is None:
			from espnet2.asr_transducer.error_calculator import ErrorCalculator
			from funasr.modules.e2e_asr_common import ErrorCalculatorTransducer as ErrorCalculator

			self.error_calculator = ErrorCalculator(
			self.decoder,
			@@ -398,7 +398,7 @@
			report_wer=self.report_wer,
			)

			cer_transducer, wer_transducer = self.error_calculator(encoder_out, target)
			cer_transducer, wer_transducer = self.error_calculator(encoder_out, target, t_len)

			return loss_transducer, cer_transducer, wer_transducer

			@@ -515,7 +515,7 @@
			frontend: Optional[AbsFrontend],
			specaug: Optional[AbsSpecAug],
			normalize: Optional[AbsNormalize],
			encoder: Encoder,
			encoder: AbsEncoder,
			decoder: RNNTDecoder,
			joint_network: JointNetwork,
			att_decoder: Optional[AbsAttDecoder] = None,
			@@ -889,6 +889,8 @@

			if not self.training and (self.report_cer or self.report_wer):
			if self.error_calculator is None:
			from funasr.modules.e2e_asr_common import ErrorCalculatorTransducer as ErrorCalculator

			self.error_calculator = ErrorCalculator(
			self.decoder,
			self.joint_network,
			@@ -899,7 +901,7 @@
			report_wer=self.report_wer,
			)

			cer_transducer, wer_transducer = self.error_calculator(encoder_out, target)
			cer_transducer, wer_transducer = self.error_calculator(encoder_out, target, t_len)
			return loss_transducer, cer_transducer, wer_transducer

			return loss_transducer, None, None