python/FunASR-XL.git

			@@ -104,7 +104,6 @@

			x = residual + self.dropout(self.src_attn(x, memory, memory_mask))


			return x, tgt_mask, memory, memory_mask, cache

			def forward_chunk(self, tgt, tgt_mask, memory, memory_mask=None, cache=None):
			@@ -152,7 +151,7 @@

			class FsmnDecoderSCAMAOpt(BaseTransformerDecoder):
			"""
			author: Speech Lab, Alibaba Group, China
			Author: Speech Lab of DAMO Academy, Alibaba Group
			SCAMA: Streaming chunk-aware multihead attention for online end-to-end speech recognition
			https://arxiv.org/abs/2006.01713

			@@ -400,7 +399,7 @@
			for i in range(self.att_layer_num):
			decoder = self.decoders[i]
			c = cache[i]
			x, tgt_mask, memory, memory_mask, c_ret = decoder(
			x, tgt_mask, memory, memory_mask, c_ret = decoder.forward_chunk(
			x, tgt_mask, memory, memory_mask, cache=c
			)
			new_cache.append(c_ret)
			@@ -410,13 +409,13 @@
			j = i + self.att_layer_num
			decoder = self.decoders2[i]
			c = cache[j]
			x, tgt_mask, memory, memory_mask, c_ret = decoder(
			x, tgt_mask, memory, memory_mask, c_ret = decoder.forward_chunk(
			x, tgt_mask, memory, memory_mask, cache=c
			)
			new_cache.append(c_ret)

			for decoder in self.decoders3:
			x, tgt_mask, memory, memory_mask, _ = decoder(
			x, tgt_mask, memory, memory_mask, _ = decoder.forward_chunk(
			x, tgt_mask, memory, None, cache=None
			)

			@@ -813,7 +812,7 @@

			class ParaformerSANMDecoder(BaseTransformerDecoder):
			"""
			author: Speech Lab, Alibaba Group, China
			Author: Speech Lab of DAMO Academy, Alibaba Group
			Paraformer: Fast and Accurate Parallel Transformer for Non-autoregressive End-to-End Speech Recognition
			https://arxiv.org/abs/2006.01713
			"""
			@@ -1077,7 +1076,7 @@
			for i in range(self.att_layer_num):
			decoder = self.decoders[i]
			c = cache[i]
			x, tgt_mask, memory, memory_mask, c_ret = decoder(
			x, tgt_mask, memory, memory_mask, c_ret = decoder.forward_chunk(
			x, tgt_mask, memory, None, cache=c
			)
			new_cache.append(c_ret)
			@@ -1087,14 +1086,14 @@
			j = i + self.att_layer_num
			decoder = self.decoders2[i]
			c = cache[j]
			x, tgt_mask, memory, memory_mask, c_ret = decoder(
			x, tgt_mask, memory, memory_mask, c_ret = decoder.forward_chunk(
			x, tgt_mask, memory, None, cache=c
			)
			new_cache.append(c_ret)

			for decoder in self.decoders3:

			x, tgt_mask, memory, memory_mask, _ = decoder(
			x, tgt_mask, memory, memory_mask, _ = decoder.forward_chunk(
			x, tgt_mask, memory, None, cache=None
			)