From 7e9696f15635a83ff810cc86b79c0932cb4c8a27 Mon Sep 17 00:00:00 2001
From: Djraemon <154407769+Djraemon@users.noreply.github.com>
Date: 星期一, 04 十一月 2024 11:04:52 +0800
Subject: [PATCH] Fix audio format 2.0 (#2186)

---
 funasr/models/sense_voice/model.py |    3 ++-
 1 files changed, 2 insertions(+), 1 deletions(-)

diff --git a/funasr/models/sense_voice/model.py b/funasr/models/sense_voice/model.py
index 25e9faf..ba82091 100644
--- a/funasr/models/sense_voice/model.py
+++ b/funasr/models/sense_voice/model.py
@@ -555,7 +555,8 @@
         ilens: torch.Tensor,
     ):
         """Embed positions in tensor."""
-        masks = sequence_mask(ilens, device=ilens.device)[:, None, :]
+        maxlen = xs_pad.shape[1]
+        masks = sequence_mask(ilens, maxlen = maxlen, device=ilens.device)[:, None, :]
 
         xs_pad *= self.output_size() ** 0.5
 

--
Gitblit v1.9.1