From f272eb4ef78e12a1ef4ae451b114f980a2682d51 Mon Sep 17 00:00:00 2001
From: jianganghan <jiangangh@gmail.com>
Date: 星期四, 29 二月 2024 09:35:34 +0800
Subject: [PATCH] Fix two bugs for blank voice (empty speech): (#1403)

---
 funasr/datasets/audio_datasets/preprocessor.py |    4 +++-
 1 files changed, 3 insertions(+), 1 deletions(-)

diff --git a/funasr/datasets/audio_datasets/preprocessor.py b/funasr/datasets/audio_datasets/preprocessor.py
index c2e27bf..ab75140 100644
--- a/funasr/datasets/audio_datasets/preprocessor.py
+++ b/funasr/datasets/audio_datasets/preprocessor.py
@@ -26,8 +26,10 @@
 			return waveform
 		speed = random.choice(self.speed_perturb)
 		if speed != 1.0:
+			if not isinstance(waveform, torch.Tensor):
+				waveform = torch.tensor(waveform)
 			waveform, _ = torchaudio.sox_effects.apply_effects_tensor(
-				torch.tensor(waveform).view(1, -1), fs, [['speed', str(speed)], ['rate', str(fs)]])
+				waveform.view(1, -1), fs, [['speed', str(speed)], ['rate', str(fs)]])
 			waveform = waveform.view(-1)
 			
 		return waveform

--
Gitblit v1.9.1