From 18b1449d1ff06c469e54190508c4f6be05c73d85 Mon Sep 17 00:00:00 2001
From: 夜雨飘零 <yeyupiaoling@foxmail.com>
Date: 星期二, 05 十二月 2023 22:04:14 +0800
Subject: [PATCH] 分角色语音识别支持更多的模型

---
 funasr/bin/diar_inference_launch.py |    9 ++++++---
 1 files changed, 6 insertions(+), 3 deletions(-)

diff --git a/funasr/bin/diar_inference_launch.py b/funasr/bin/diar_inference_launch.py
index d501f68..f5a11b1 100755
--- a/funasr/bin/diar_inference_launch.py
+++ b/funasr/bin/diar_inference_launch.py
@@ -15,7 +15,8 @@
 from typing import Union
 
 import numpy as np
-import soundfile
+# import librosa
+import librosa
 import torch
 from scipy.signal import medfilt
 
@@ -144,7 +145,9 @@
                         # read waveform file
                         example = [load_bytes(x) if isinstance(x, bytes) else x
                                    for x in example]
-                        example = [soundfile.read(x)[0] if isinstance(x, str) else x
+                        # example = [librosa.load(x)[0] if isinstance(x, str) else x
+                        #            for x in example]
+                        example = [librosa.load(x, dtype='float32')[0] if isinstance(x, str) else x
                                    for x in example]
                         # convert torch tensor to numpy array
                         example = [x.numpy() if isinstance(example[0], torch.Tensor) else x
@@ -453,7 +456,7 @@
         help="The batch size for inference",
     )
     group.add_argument(
-        "--diar_smooth_size",
+        "--smooth_size",
         type=int,
         default=121,
         help="The smoothing size for post-processing"

--
Gitblit v1.9.1