python/FunASR-XL.git

python / FunASR-XL

FUNASR训练

概况
操作记录
提交次数
目录
文档
派生
对比

blame | 历史 | 补丁 | 提交 | 提交对比 | ignore whitespace

SenseVoice对富文本解码的参数 (#1608)

gaochangfeng

2024-04-11 fce4e1d1b48f23cd8332e60afce3df8d6209a6a7

 funasr/tokenizer/char_tokenizer.py

@@ -36,6 +36,7 @@
      self.remove_non_linguistic_symbols = remove_non_linguistic_symbols
      self.split_with_space = split_with_space
      self.seg_dict = None
      seg_dict = seg_dict if seg_dict is not None else kwargs.get("seg_dict_file", None)
      if seg_dict is not None:
         self.seg_dict = load_seg_dict(seg_dict)

			@@ -36,6 +36,7 @@
			self.remove_non_linguistic_symbols = remove_non_linguistic_symbols
			self.split_with_space = split_with_space
			self.seg_dict = None
			seg_dict = seg_dict if seg_dict is not None else kwargs.get("seg_dict_file", None)
			if seg_dict is not None:
			self.seg_dict = load_seg_dict(seg_dict)