From eba1fccfa07665ed9cada19cfab6cd342e03112e Mon Sep 17 00:00:00 2001
From: Shi Xian <40013335+R1ckShi@users.noreply.github.com>
Date: 星期二, 16 一月 2024 11:34:04 +0800
Subject: [PATCH] Merge pull request #1250 from alibaba-damo-academy/funasr1.0

---
 funasr/tokenizer/char_tokenizer.py |   12 +++++++-----
 1 files changed, 7 insertions(+), 5 deletions(-)

diff --git a/funasr/tokenizer/char_tokenizer.py b/funasr/tokenizer/char_tokenizer.py
index 6c9a5a5..0635fd7 100644
--- a/funasr/tokenizer/char_tokenizer.py
+++ b/funasr/tokenizer/char_tokenizer.py
@@ -4,17 +4,19 @@
 from typing import Union
 import warnings
 
+from funasr.tokenizer.abs_tokenizer import BaseTokenizer
+from funasr.register import tables
 
-from funasr.tokenizer.abs_tokenizer import AbsTokenizer
-
-
-class CharTokenizer(AbsTokenizer):
+@tables.register("tokenizer_classes", "CharTokenizer")
+class CharTokenizer(BaseTokenizer):
     def __init__(
         self,
         non_linguistic_symbols: Union[Path, str, Iterable[str]] = None,
         space_symbol: str = "<space>",
         remove_non_linguistic_symbols: bool = False,
+        **kwargs,
     ):
+        super().__init__(**kwargs)
         self.space_symbol = space_symbol
         if non_linguistic_symbols is None:
             self.non_linguistic_symbols = set()
@@ -57,4 +59,4 @@
 
     def tokens2text(self, tokens: Iterable[str]) -> str:
         tokens = [t if t != self.space_symbol else " " for t in tokens]
-        return "".join(tokens)
+        return "".join(tokens)
\ No newline at end of file

--
Gitblit v1.9.1