游雁
2024-06-24 1596f6f414f6f41da66506debb1dff19fffeb3ec
funasr/tokenizer/korean_cleaner.py
@@ -19,8 +19,7 @@
            "9": "구",
        }
        new_text = "".join(
            number_to_kor[char] if char in number_to_kor.keys() else char
            for char in text
            number_to_kor[char] if char in number_to_kor.keys() else char for char in text
        )
        return new_text
@@ -56,9 +55,7 @@
        }
        new_text = re.sub("[a-z]+", lambda x: str.upper(x.group()), text)
        new_text = "".join(
            upper_alphabet_to_kor[char]
            if char in upper_alphabet_to_kor.keys()
            else char
            upper_alphabet_to_kor[char] if char in upper_alphabet_to_kor.keys() else char
            for char in new_text
        )