嘉渊
2023-05-15 688fb902dd625981060b00788ed70c4c155d2b50
funasr/datasets/large_datasets/utils/tokenize.py
@@ -37,7 +37,7 @@
    vad = -2
    if bpe_tokenizer is not None:
        text = bpe_tokenizer.text2tokens(text)
        text = bpe_tokenizer.text2tokens("".join(text))
    if seg_dict is not None:
        assert isinstance(seg_dict, dict)