speech_asr
2023-04-20 eac9f111b502e4581b14dc718731bf7dc1c7d5f6
funasr/datasets/large_datasets/utils/tokenize.py
@@ -37,7 +37,7 @@
    vad = -2
    if bpe_tokenizer is not None:
        text = bpe_tokenizer.text2tokens(text)
        text = bpe_tokenizer.text2tokens("".join(text))
    if seg_dict is not None:
        assert isinstance(seg_dict, dict)