感觉应该从文件读取更合适,因为上面判断了文件存在,且可以读取,如果本身是文本的话,下面也会有逻辑进行处理 (#2452)

Co-authored-by: tiandiweizun <qq1274949542@163.com>
1个文件已修改
3 ■■■■ 已修改文件
funasr/utils/load_utils.py 3 ●●●● 补丁 | 查看 | 原始文档 | blame | 历史
funasr/utils/load_utils.py
@@ -107,7 +107,8 @@
                    data_or_path_or_list
                ).squeeze()  # [n_samples,]
        elif data_type == "text" and tokenizer is not None:
            data_or_path_or_list = tokenizer.encode(data_or_path_or_list)
            with open(data_or_path_or_list, "r") as f:
                data_or_path_or_list = tokenizer.encode(f.read().strip())
        elif data_type == "image":  # undo
            pass
        elif data_type == "video":  # undo