雾聪
2024-05-13 31b36c8f65f47b26b0c03ed6694e19b78fe910c8
funasr/datasets/sense_voice_datasets/datasets.py
@@ -112,7 +112,7 @@
            eos = self.tokenizer.encode(self.eos, allowed_special="all")  # [eos]
            ids = prompt_ids + target_ids + eos
            ids = prompt_ids + target_ids + eos  # [sos, task, lid, text, eos]
            ids_lengths = len(ids)
            text = torch.tensor(ids, dtype=torch.int64)