Shi Xian
2024-06-11 7a9c0414b685b6f2ad7538017e2a1215e1e76901
funasr/auto/auto_model.py
@@ -359,6 +359,7 @@
            results_sorted = []
            if not len(sorted_data):
                results_ret_list.append({"key": key, "text": "", "timestamp": []})
                logging.info("decoding, utt: {}, empty speech".format(key))
                continue
@@ -387,6 +388,7 @@
                ):
                    max_len_in_batch = max(max_len_in_batch, sample_length)
                    end_idx += 1
                    results_sorted.append({'key': 'bad_data', 'text': '', 'timestamp': []})
                    continue
                speech_j, speech_lengths_j = slice_padding_audio_samples(
@@ -416,7 +418,7 @@
                end_idx += 1
                max_len_in_batch = sample_length
                if len(results) < 1:
                    continue
                    results.append({'key': 'bad_data', 'text': '', 'timestamp': []})
                results_sorted.extend(results)
            # end_asr_total = time.time()