python/FunASR-XL.git

			@@ -6,29 +6,23 @@
			from funasr import AutoModel

			model = AutoModel(
			model="iic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch",
			vad_model="iic/speech_fsmn_vad_zh-cn-16k-common-pytorch",
			vad_kwargs={"max_single_segment_time": 60000},
			punc_model="iic/punc_ct-transformer_zh-cn-common-vocab272727-pytorch",
			# spk_model="iic/speech_campplus_sv_zh-cn_16k-common",
			model="/nfs/beinian.lzr/workspace/GPT-4o/Exp/exp6/4m-8gpu/exp6_speech2text_0607_linear_ddp",
			)

			jsonl = (
			"/nfs/beinian.lzr/workspace/GPT-4o/Data/Speech2Text/TestData/aishell1_test_speech2text.jsonl"
			)

			with open(jsonl, "r") as f:
			lines = f.readlines()

			for i, line in enumerate(lines):
			data_dict = json.loads(line.strip())
			data = data_dict["messages"]

			res = model.generate(
			input="https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/test_audio/asr_example_zh.wav",
			input=data,
			cache={},
			)

			print(res)


			""" can not use currently
			from funasr import AutoFrontend

			frontend = AutoFrontend(model="iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch")

			fbanks = frontend(input="https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/test_audio/asr_example_zh.wav", batch_size=2)

			for batch_idx, fbank_dict in enumerate(fbanks):
			res = model.generate(**fbank_dict)
			print(res)
			"""

			@@ -532,7 +532,7 @@
			loss, stats, weight = force_gatherable((loss, stats, batch_size), loss.device)
			return loss, stats, weight

			def data_template(self, data_in):
			def data_template(self, data):
			system, user, assistant = [], [], []
			for i, item in enumerate(data):
			role = item["role"]

	examples/industrial_data_pretraining/llm_asr/demo_speech2text.py	32 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	funasr/models/llm_asr/model.py	2 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史