python/FunASR-XL.git

			@@ -1,3 +1,5 @@
			([简体中文](./README_zh.md)\|English)

			# Voice Activity Detection

			> Note:
			@@ -22,7 +24,7 @@
			#### [FSMN-VAD-online model](https://modelscope.cn/models/damo/speech_fsmn_vad_zh-cn-16k-common-pytorch/summary)
			```python
			inference_pipeline = pipeline(
			task=Tasks.auto_speech_recognition,
			task=Tasks.voice_activity_detection,
			model='damo/speech_fsmn_vad_zh-cn-16k-common-pytorch',
			)
			import soundfile
			@@ -34,7 +36,7 @@
			speech_chunk = speech[0:chunk_stride]
			rec_result = inference_pipeline(audio_in=speech_chunk, param_dict=param_dict)
			print(rec_result)
			# next chunk, 480ms
			# next chunk, 100ms
			speech_chunk = speech[chunk_stride:chunk_stride+chunk_stride]
			rec_result = inference_pipeline(audio_in=speech_chunk, param_dict=param_dict)
			print(rec_result)
			@@ -97,7 +99,7 @@
			--data_dir "./data/test" \
			--output_dir "./results" \
			--gpu_inference false \
			--njob 1
			--njob 64
			```

			## Finetune with pipeline