python/FunASR-XL.git

			@@ -1,6 +1,8 @@
			# FunASR离线文件转写服务开发指南

			FunASR提供可一键本地或者云端服务器部署的中文离线文件转写服务，内核为FunASR已开源runtime-SDK。FunASR-runtime结合了达摩院语音实验室在Modelscope社区开源的语音端点检测(VAD)、Paraformer-large语音识别(ASR)、标点检测(PUNC) 等相关能力，可以准确、高效的对音频进行高并发转写。
			(简体中文\|[English](SDK_advanced_guide_offline.md))

			FunASR离线文件转写软件包，提供了一款功能强大的语音离线文件转写服务。拥有完整的语音识别链路，结合了语音端点检测、语音识别、标点等模型，可以将几十个小时的长音频与视频识别成带标点的文字，而且支持上百路请求同时进行转写。输出为带标点的文字，含有字级别时间戳，支持ITN与用户自定义热词等。服务端集成有ffmpeg，支持各种音视频格式输入。软件包提供有html、python、c++、java与c#等多种编程语言客户端，用户可以直接使用与进一步开发。

			本文档为FunASR离线文件转写服务开发指南。如果您想快速体验离线文件转写服务，可参考[快速上手](#快速上手)。

			@@ -38,7 +40,7 @@

			### 镜像启动

			通过下述命令拉取并启动FunASR runtime-SDK的docker镜像：
			通过下述命令拉取并启动FunASR软件包的docker镜像：

			```shell
			sudo docker pull \
			@@ -164,14 +166,14 @@
			run_server.sh命令参数介绍
			```text
			--download-model-dir 模型下载地址，通过设置model ID从Modelscope下载模型
			--model-dir modelscope model ID
			--model-dir modelscope model ID 或者本地模型路径
			--quantize True为量化ASR模型，False为非量化ASR模型，默认是True
			--vad-dir modelscope model ID
			--vad-dir modelscope model ID 或者本地模型路径
			--vad-quant True为量化VAD模型，False为非量化VAD模型，默认是True
			--punc-dir modelscope model ID
			--punc-dir modelscope model ID 或者本地模型路径
			--punc-quant True为量化PUNC模型，False为非量化PUNC模型，默认是True
			--lm-dir modelscope model ID
			--itn-dir modelscope model ID
			--lm-dir modelscope model ID 或者本地模型路径
			--itn-dir modelscope model ID 或者本地模型路径
			--port 服务端监听的端口号，默认为 10095
			--decoder-thread-num 服务端启动的推理线程数，默认为 8
			--io-thread-num 服务端启动的IO线程数，默认为 1