| | |
| | | # FunASR离线文件转写服务开发指南 |
| | | |
| | | FunASR提供可一键本地或者云端服务器部署的中文离线文件转写服务,内核为FunASR已开源runtime-SDK。FunASR-runtime结合了达摩院语音实验室在Modelscope社区开源的语音端点检测(VAD)、Paraformer-large语音识别(ASR)、标点检测(PUNC) 等相关能力,可以准确、高效的对音频进行高并发转写。 |
| | | (简体中文|[English](SDK_advanced_guide_offline.md)) |
| | | |
| | | FunASR离线文件转写软件包,提供了一款功能强大的语音离线文件转写服务。拥有完整的语音识别链路,结合了语音端点检测、语音识别、标点等模型,可以将几十个小时的长音频与视频识别成带标点的文字,而且支持上百路请求同时进行转写。输出为带标点的文字,含有字级别时间戳,支持ITN与用户自定义热词等。服务端集成有ffmpeg,支持各种音视频格式输入。软件包提供有html、python、c++、java与c#等多种编程语言客户端,用户可以直接使用与进一步开发。 |
| | | |
| | | 本文档为FunASR离线文件转写服务开发指南。如果您想快速体验离线文件转写服务,可参考[快速上手](#快速上手)。 |
| | | |
| | |
| | | |
| | | ### 镜像启动 |
| | | |
| | | 通过下述命令拉取并启动FunASR runtime-SDK的docker镜像: |
| | | 通过下述命令拉取并启动FunASR软件包的docker镜像: |
| | | |
| | | ```shell |
| | | sudo docker pull \ |
| | |
| | | **run_server.sh命令参数介绍** |
| | | ```text |
| | | --download-model-dir 模型下载地址,通过设置model ID从Modelscope下载模型 |
| | | --model-dir modelscope model ID |
| | | --model-dir modelscope model ID 或者 本地模型路径 |
| | | --quantize True为量化ASR模型,False为非量化ASR模型,默认是True |
| | | --vad-dir modelscope model ID |
| | | --vad-dir modelscope model ID 或者 本地模型路径 |
| | | --vad-quant True为量化VAD模型,False为非量化VAD模型,默认是True |
| | | --punc-dir modelscope model ID |
| | | --punc-dir modelscope model ID 或者 本地模型路径 |
| | | --punc-quant True为量化PUNC模型,False为非量化PUNC模型,默认是True |
| | | --lm-dir modelscope model ID |
| | | --itn-dir modelscope model ID |
| | | --lm-dir modelscope model ID 或者 本地模型路径 |
| | | --itn-dir modelscope model ID 或者 本地模型路径 |
| | | --port 服务端监听的端口号,默认为 10095 |
| | | --decoder-thread-num 服务端启动的推理线程数,默认为 8 |
| | | --io-thread-num 服务端启动的IO线程数,默认为 1 |