README_zh.md
@@ -19,7 +19,7 @@ |<a href="#快速开始"> 快速开始 </a> |<a href="https://alibaba-damo-academy.github.io/FunASR/en/index.html"> 教程文档 </a> |<a href="./docs/model_zoo/modelscope_models.md"> 模型仓库 </a> |<a href="./runtime/readme_cn.md"> 服务部署 </a> |<a href="#服务部署"> 服务部署 </a> |<a href="#联系我们"> 联系我们 </a> </h4> </div> @@ -31,12 +31,12 @@ <a name="最新动态"></a> ## 最新动态 - 20223/10/17: 英文离线文件转写服务一键部署的CPU版本发布,详细信息参阅([一键部署文档](funasr/runtime/docs/SDK_tutorial_en_zh.md)) - 20223/10/17: 英文离线文件转写服务一键部署的CPU版本发布,详细信息参阅([一键部署文档](runtime/readme_cn.html#cpu)) - 2023/10/13: [SlideSpeech](https://slidespeech.github.io/): 一个大规模的多模态音视频语料库,主要是在线会议或者在线课程场景,包含了大量与发言人讲话实时同步的幻灯片。 - 2023.10.10: [Paraformer-long-Spk](https://github.com/alibaba-damo-academy/FunASR/blob/main/egs_modelscope/asr_vad_spk/speech_paraformer-large-vad-punc-spk_asr_nat-zh-cn/demo.py)模型发布,支持在长语音识别的基础上获取每句话的说话人标签。 - 2023.10.07: [FunCodec](https://github.com/alibaba-damo-academy/FunCodec): FunCodec提供开源模型和训练工具,可以用于音频离散编码,以及基于离散编码的语音识别、语音合成等任务。 - 2023.09.01: 中文离线文件转写服务2.0 CPU版本发布,新增ffmpeg、时间戳与热词模型支持,详细信息参阅([一键部署文档](funasr/runtime/docs/SDK_tutorial_zh.md)) - 2023.08.07: 中文实时语音听写服务一键部署的CPU版本发布,详细信息参阅([一键部署文档](funasr/runtime/docs/SDK_tutorial_online_zh.md)) - 2023.09.01: 中文离线文件转写服务2.0 CPU版本发布,新增ffmpeg、时间戳与热词模型支持,详细信息参阅([一键部署文档](runtime/readme_cn.html#id6)) - 2023.08.07: 中文实时语音听写服务一键部署的CPU版本发布,详细信息参阅([一键部署文档](runtime/readme_cn.html#id3)) - 2023.07.17: BAT一种低延迟低内存消耗的RNN-T模型发布,详细信息参阅([BAT](egs/aishell/bat)) - 2023.06.26: ASRU2023 多通道多方会议转录挑战赛2.0完成竞赛结果公布,详细信息参阅([M2MeT2.0](https://alibaba-damo-academy.github.io/FunASR/m2met2_cn/index.html)) @@ -116,7 +116,7 @@ - 中文离线文件转写服务(GPU版本),进行中 - 更多支持中 详细信息可以参阅([服务部署文档](funasr/runtime/readme_cn.md))。 详细信息可以参阅([服务部署文档](runtime/readme_cn.md))。 <a name="社区交流"></a> docs/index.rst
@@ -71,10 +71,10 @@ :maxdepth: 1 :caption: Runtime and Service ./funasr/runtime/readme.md ./funasr/runtime/docs/SDK_tutorial_online.md ./funasr/runtime/docs/SDK_tutorial.md ./funasr/runtime/html5/readme.md ./runtime/readme.md ./runtime/docs/SDK_tutorial_online.md ./runtime/docs/SDK_tutorial.md ./runtime/html5/readme.md docs/runtime
New file @@ -0,0 +1 @@ ../runtime docs/runtime/demo.gifBinary files differ
docs/runtime/export.md
File was deleted docs/runtime/grpc_cpp.md
File was deleted docs/runtime/grpc_python.md
File was deleted docs/runtime/html5.md
File was deleted docs/runtime/img.pngBinary files differ
docs/runtime/libtorch_python.md
File was deleted docs/runtime/onnxruntime_cpp.md
File was deleted docs/runtime/onnxruntime_python.md
File was deleted docs/runtime/websocket_cpp.md
File was deleted docs/runtime/websocket_python.md
File was deleted egs_modelscope/asr/TEMPLATE/README_zh.md
@@ -30,12 +30,10 @@ task=Tasks.auto_speech_recognition, model='damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch', vad_model='damo/speech_fsmn_vad_zh-cn-16k-common-pytorch', #punc_model='damo/punc_ct-transformer_zh-cn-common-vocab272727-pytorch', punc_model='damo/punc_ct-transformer_cn-en-common-vocab471067-large', ) rec_result = inference_pipeline(audio_in='https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/test_audio/vad_example.wav', batch_size_token=5000, batch_size_token_threshold_s=40, max_single_segment_time=6000) rec_result = inference_pipeline(audio_in='./vad_example.wav') print(rec_result) ``` 其中: runtime/docs/images/sdk_roadmap.jpg
runtime/readme_cn.md
@@ -2,8 +2,10 @@ English Version([docs](./readme.md)) FunASR是由达摩院语音实验室开源的一款语音识别基础框架,集成了语音端点检测、语音识别、标点断句等领域的工业级别模型,吸引了众多开发者参与体验和开发。为了解决工业落地的最后一公里,将模型集成到业务中去,我们开发了FunASR runtime-SDK。 SDK 支持以下几种服务部署: FunASR是由阿里巴巴通义-语音实验室开源的一款语音识别基础框架,集成了语音端点检测、语音识别、标点断句等领域的工业级别模型,吸引了众多开发者参与体验和开发。为了解决工业落地的最后一公里,将模型集成到业务中去,我们开发了社区软件包。 支持以下几种服务部署: <img src="docs/images/sdk_roadmap.jpg" width="900"/> - 中文离线文件转写服务(CPU版本),已完成 - 中文流式语音识别服务(CPU版本),已完成