雾聪
2024-01-01 bb0475845ca3d1947aca8333c3b57f793d5ee0c9
add introduction of record
2个文件已修改
4 ■■■■ 已修改文件
runtime/docs/SDK_tutorial_online.md 2 ●●●●● 补丁 | 查看 | 原始文档 | blame | 历史
runtime/docs/SDK_tutorial_online_zh.md 2 ●●●●● 补丁 | 查看 | 原始文档 | blame | 历史
runtime/docs/SDK_tutorial_online.md
@@ -88,7 +88,9 @@
--port specifies the deployment port number as 10095.
--mode: `offline` indicates that the inference mode is one-sentence recognition; `online` indicates that the inference mode is real-time speech recognition; `2pass` indicates real-time speech recognition, and offline models are used for error correction at the end of each sentence.
--chunk-size: indicates the latency configuration of the streaming model. [5,10,5] indicates that the current audio is 600ms, with a lookback of 300ms and a lookahead of 300ms.
--record record is 1 means using record, fefault is 0
--wav-path specifies the audio file to be transcribed, and supports file paths.
--audio-fs the sample rate of the audio
--threa-num sets the number of concurrent send threads, with a default value of 1.
--is-ssl sets whether to enable SSL certificate verification, with a default value of 1 for enabling and 0 for disabling.
--hotword: Hotword file path, one line for each hotword(e.g.:阿里巴巴 20)
runtime/docs/SDK_tutorial_online_zh.md
@@ -96,7 +96,9 @@
--mode:`offline`表示推理模式为一句话识别;`online`表示推理模式为实时语音识别;`2pass`表示为实时语音识别,
        并且说话句尾采用离线模型进行纠错。
--chunk-size:表示流式模型latency配置`[5,10,5]`,表示当前音频解码片段为600ms,并且回看300ms,右看300ms。
--record 1表示使用麦克风作为输入,默认为0
--wav-path 需要进行转写的音频文件,支持文件路径
--audio-fs pcm音频采样率
--thread-num 设置并发发送线程数,默认为1
--is-ssl 设置是否开启ssl证书校验,默认1开启,设置为0关闭
--hotword 热词文件,每行一个热词,格式(热词 权重):阿里巴巴 20