${MODEL_DIR}: ├── README.md └── model_repo_paraformer_large_online ├── cif_search │ ├── 1 │ │ └── model.py │ └── config.pbtxt ├── decoder │ ├── 1 │ │ └── decoder.onnx │ └── config.pbtxt ├── encoder │ ├── 1 │ │ └── model.onnx │ └── config.pbtxt ├── feature_extractor │ ├── 1 │ │ └── model.py │ ├── config.pbtxt │ └── config.yaml ├── lfr_cmvn_pe │ ├── 1 │ │ └── lfr_cmvn_pe.onnx │ ├── am.mvn │ ├── config.pbtxt │ └── export_lfr_cmvn_pe_onnx.py └── streaming_paraformer ├── 1 └── config.pbtxt Follow below instructions to launch triton server
```sh
cd /workspace
tritonserver --model-repository model_repo_paraformer_large_online \
--pinned-memory-pool-byte-size=512000000 \
--cuda-memory-pool-byte-size=0:1024000000
```
| Concurrency | Throughput | Latency_p50 (ms) | Latency_p90 (ms) | Latency_p95 (ms) | Latency_p99 (ms) |
|---|---|---|---|---|---|
| 20 | 309.252 | 56.913 | 76.267 | 85.598 | 138.462 |
| 40 | 391.058 | 97.911 | 145.509 | 150.545 | 185.399 |
| 60 | 426.269 | 138.244 | 185.855 | 201.016 | 236.528 |
| 80 | 431.781 | 170.991 | 227.983 | 252.453 | 412.273 |
| 100 | 473.351 | 206.205 | 262.612 | 288.964 | 463.337 |