egs/wenetspeech/conformer/run.sh
@@ -20,7 +20,7 @@ type=sound scp=wav.scp speed_perturb="0.9 1.0 1.1" stage=2 stage=3 stop_stage=5 # feature configuration @@ -216,7 +216,7 @@ --am_model_name $inference_asr_model \ --mode asr \ --model_name conformer \ --dataset aishell \ --dataset wenetspeech \ --output_dir $exp_dir/exp/$model_dir \ --vocab_size $vocab_size \ --tag $tag