嘉渊
2023-05-16 eb3948b4805f58bf03d364e8a8c37c0ef3a854ca
egs/aishell2/paraformerbert/run.sh
@@ -106,8 +106,6 @@
    utils/text2token.py -s 1 -n 1 --space "" ${feats_dir}/data/${train_set}/text | cut -f 2- -d" " | tr " " "\n" \
        | sort | uniq | grep -a -v -e '^\s*$' | awk '{print $0}' >> ${token_list}
    echo "<unk>" >> ${token_list}
    mkdir -p ${feats_dir}/asr_stats_fbank_zh_char/${train_set}
    mkdir -p ${feats_dir}/asr_stats_fbank_zh_char/${valid_set}
 fi
# Training Stage
@@ -118,7 +116,8 @@
        echo "extract embeddings..."
        local/extract_embeds.sh \
            --bert_model_name ${bert_model_name} \
            --raw_dataset_path ${feats_dir}
            --raw_dataset_path ${feats_dir} \
            --nj $nj
    fi
    mkdir -p ${exp_dir}/exp/${model_dir}
    mkdir -p ${exp_dir}/exp/${model_dir}/log