hnluo
2023-06-29 c2dee5e3c29eba79e591d9e9caebaef15ea4e56b
docs/m2met2_cn/_build/html/»ùÏß.html
@@ -101,6 +101,7 @@
</ul>
</li>
<li class="toctree-l1"><a class="reference internal" href="%E8%A7%84%E5%88%99.html">竞赛规则</a></li>
<li class="toctree-l1"><a class="reference internal" href="%E6%AF%94%E8%B5%9B%E7%BB%93%E6%9E%9C.html">比赛结果</a></li>
<li class="toctree-l1"><a class="reference internal" href="%E7%BB%84%E5%A7%94%E4%BC%9A.html">组委会</a></li>
<li class="toctree-l1"><a class="reference internal" href="%E8%81%94%E7%B3%BB%E6%96%B9%E5%BC%8F.html">联系方式</a></li>
</ul>
@@ -132,8 +133,8 @@
</section>
<section id="id3">
<h2>快速开始<a class="headerlink" href="#id3" title="此标题的永久链接">¶</a></h2>
<p>首先需要安装FunASR和ModelScope. (<a class="reference external" href="https://alibaba-damo-academy.github.io/FunASR/en/installation.html">installation</a>)<br />
基线系统有训练和测试两个脚本,<code class="docutils literal notranslate"><span class="pre">run.sh</span></code> æ˜¯ç”¨äºŽè®­ç»ƒåŸºçº¿ç³»ç»Ÿå¹¶åœ¨M2MET的验证与测试集上评估的,而 <code class="docutils literal notranslate"><span class="pre">run_m2met_2023_infer.sh</span></code> ç”¨äºŽæ­¤æ¬¡ç«žèµ›é¢„备开放的全新测试集上测试同时生成符合竞赛最终提交格式的文件。
<p>首先需要安装FunASR和ModelScope. (<a class="reference external" href="https://github.com/alibaba-damo-academy/FunASR#installation">installation</a>)<br />
基线系统有训练和测试两个脚本,<code class="docutils literal notranslate"><span class="pre">run.sh</span></code>是用于训练基线系统并在M2MeT的验证与测试集上评估的,而<code class="docutils literal notranslate"><span class="pre">run_m2met_2023_infer.sh</span></code>用于此次竞赛预备开放的全新测试集上测试同时生成符合竞赛最终提交格式的文件。
在运行 <code class="docutils literal notranslate"><span class="pre">run.sh</span></code>前,需要自行下载并解压<a class="reference external" href="http://www.openslr.org/119/">AliMeeting</a>数据集并放置于<code class="docutils literal notranslate"><span class="pre">./dataset</span></code>目录下:</p>
<div class="highlight-shell notranslate"><div class="highlight"><pre><span></span>dataset
<span class="p">|</span>——<span class="w"> </span>Eval_Ali_far
@@ -142,9 +143,10 @@
<span class="p">|</span>——<span class="w"> </span>Test_Ali_near
<span class="p">|</span>——<span class="w"> </span>Train_Ali_far
<span class="p">|</span>——<span class="w"> </span>Train_Ali_near
在运行<span class="w"> </span><span class="sb">`</span>run_m2met_2023_infer.sh<span class="sb">`</span>前,<span class="w"> </span>需要将测试集<span class="sb">`</span>Test_2023_Ali_far<span class="sb">`</span>(仅包含音频,将于6.16发布)放置于<span class="sb">`</span>./dataset<span class="sb">`</span>目录下。然后将主办方提供的<span class="sb">`</span>wav.scp<span class="sb">`</span>,<span class="sb">`</span>wav_raw.scp<span class="sb">`</span>,<span class="sb">`</span>segments<span class="sb">`</span>,<span class="sb">`</span>utt2spk<span class="sb">`</span>和<span class="sb">`</span>spk2utt<span class="sb">`</span>放置于<span class="sb">`</span>./data/Test_2023_Ali_far<span class="sb">`</span>目录下。
<span class="sb">```</span>shell
data/Test_2023_Ali_far
</pre></div>
</div>
<p>在运行<code class="docutils literal notranslate"><span class="pre">run_m2met_2023_infer.sh</span></code>前, éœ€è¦å°†æµ‹è¯•集<code class="docutils literal notranslate"><span class="pre">Test_2023_Ali_far</span></code>(仅包含音频,将于6.16发布)放置于<code class="docutils literal notranslate"><span class="pre">./dataset</span></code>目录下。然后将主办方提供的<code class="docutils literal notranslate"><span class="pre">wav.scp</span></code>,<code class="docutils literal notranslate"><span class="pre">wav_raw.scp</span></code>,<code class="docutils literal notranslate"><span class="pre">segments</span></code>,<code class="docutils literal notranslate"><span class="pre">utt2spk</span></code>和<code class="docutils literal notranslate"><span class="pre">spk2utt</span></code>放置于<code class="docutils literal notranslate"><span class="pre">./data/Test_2023_Ali_far</span></code>目录下。</p>
<div class="highlight-shell notranslate"><div class="highlight"><pre><span></span>data/Test_2023_Ali_far
<span class="p">|</span>——<span class="w"> </span>wav.scp
<span class="p">|</span>——<span class="w"> </span>wav_raw.scp
<span class="p">|</span>——<span class="w"> </span>segments
@@ -156,8 +158,8 @@
</section>
<section id="id4">
<h2>基线结果<a class="headerlink" href="#id4" title="此标题的永久链接">¶</a></h2>
<p>基线系统的结果如表3所示。在训练期间,说话人档案采用了真实说话人嵌入。然而由于在评估过程中缺乏真实说话人标签,因此使用了由额外的谱聚类提供的说话人特征。同时我们还提供了在评估和测试集上使用真实说话人档案的结果,以显示说话人档案准确性的影响。
<img alt="baseline result" src="_images/baseline_result.png" /></p>
<p>基线系统的结果如表3所示。在训练期间,说话人档案采用了真实说话人嵌入。然而由于在评估过程中缺乏真实说话人标签,因此使用了由额外的谱聚类提供的说话人特征。同时我们还提供了在评估和测试集上使用真实说话人档案的结果,以显示说话人档案准确性的影响。</p>
<p><img alt="baseline_result" src="_images/baseline_result.png" /></p>
</section>
</section>