zhifu gao
2023-05-11 ca2edd97ed6542a643402db0d58e7040135fd56f
docs/m2met2_cn/_build/html/»ùÏß.html
@@ -15,7 +15,7 @@
  <link rel="stylesheet" type="text/css" href="_static/css/bootstrap-theme.min.css" />
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  
    <title>基线 &#8212; m2met2  æ–‡æ¡£</title>
    <title>基线 &#8212; å¤šé€šé“多方会议转录挑战2.0</title>
    <link rel="stylesheet" type="text/css" href="_static/pygments.css" />
    <link rel="stylesheet" type="text/css" href="_static/guzzle.css" />
    <script data-url_root="./" id="documentation_options" src="_static/documentation_options.js"></script>
@@ -45,7 +45,7 @@
        <li class="right" >
          <a href="%E8%B5%9B%E9%81%93%E8%AE%BE%E7%BD%AE%E4%B8%8E%E8%AF%84%E4%BC%B0.html" title="赛道设置与评估"
             accesskey="P">上一页</a> |</li>
        <li class="nav-item nav-item-0"><a href="index.html">m2met2  æ–‡æ¡£</a> &#187;</li>
        <li class="nav-item nav-item-0"><a href="index.html">多通道多方会议转录挑战2.0</a> &#187;</li>
        <li class="nav-item nav-item-this"><a href="">基线</a></li> 
      </ul>
    </div>
@@ -56,7 +56,7 @@
      </div>
  <div id="left-column">
    <div class="sphinxsidebar"><a href="
    index.html" class="text-logo">m2met2  æ–‡æ¡£</a>
    index.html" class="text-logo">多通道多方会议转录挑战2.0</a>
<div class="sidebar-block">
  <div class="sidebar-wrapper">
    <div id="main-search">
@@ -132,12 +132,33 @@
</section>
<section id="id3">
<h2>快速开始<a class="headerlink" href="#id3" title="此标题的永久链接">¶</a></h2>
<p>#TODO: fill with the README.md of the baseline</p>
<p>首先需要安装FunASR和ModelScope. (<a class="reference external" href="https://alibaba-damo-academy.github.io/FunASR/en/installation.html">installation</a>)<br />
基线系统有训练和测试两个脚本,<code class="docutils literal notranslate"><span class="pre">run.sh</span></code>是用于训练基线系统并在M2MeT的验证与测试集上评估的,而<code class="docutils literal notranslate"><span class="pre">run_m2met_2023_infer.sh</span></code>用于此次竞赛预备开放的全新测试集上测试同时生成符合竞赛最终提交格式的文件。
在运行 <code class="docutils literal notranslate"><span class="pre">run.sh</span></code>前,需要自行下载并解压<a class="reference external" href="http://www.openslr.org/119/">AliMeeting</a>数据集并放置于<code class="docutils literal notranslate"><span class="pre">./dataset</span></code>目录下:</p>
<div class="highlight-shell notranslate"><div class="highlight"><pre><span></span>dataset
<span class="p">|</span>——<span class="w"> </span>Eval_Ali_far
<span class="p">|</span>——<span class="w"> </span>Eval_Ali_near
<span class="p">|</span>——<span class="w"> </span>Test_Ali_far
<span class="p">|</span>——<span class="w"> </span>Test_Ali_near
<span class="p">|</span>——<span class="w"> </span>Train_Ali_far
<span class="p">|</span>——<span class="w"> </span>Train_Ali_near
</pre></div>
</div>
<p>在运行<code class="docutils literal notranslate"><span class="pre">run_m2met_2023_infer.sh</span></code>前, éœ€è¦å°†æµ‹è¯•集<code class="docutils literal notranslate"><span class="pre">Test_2023_Ali_far</span></code>(仅包含音频,将于6.16发布)放置于<code class="docutils literal notranslate"><span class="pre">./dataset</span></code>目录下。然后将主办方提供的<code class="docutils literal notranslate"><span class="pre">wav.scp</span></code>,<code class="docutils literal notranslate"><span class="pre">wav_raw.scp</span></code>,<code class="docutils literal notranslate"><span class="pre">segments</span></code>,<code class="docutils literal notranslate"><span class="pre">utt2spk</span></code>和<code class="docutils literal notranslate"><span class="pre">spk2utt</span></code>放置于<code class="docutils literal notranslate"><span class="pre">./data/Test_2023_Ali_far</span></code>目录下。</p>
<div class="highlight-shell notranslate"><div class="highlight"><pre><span></span>data/Test_2023_Ali_far
<span class="p">|</span>——<span class="w"> </span>wav.scp
<span class="p">|</span>——<span class="w"> </span>wav_raw.scp
<span class="p">|</span>——<span class="w"> </span>segments
<span class="p">|</span>——<span class="w"> </span>utt2spk
<span class="p">|</span>——<span class="w"> </span>spk2utt
</pre></div>
</div>
<p>更多基线系统详情见<a class="reference external" href="https://github.com/alibaba-damo-academy/FunASR/blob/main/egs/alimeeting/sa-asr/README.md">此处</a></p>
</section>
<section id="id4">
<h2>基线结果<a class="headerlink" href="#id4" title="此标题的永久链接">¶</a></h2>
<p>基线系统的结果如表3所示。在训练期间,说话人档案采用了真实说话人嵌入。然而由于在评估过程中缺乏真实说话人标签,因此使用了由额外的谱聚类提供的说话人特征。同时我们还提供了在评估和测试集上使用真实说话人档案的结果,以显示说话人档案准确性的影响。
<img alt="baseline result" src="_images/baseline_result.png" /></p>
<p>基线系统的结果如表3所示。在训练期间,说话人档案采用了真实说话人嵌入。然而由于在评估过程中缺乏真实说话人标签,因此使用了由额外的谱聚类提供的说话人特征。同时我们还提供了在评估和测试集上使用真实说话人档案的结果,以显示说话人档案准确性的影响。</p>
<p><img alt="baseline_result" src="_images/baseline_result.png" /></p>
</section>
</section>
@@ -171,7 +192,7 @@
        <li class="right" >
          <a href="%E8%B5%9B%E9%81%93%E8%AE%BE%E7%BD%AE%E4%B8%8E%E8%AF%84%E4%BC%B0.html" title="赛道设置与评估"
             >上一页</a> |</li>
        <li class="nav-item nav-item-0"><a href="index.html">m2met2  æ–‡æ¡£</a> &#187;</li>
        <li class="nav-item nav-item-0"><a href="index.html">多通道多方会议转录挑战2.0</a> &#187;</li>
        <li class="nav-item nav-item-this"><a href="">基线</a></li> 
      </ul>
    </div>