python/FunASR-XL.git

parent: bd6ed1d7 | 补丁 | 提交 | ignore whitespace

yhliang

2023-04-13 e09d17de6088e3205ad9e3c85ec01b4fa0531587

add m2met2 docs cn version

4个文件已修改

14个文件已添加

	.github/workflows/main.yml	2 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2/Baseline.md	2 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2/Introduction.md	2 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2/index.rst	2 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/Makefile	20 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/conf.py	39 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/images/baseline_result.png	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/images/dataset_detail.png	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/images/meeting_room.png	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/images/sa_asr_arch.png	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/index.rst	28 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/make.bat	35 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/基线.md	12 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/数据集.md	24 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/简介.md	27 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/组委会.md	1 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/规则.md	16 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	docs_m2met2_cn/赛道设置与评估.md	15 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史

 .github/workflows/main.yml

@@ -24,7 +24,7 @@
      - uses: ammaraskar/sphinx-action@master
        with:
          docs-folder: "docs_m2met2/"
          pre-build-command: "pip install jinja2 sphinx_rtd_theme myst_parser"
          pre-build-command: "pip install jinja2 sphinx_rtd_theme myst-parser"

      - name: deploy copy
        if: github.ref == 'refs/heads/main' || github.ref == 'refs/heads/dev_wjm' || github.ref == 'refs/heads/dev_lyh'

 docs_m2met2/Baseline.md

@@ -1,6 +1,6 @@
# Baseline
## Overview
We provide an end-to-end sa-asr baseline conducted on [FunASR](https://github.com/alibaba-damo-academy/FunASR) as a receipe. The model architecture is shown in Figure 3. The SpeakerEncoder is initialized with a pre-trained [speaker verification model](https://modelscope.cn/models/damo/speech_xvector_sv-zh-cn-cnceleb-16k-spk3465-pytorch/summary) from [ModelScope](https://modelscope.cn/home). This speaker verification model is also be used to extract the speaker embedding in the speaker profile. 
We provide an end-to-end sa-asr baseline conducted on [FunASR](https://github.com/alibaba-damo-academy/FunASR) as a receipe. The model architecture is shown in Figure 2. The SpeakerEncoder is initialized with a pre-trained [speaker verification model](https://modelscope.cn/models/damo/speech_xvector_sv-zh-cn-cnceleb-16k-spk3465-pytorch/summary) from [ModelScope](https://modelscope.cn/home). This speaker verification model is also be used to extract the speaker embedding in the speaker profile. 

![model archietecture](images/sa_asr_arch.png)


 docs_m2met2/Introduction.md

@@ -17,7 +17,7 @@

## Guidelines

Potential participants from both academia and industry should send an email to **m2met.alimeeting@gmail.com** to register to the challenge before or by May 5 with the following requirements:
Potential participants from both academia and industry should send an email to **m2met.alimeeting@gmail.com** to register to the challenge before or by May 5, 2023 with the following requirements:


- Email subject: [ASRU2023 M2MeT2.0 Challenge Registration] â Team Name - Participating 

 docs_m2met2/index.rst

@@ -7,7 +7,7 @@
==================================================================================
Building on the success of the M2MeT challenge, we are pleased to announce the M2MeT2.0 challenge as an ASRU2023 Signal Processing Grand Challenge.
To further advance the current multi-talker ASR system to practicality, the M2MeT2.0 challenge proposes the speaker-attribute ASR task with two sub-tracks performing in fixed and open training conditions.
We provide a detailed introduction of the dataset, rules, evaluation methods, and baseline systems to further promote reproducible research in this field.
We provide a detailed introduction of the dataset, rules, baseline systems, and evaluation methods to further promote reproducible research in this field.

.. toctree::
   :maxdepth: 1

 docs_m2met2_cn/Makefile

New file
@@ -0,0 +1,20 @@
# Minimal makefile for Sphinx documentation
#

# You can set these variables from the command line, and also
# from the environment for the first two.
SPHINXOPTS    ?=
SPHINXBUILD   ?= sphinx-build
SOURCEDIR     = .
BUILDDIR      = _build

# Put it first so that "make" without argument is like "make help".
help:
    @$(SPHINXBUILD) -M help "$(SOURCEDIR)" "$(BUILDDIR)" $(SPHINXOPTS) $(O)

.PHONY: help Makefile

# Catch-all target: route all unknown targets to Sphinx using the new
# "make mode" option.  $(O) is meant as a shortcut for $(SPHINXOPTS).
%: Makefile
    @$(SPHINXBUILD) -M $@ "$(SOURCEDIR)" "$(BUILDDIR)" $(SPHINXOPTS) $(O)

 docs_m2met2_cn/conf.py

New file
@@ -0,0 +1,39 @@
# Configuration file for the Sphinx documentation builder.
#
# For the full list of built-in configuration values, see the documentation:
# https://www.sphinx-doc.org/en/master/usage/configuration.html

# -- Project information -----------------------------------------------------
# https://www.sphinx-doc.org/en/master/usage/configuration.html#project-information

project = 'm2met2'
copyright = '2023, Speech Lab, Alibaba Group; Audio, Speech and Language Processing Group, Northwestern Polytechnical University'
author = 'Speech Lab, Alibaba Group; Audio, Speech and Language Processing Group, Northwestern Polytechnical University'

# -- General configuration ---------------------------------------------------
# https://www.sphinx-doc.org/en/master/usage/configuration.html#general-configuration
extensions = [
    'myst_parser',
    'sphinx_rtd_theme',
]

myst_enable_extensions = [
    "colon_fence",
    "deflist",
    "dollarmath",
]

myst_heading_anchors = 2
myst_highlight_code_blocks=True
myst_update_mathjax=False
templates_path = ['_templates']
exclude_patterns = ['_build', 'Thumbs.db', '.DS_Store']

language = 'zh_CN'

# -- Options for HTML output -------------------------------------------------
# https://www.sphinx-doc.org/en/master/usage/configuration.html#options-for-html-output

html_theme = 'sphinx_rtd_theme'
html_static_path = ['_static']


 docs_m2met2_cn/images/baseline_result.png


 docs_m2met2_cn/images/dataset_detail.png


 docs_m2met2_cn/images/meeting_room.png


 docs_m2met2_cn/images/sa_asr_arch.png


 docs_m2met2_cn/index.rst

New file
@@ -0,0 +1,28 @@
.. m2met2 documentation master file, created by
   sphinx-quickstart on Wed Apr 12 17:49:45 2023.
   You can adapt this file completely to your liking, but it should at least
   contain the root `toctree` directive.

ASRU 2023 å¤ééå¤æ¹ä¼è®®è½¬å½ææ 2.0
==================================================================================
å¨ä¸ä¸å±M2METæåä¸¾åçåºç¡ä¸ï¼æä»¬å°å¨ASRU2023ä¸ç»§ç»ä¸¾åM2MET2.0ææèµã
ä¸ºäºå°ç°å¨çå¤è¯´è¯äººè¯é³è¯å«ç³»ç»æ¨åå®ç¨åï¼M2MET2.0ææèµå°å¨è¯´è¯äººç¸å³çäººç©ä¸è¯ä¼°ï¼å¹¶ä¸åæ¶è®¾ç«éå®æ°æ®ä¸ä¸éå®æ°æ®ä¸¤ä¸ªåèµéã
æä»¬å¯¹æ°æ®éãè§åãåºçº¿ç³»ç»åè¯ä¼°æ¹æ³è¿è¡äºè¯¦ç»ä»ç»ï¼ä»¥è¿ä¸æ¥ä¿è¿å¤è¯´è¯äººè¯é³è¯å«é¢åç ç©¶çåå±ã

.. toctree::
   :maxdepth: 1
   :caption: ç®å½:

   ./ç®ä»
   ./æ°æ®é
   ./èµéè®¾ç½®ä¸è¯ä¼°
   ./åºçº¿
   ./è§å
   ./ç»å§ä¼

Indices and tables
==================

* :ref:`genindex`
* :ref:`modindex`
* :ref:`search`

 docs_m2met2_cn/make.bat

New file
@@ -0,0 +1,35 @@
@ECHO OFF



pushd %~dp0



REM Command file for Sphinx documentation



if "%SPHINXBUILD%" == "" (

    set SPHINXBUILD=sphinx-build

)

set SOURCEDIR=.

set BUILDDIR=_build



%SPHINXBUILD% >NUL 2>NUL

if errorlevel 9009 (

    echo.

    echo.The 'sphinx-build' command was not found. Make sure you have Sphinx

    echo.installed, then set the SPHINXBUILD environment variable to point

    echo.to the full path of the 'sphinx-build' executable. Alternatively you

    echo.may add the Sphinx directory to PATH.

    echo.

    echo.If you don't have Sphinx installed, grab it from

    echo.https://www.sphinx-doc.org/

    exit /b 1

)



if "%1" == "" goto help



%SPHINXBUILD% -M %1 %SOURCEDIR% %BUILDDIR% %SPHINXOPTS% %O%

goto end



:help

%SPHINXBUILD% -M help %SOURCEDIR% %BUILDDIR% %SPHINXOPTS% %O%



:end

popd


 docs_m2met2_cn/»ùÏß.md

New file
@@ -0,0 +1,12 @@
# åºçº¿
## åºçº¿æ¦è¿°
æä»¬æä¾ä¸ä¸ªå¨[FunASR](https://github.com/alibaba-damo-academy/FunASR)ä¸å®ç°çç«¯å°ç«¯SA-ASRç³»ç»ä½ä¸ºåºçº¿ãè¯¥æ¨¡åçç»æå¦å¾3æç¤ºãSpeakerEncoderç¨[ModelScope](https://modelscope.cn/home)ä¸é¢åè®ç»å¥½ç[è¯´è¯äººç¡®è®¤æ¨¡å](https://modelscope.cn/models/damo/speech_xvector_sv-zh-cn-cnceleb-16k-spk3465-pytorch/summary)ä½ä¸ºåå§åãè¿ä¸ªè¯´è¯äººç¡®è®¤æ¨¡åä¹è¢«ç¨æ¥æåè¯´è¯äººæ¡£æ¡ä¸çè¯´è¯äººåµå¥ã

![model archietecture](images/sa_asr_arch.png)

## å¿«éå¼å§
#TODO: fill with the README.md of the baseline

## åºçº¿ç»æ
åºçº¿ç³»ç»çç»æå¦è¡¨3æç¤ºãå¨è®ç»æé´ï¼è¯´è¯äººæ¡£æ¡éç¨äºçå®è¯´è¯äººåµå¥ãç¶èç±äºå¨è¯ä¼°è¿ç¨ä¸ç¼ºä¹çå®è¯´è¯äººæ ç¾ï¼å æ¤ä½¿ç¨äºç±é¢å¤çè°±èç±»æä¾çè¯´è¯äººç¹å¾ãåæ¶æä»¬è¿æä¾äºå¨è¯ä¼°åæµè¯éä¸ä½¿ç¨çå®è¯´è¯äººæ¡£æ¡çç»æï¼ä»¥æ¾ç¤ºè¯´è¯äººæ¡£æ¡åç¡®æ§çå½±åã
![baseline result](images/baseline_result.png)

 docs_m2met2_cn/Êý¾Ý¼¯.md

New file
@@ -0,0 +1,24 @@
# æ°æ®é
## æ°æ®éæ¦è¿°
å¨éå®æ°æ®éæ¡ä»¶ä¸ï¼è®ç»æ°æ®éä»éäºä¸ä¸ªå¬å¼çè¯æåºï¼å³AliMeetingãAISHELL-4åCN-Celebãä¸ºäºè¯ä¼°åèµèæäº¤çæ¨¡åçæ§è½ï¼æä»¬å°åå¸ä¸ä¸ªæ°çæµè¯éï¼Test-2023ï¼ç¨äºæååæåãä¸é¢æä»¬å°è¯¦ç»æè¿°AliMeetingæ°æ®éåTest-2023æµè¯éã

## Alimeetingæ°æ®éä»ç»
AliMeetingæ»å±åå«118.75å°æ¶çè¯é³æ°æ®ï¼åæ¬104.75å°æ¶çè®ç»éï¼Trainï¼ã4å°æ¶çéªè¯éï¼Evalï¼å10å°æ¶çæµè¯éï¼Testï¼ãè®ç»éåéªè¯éåå«åå«212åºå8åºä¼è®®ï¼å¶ä¸æ¯åºä¼è®®ç±å¤ä¸ªè¯´è¯äººè¿è¡15å°30åéçè®¨è®ºãè®ç»åéªè¯éä¸åä¸ä¼è®®çæ»äººæ°åå«ä¸º456äººå25äººï¼å¹¶ä¸åä¼çç·å¥³æ¯ä¾äººæ°åè¡¡ã

è¯¥æ°æ®éæ¶éäº13ä¸ªä¸åçä¼è®®å®¤ï¼æç§å¤§å°è§æ ¼åä¸ºå°åãä¸ååå¤§åä¸ç§ï¼æ¿é´é¢ç§¯ä»8å°55å¹³æ¹ç±³ä¸çãä¸åæ¿é´å·æä¸åçå¸å±åå£°å¦ç¹æ§ï¼æ¯ä¸ªæ¿é´çè¯¦ç»åæ°ä¹å°åéç»åä¸èãä¼è®®åºå°çå¢ä½ææç±»ååæ¬æ°´æ³¥ãç»ççãä¼è®®åºå°çå®¶å·åæ¬æ²åãçµè§ãé»æ¿ãé£æãç©ºè°ãæ¤ç©çãå¨å½å¶è¿ç¨ä¸ï¼éº¦åé£éµåæ¾ç½®äºæ¡ä¸ï¼å¤ä¸ªè¯´è¯äººå´åå¨æ¡è¾¹è¿è¡èªç¶å¯¹è¯ãéº¦åé£éµåç¦»è¯´è¯äººè·ç¦»çº¦0.3å°5.0ç±³ä¹é´ãææè¯´è¯äººçæ¯è¯åæ¯æ±è¯ï¼å¹¶ä¸è¯´çé½æ¯æ®éè¯ï¼æ²¡ææµéçå£é³ãå¨ä¼è®®å½å¶æé´å¯è½ä¼äº§çåç§å®¤åçåªé³ï¼åæ¬é®çå£°ãå¼é¨/å³é¨å£°ãé£æå£°ãæ°æ³¡å£°çãææè¯´è¯äººå¨ä¼è®®çå½å¶æé´åä¿æç¸åä½ç½®ï¼ä¸åçèµ°å¨ãè®ç»éåéªè¯éçè¯´è¯äººæ²¡æéå¤ãå¾1å±ç¤ºäºä¸ä¸ªä¼è®®å®¤çå¸å±ä»¥åéº¦åé£çææç»æã

![meeting room](images/meeting_room.png)

æ¯åºä¼è®®çè¯´è¯äººæ°éä»2å°4äººä¸çãåæ¶ä¸ºäºè¦çåç§åå®¹çä¼è®®åºæ¯ï¼æä»¬éæ©äºå¤ç§ä¼è®®ä¸»é¢ï¼åæ¬å»çãæè²ãåä¸ãç»ç»ç®¡çãå·¥ä¸çäº§çä¸ååå®¹çä¾ä¼ãè®ç»éåéªè¯éçå¹³åè¯é³éå çåå«ä¸º42.27\%å34.76\%ãAliMeetingè®ç»éåéªè¯éçè¯¦ç»ä¿¡æ¯è§è¡¨1ãè¡¨2æ¾ç¤ºäºè®ç»éåéªè¯éä¸ä¸ååè¨èäººæ°ä¼è®®çè¯é³éå çåä¼è®®æ°éã

![dataset detail](images/dataset_detail.png)
Test-2023æµè¯éç±20åºä¼è®®ç»æï¼è¿äºä¼è®®æ¯å¨ä¸AliMeetingæ°æ®éç¸åçå£°å¦ç¯å¢ä¸å½å¶çãTest-2023æµè¯éä¸çæ¯ä¸ªä¼è®®ç¯èç±2å°4ä¸ªåä¸èç»æå¹¶ä¸ä¸AliMeetingæµè¯éçéç½®ç¸ä¼¼ã

æä»¬è¿ä½¿ç¨è³æºéº¦åé£è®°å½äºæ¯ä¸ªè¯´è¯äººçè¿åºé³é¢ä¿¡å·ï¼å¹¶ç¡®ä¿åªè½¬å½å¯¹åºè¯´è¯äººèªå·±çè¯é³ãéè¦æ³¨æçæ¯ï¼éº¦åé£éµåè®°å½çè¿åºé³é¢åè³æºéº¦åé£è®°å½çè¿åºé³é¢å¨æ¶é´ä¸æ¯åæ¥çãæ¯åºä¼è®®çææææ¬åä»¥TextGridæ ¼å¼åå¨ï¼åå®¹åæ¬ä¼è®®çæ¶é¿ãè¯´è¯äººä¿¡æ¯ï¼è¯´è¯äººæ°éãè¯´è¯äººIDãæ§å«çï¼ãæ¯ä¸ªè¯´è¯äººççæ®µæ»æ°ãæ¯ä¸ªçæ®µçæ¶é´æ³åè½¬å½åå®¹ã


## è·åæ°æ®
ä»¥ä¸æå°çä¸ä¸ªè®ç»éåå¯ä»¥å¨[OpenSLR](https://openslr.org/resources.php)ä¸è½½. åèµèå¯ä»¥ä½¿ç¨ä¸æ¹é¾æ¥ç´æ¥ä¸è½½. éå¯¹AliMeetingæ°æ®éï¼æ¯èµæä¾çbaselineä¸åå«äºå®æ´çæ°æ®å¤çæµç¨ã
- [AliMeeting](https://openslr.org/119/)
- [AISHELL-4](https://openslr.org/111/)
- [CN-Celeb](https://openslr.org/82/)

 docs_m2met2_cn/¼ò½é.md

New file
@@ -0,0 +1,27 @@
# ç®ä»
## ç«èµä»ç»
è¯é³è¯å«ï¼Automatic Speech Recognitionï¼ãè¯´è¯äººæ¥å¿ï¼Speaker Diarizationï¼çè¯é³å¤çææ¯çææ°åå±æ¿åäºä¼å¤æºè½è¯é³çå¹¿æ³åºç¨ãä¼è®®åºæ¯æ¯è¯é³ææ¯åºç¨ä¸ææä»·å¼ãåæ¶ä¹æ¯æå·æææ§çåºæ¯ä¹ä¸ãå ä¸ºè¿æ ·çåºæ¯åå«äºä¸°å¯çè®²è¯é£æ ¼åå¤æçå£°å¦æ¡ä»¶ï¼éè¦èèå°éå è¯é³ãæ°éæªç¥çè¯´è¯äººãå¤§åä¼è®®å®¤ä¸çè¿åºä¿¡å·ãåªé³åæ··åçææã

ä¸ºäºæ¨å¨ä¼è®®åºæ¯è¯é³è¯å«çåå±ï¼å·²ç»æå¾å¤ç¸å³çææèµï¼å¦ Rich Transcription evaluation å CHIMEï¼Computational Hearing in Multisource Environmentsï¼ ææèµãç¶èä¸åè¯è¨ä¹é´çå·®å¼éå¶äºéè±è¯ä¼è®®è½¬å½çè¿å±ãMISPï¼Multimodal Information Based Speech Processingï¼åM2MeTï¼Multi-Channel Multi-Party Meeting Transcriptionï¼ææèµä¸ºæ¨å¨æ®éè¯ä¼è®®åºæ¯è¯é³è¯å«ååºäºè´¡ç®ãMISPææèµä¾§éäºç¨è§å¬å¤æ¨¡æçæ¹æ³è§£å³æ¥å¸¸å®¶åºç¯å¢ä¸çè¿è·ç¦»å¤éº¦åé£ä¿¡å·å¤çé®é¢ï¼èM2MeTææåä¾§éäºè§£å³ç¦»çº¿ä¼è®®å®¤ä¸ä¼è®®è½¬å½çè¯é³éå é®é¢ã

å¨ä¸ä¸å±M2METæåä¸¾åçåºç¡ä¸ï¼æä»¬å°å¨ASRU2023ä¸ç»§ç»ä¸¾åM2MET2.0ææèµãå¨ä¸ä¸å±M2METææèµä¸ï¼è¯ä¼°ææ æ¯è¯´è¯äººæ å³çï¼æä»¬åªè½å¾å°è¯å«ææ¬ï¼èä¸è½ç¡®å®ç¸åºçè¯´è¯äººã
ä¸ºäºå°ç°å¨çå¤è¯´è¯äººè¯é³è¯å«ç³»ç»æ¨åå®ç¨åï¼M2MET2.0ææèµå°å¨è¯´è¯äººç¸å³çäººç©ä¸è¯ä¼°ï¼å¹¶ä¸åæ¶è®¾ç«éå®æ°æ®ä¸ä¸éå®æ°æ®ä¸¤ä¸ªåèµéã
æä»¬å¯¹æ°æ®éãè§åãåºçº¿ç³»ç»åè¯ä¼°æ¹æ³è¿è¡äºè¯¦ç»ä»ç»ï¼ä»¥è¿ä¸æ¥ä¿è¿å¤è¯´è¯äººè¯é³è¯å«é¢åç ç©¶çåå±ãä¸»åæ¹å°éæ©åä¸åè®ºæå¹¶å°å¶çº³å¥ASRU2023è®ºæéã


## æ¶é´å®æ(AOEæ¶é´)

- $ 2023.5.5: $ åèµèæ³¨åæªæ¢
- $ 2023.6.9: $ æµè¯éæ°æ®åå¸
- $ 2023.6.13: $ æç»ç»ææäº¤æªæ¢
- $ 2023.6.19: $ è¯ä¼°ç»æåæååå¸
- $ 2023.7.3: $ è®ºææäº¤æªæ¢
- $ 2023.7.10: $ æç»çè®ºææäº¤æªæ¢

## ç«èµæ¥å

æ¥èªå¦æ¯çåå·¥ä¸ççææååèµèååºå¨2023å¹´5æ5æ¥åå **m2met.alimeeting@gmail.com** åéé®ä»¶ï¼æç§ä»¥ä¸è¦æ±æ³¨ååå ææèµï¼
- ä¸»é¢: [ICASSP2022 M2MeT2.0 Challenge Registration] â å¢éåï¼è±ææèæ¼é³ï¼- åä¸çåèµéï¼
- æä¾å¢éåç§°ãé¶å±å³ç³»ãåä¸çèµéãå¢ééé¿ä»¥åèç³»äººä¿¡æ¯ï¼å¢éäººæ°ä¸éå®ï¼ï¼

ä¸»åæ¹å°å¨3ä¸ªå·¥ä½æ¥åéè¿çµåé®ä»¶éç¥ç¬¦åæ¡ä»¶çåèµå¢éï¼å¢éå¿é¡»éµå®å°å¨ææç½ç«ä¸åå¸çææè§åã

 docs_m2met2_cn/×éÎ¯»á.md

New file
@@ -0,0 +1 @@
# ç»å§ä¼

 docs_m2met2_cn/¹æÔò.md

New file
@@ -0,0 +1,16 @@
# ç«èµè§å
ææåèµèé½åºéµå®ä»¥ä¸è§å:

- åè®¸å¨åå§è®ç»æ°æ®éä¸è¿è¡æ°æ®å¢å¼ºï¼åæ¬ä½ä¸éäºæ·»å åªå£°ææ··åãéåº¦æ°å¨åé³è°ååã

- ä¸¥æ ¼ç¦æ¢ä»¥ä»»ä½å½¢å¼ä½¿ç¨æµè¯æ°æ®éï¼åæ¬ä½ä¸éäºä½¿ç¨æµè¯æ°æ®éå¾®è°æè®ç»æ¨¡åã

- åè®¸å¤ç³»ç»èåï¼ä½ä¸é¼å±ä½¿ç¨å·æç¸åç»æä»åæ°ä¸åçåç³»ç»èåã
  
- å¦æä¸¤ä¸ªç³»ç»çæµè¯cpCERç¸åï¼åè®¡ç®å¤æåº¦è¾ä½çç³»ç»å°è¢«è®¤å®ä¸ºæ´ä¼ã
  
- å¦æä½¿ç¨å¼ºå¶å¯¹é½æ¨¡åè·å¾äºéå¸§åç±»æ ç¾ï¼åå¿é¡»ä½¿ç¨ç¸åºåèµéåè®¸çæ°æ®å¯¹å¼ºå¶å¯¹é½æ¨¡åè¿è¡è®ç»ã
  
- ç«¯å°ç«¯æ¹æ³ä¸åè®¸ä½¿ç¨æµå±èåè¯è¨æ¨¡åï¼æ¨¡åå¯ä»¥éæ©LASãRNNTåTransformerçï¼ä½æµå±èåè¯è¨æ¨¡åçè®ç»æ°æ®åªè½æ¥èªäºåè®¸çè®ç»æ°æ®éçè½¬å½ææ¬ã
  
- æç»è§£éæå±äºä¸»åæ¹ãå¦éç¹æ®æåµï¼ä¸»åæ¹å°åè°è§£éã

 docs_m2met2_cn/ÈüµÀÉèÖÃÓëÆÀ¹À.md

New file
@@ -0,0 +1,15 @@
# èµéè®¾ç½®ä¸è¯ä¼°
## è¯´è¯äººç¸å³çè¯é³è¯å« (ä¸»èµé)
è¯´è¯äººç¸å³çASRä»»å¡éè¦ä»éå çè¯é³ä¸è¯å«æ¯ä¸ªè¯´è¯äººçè¯é³ï¼å¹¶ä¸ºè¯å«åå®¹åéä¸ä¸ªè¯´è¯äººæ ç¾ãå¨æ¬æ¬¡ç«èµä¸AliMeetingãAishell4åCn-Celebæ°æ®éå¯ä½ä¸ºåéæ°æ®æºãå¨M2MeTææèµä¸ä½¿ç¨çAliMeetingæ°æ®éåå«è®ç»ãè¯ä¼°åæµè¯éï¼å¨M2MET2.0å¯ä»¥å¨è®ç»åè¯ä¼°ä¸ä½¿ç¨ãæ¤å¤ï¼ä¸ä¸ªåå«çº¦10å°æ¶ä¼è®®æ°æ®çæ°çTest-2023éå°æ ¹æ®èµç¨å®æåå¸å¹¶ç¨äºææèµçè¯ååæåãå¼å¾æ³¨æçæ¯ï¼ç»ç»èå°ä¸æä¾è³æºçè¿åºé³é¢ãè½¬å½ä»¥åçå®æ¶é´æ³ãä¸»åæ¹å°ä¸åæä¾æ¯ä¸ªè¯´è¯äººççå®æ¶é´æ³ï¼èæ¯å¨Test-2023éä¸æä¾åå«å¤ä¸ªè¯´è¯äººççæ®µãè¿äºçæ®µå¯ä»¥éè¿ä¸ä¸ªç®åçvadæ¨¡åè·å¾ã

## è¯ä¼°æ¹æ³
ä½¿ç¨ä¸²èæä¼æåºåç¬¦éè¯¯çï¼cpCERï¼ææ æ¥è¯ä¼°è¯´è¯äººç¸å³çASRç³»ç»çåç¡®æ§ãcpCERçè®¡ç®åæ¬ä¸ä¸ªæ¥éª¤ãé¦åï¼å°ä¸åºä¼è®®ä¸æ¯ä¸ªè¯´è¯äººçåèååè®¾è½¬å½ææ¶é´é¡ºåºä¸²èèµ·æ¥ãå¶æ¬¡ï¼è®¡ç®çå®æ ç¾åé¢æµè¾åºä¹é´çåç¬¦éè¯¯çï¼CERï¼ï¼å¹¶å¯¹ææå¯è½çè¯´è¯äººæåç»åéå¤è¿ä¸è¿ç¨ãæåï¼éæ©CERæä½çæåç»åä½ä¸ºè¯¥æ¶æ®µçcpCERãCERæ¯éè¿å°ASRè¾åºè½¬åä¸ºåèææ¬æéçæå¥ï¼Insï¼ãæ¿æ¢ï¼Subï¼åå é¤ï¼Delï¼çåç¬¦æ»æ°é¤ä»¥åèææ¬çåç¬¦æ»æ°å¾å°çãå·ä½æ¥è¯´ï¼CERçè®¡ç®æ¹æ³æ¯ï¼

$$ \text{CER} = \frac {\mathcal N_{\text{Ins}} + \mathcal N_{\text{Sub}} + \mathcal N_{\text{Del}} }{\mathcal N_{\text{Total}}} \times 100\%, $$

å¶ä¸ $\mathcal N_{\text{Ins}}$ , $\mathcal N_{\text{Sub}}$ , $\mathcal N_{\text{Del}}$ æ¯ä¸ç§éè¯¯çåç¬¦æ°, $\mathcal N_{\text{Total}}$ æ¯åç¬¦æ»æ°.
## åèµéè®¾ç½®
### åèµéä¸ (éå®è®ç»æ°æ®):
åä¸èåªè½ä½¿ç¨éå®æ°æ®æå»ºä¸¤ä¸ªç³»ç»ï¼ä¸¥ç¦ä½¿ç¨é¢å¤æ°æ®ãåèµèå¨ç³»ç»æå»ºè¿ç¨ä¸ä»è½ä½¿ç¨AliMeetingãAISHELL-4åCN Celebãåèµèå¯ä»¥ä½¿ç¨[Hugging Face](https://huggingface.co/models)ä»¥å[ModelScope](https://www.modelscope.cn/models)ä¸æä¾çå¼æºé¢è®ç»æ¨¡åï¼å¹¶ä¸éè¦å¨æç»çç³»ç»æè¿°ææ¡£ä¸è¯¦ç»ååºä½¿ç¨çé¢è®ç»æ¨¡ååç§°ä»¥åé¾æ¥ã
### åèµéäº (å¼æ¾è®ç»æ°æ®):
é¤äºéå®æ°æ®å¤ï¼åä¸èå¯ä»¥ä½¿ç¨ä»»ä½å¬å¼å¯ç¨ãç§äººå½å¶åæ¨¡æä»¿ççæ°æ®éãä½æ¯ï¼åä¸èå¿é¡»æ¸æ¥å°ååºä½¿ç¨çæ°æ®ãå¦æä½¿ç¨æ¨¡æä»¿çæ°æ®ï¼è¯·è¯¦ç»æè¿°æ°æ®æ¨¡æçæ¹æ¡ã

			@@ -24,7 +24,7 @@
			- uses: ammaraskar/sphinx-action@master
			with:
			docs-folder: "docs_m2met2/"
			pre-build-command: "pip install jinja2 sphinx_rtd_theme myst_parser"
			pre-build-command: "pip install jinja2 sphinx_rtd_theme myst-parser"

			- name: deploy copy
			if: github.ref == 'refs/heads/main' \|\| github.ref == 'refs/heads/dev_wjm' \|\| github.ref == 'refs/heads/dev_lyh'

			@@ -1,6 +1,6 @@
			# Baseline
			## Overview
			We provide an end-to-end sa-asr baseline conducted on [FunASR](https://github.com/alibaba-damo-academy/FunASR) as a receipe. The model architecture is shown in Figure 3. The SpeakerEncoder is initialized with a pre-trained [speaker verification model](https://modelscope.cn/models/damo/speech_xvector_sv-zh-cn-cnceleb-16k-spk3465-pytorch/summary) from [ModelScope](https://modelscope.cn/home). This speaker verification model is also be used to extract the speaker embedding in the speaker profile.
			We provide an end-to-end sa-asr baseline conducted on [FunASR](https://github.com/alibaba-damo-academy/FunASR) as a receipe. The model architecture is shown in Figure 2. The SpeakerEncoder is initialized with a pre-trained [speaker verification model](https://modelscope.cn/models/damo/speech_xvector_sv-zh-cn-cnceleb-16k-spk3465-pytorch/summary) from [ModelScope](https://modelscope.cn/home). This speaker verification model is also be used to extract the speaker embedding in the speaker profile.

			![model archietecture](images/sa_asr_arch.png)

			@@ -17,7 +17,7 @@

			## Guidelines

			Potential participants from both academia and industry should send an email to m2met.alimeeting@gmail.com to register to the challenge before or by May 5 with the following requirements:
			Potential participants from both academia and industry should send an email to m2met.alimeeting@gmail.com to register to the challenge before or by May 5, 2023 with the following requirements:


			- Email subject: [ASRU2023 M2MeT2.0 Challenge Registration] â Team Name - Participating

			@@ -7,7 +7,7 @@
			==================================================================================
			Building on the success of the M2MeT challenge, we are pleased to announce the M2MeT2.0 challenge as an ASRU2023 Signal Processing Grand Challenge.
			To further advance the current multi-talker ASR system to practicality, the M2MeT2.0 challenge proposes the speaker-attribute ASR task with two sub-tracks performing in fixed and open training conditions.
			We provide a detailed introduction of the dataset, rules, evaluation methods, and baseline systems to further promote reproducible research in this field.
			We provide a detailed introduction of the dataset, rules, baseline systems, and evaluation methods to further promote reproducible research in this field.

			.. toctree::
			:maxdepth: 1

New file
			@@ -0,0 +1,20 @@
			# Minimal makefile for Sphinx documentation
			#

			# You can set these variables from the command line, and also
			# from the environment for the first two.
			SPHINXOPTS ?=
			SPHINXBUILD ?= sphinx-build
			SOURCEDIR = .
			BUILDDIR = _build

			# Put it first so that "make" without argument is like "make help".
			help:
			@$(SPHINXBUILD) -M help "$(SOURCEDIR)" "$(BUILDDIR)" $(SPHINXOPTS) $(O)

			.PHONY: help Makefile

			# Catch-all target: route all unknown targets to Sphinx using the new
			# "make mode" option. $(O) is meant as a shortcut for $(SPHINXOPTS).
			%: Makefile
			@$(SPHINXBUILD) -M $@ "$(SOURCEDIR)" "$(BUILDDIR)" $(SPHINXOPTS) $(O)

New file
			@@ -0,0 +1,39 @@
			# Configuration file for the Sphinx documentation builder.
			#
			# For the full list of built-in configuration values, see the documentation:
			# https://www.sphinx-doc.org/en/master/usage/configuration.html

			# -- Project information -----------------------------------------------------
			# https://www.sphinx-doc.org/en/master/usage/configuration.html#project-information

			project = 'm2met2'
			copyright = '2023, Speech Lab, Alibaba Group; Audio, Speech and Language Processing Group, Northwestern Polytechnical University'
			author = 'Speech Lab, Alibaba Group; Audio, Speech and Language Processing Group, Northwestern Polytechnical University'

			# -- General configuration ---------------------------------------------------
			# https://www.sphinx-doc.org/en/master/usage/configuration.html#general-configuration
			extensions = [
			'myst_parser',
			'sphinx_rtd_theme',
			]

			myst_enable_extensions = [
			"colon_fence",
			"deflist",
			"dollarmath",
			]

			myst_heading_anchors = 2
			myst_highlight_code_blocks=True
			myst_update_mathjax=False
			templates_path = ['_templates']
			exclude_patterns = ['_build', 'Thumbs.db', '.DS_Store']

			language = 'zh_CN'

			# -- Options for HTML output -------------------------------------------------
			# https://www.sphinx-doc.org/en/master/usage/configuration.html#options-for-html-output

			html_theme = 'sphinx_rtd_theme'
			html_static_path = ['_static']

New file
			@@ -0,0 +1,28 @@
			.. m2met2 documentation master file, created by
			sphinx-quickstart on Wed Apr 12 17:49:45 2023.
			You can adapt this file completely to your liking, but it should at least
			contain the root `toctree` directive.

			ASRU 2023 å¤ééå¤æ¹ä¼è®®è½¬å½ææ 2.0
			==================================================================================
			å¨ä¸ä¸å±M2METæåä¸¾åçåºç¡ä¸ï¼æä»¬å°å¨ASRU2023ä¸ç»§ç»ä¸¾åM2MET2.0ææèµã
			ä¸ºäºå°ç°å¨çå¤è¯´è¯äººè¯é³è¯å«ç³»ç»æ¨åå®ç¨åï¼M2MET2.0ææèµå°å¨è¯´è¯äººç¸å³çäººç©ä¸è¯ä¼°ï¼å¹¶ä¸åæ¶è®¾ç«éå®æ°æ®ä¸ä¸éå®æ°æ®ä¸¤ä¸ªåèµéã
			æä»¬å¯¹æ°æ®éãè§åãåºçº¿ç³»ç»åè¯ä¼°æ¹æ³è¿è¡äºè¯¦ç»ä»ç»ï¼ä»¥è¿ä¸æ¥ä¿è¿å¤è¯´è¯äººè¯é³è¯å«é¢åç ç©¶çåå±ã

			.. toctree::
			:maxdepth: 1
			:caption: ç®å½:

			./ç®ä»
			./æ°æ®é
			./èµéè®¾ç½®ä¸è¯ä¼°
			./åºçº¿
			./è§å
			./ç»å§ä¼

			Indices and tables
			==================

			* :ref:`genindex`
			* :ref:`modindex`
			* :ref:`search`

New file
			@@ -0,0 +1,35 @@
			@ECHO OFF

			pushd %~dp0

			REM Command file for Sphinx documentation

			if "%SPHINXBUILD%" == "" (
			set SPHINXBUILD=sphinx-build
			)
			set SOURCEDIR=.
			set BUILDDIR=_build

			%SPHINXBUILD% >NUL 2>NUL
			if errorlevel 9009 (
			echo.
			echo.The 'sphinx-build' command was not found. Make sure you have Sphinx
			echo.installed, then set the SPHINXBUILD environment variable to point
			echo.to the full path of the 'sphinx-build' executable. Alternatively you
			echo.may add the Sphinx directory to PATH.
			echo.
			echo.If you don't have Sphinx installed, grab it from
			echo.https://www.sphinx-doc.org/
			exit /b 1
			)

			if "%1" == "" goto help

			%SPHINXBUILD% -M %1 %SOURCEDIR% %BUILDDIR% %SPHINXOPTS% %O%
			goto end

			:help
			%SPHINXBUILD% -M help %SOURCEDIR% %BUILDDIR% %SPHINXOPTS% %O%

			:end
			popd

New file
			@@ -0,0 +1,12 @@
			# åºçº¿
			## åºçº¿æ¦è¿°
			æä»¬æä¾ä¸ä¸ªå¨[FunASR](https://github.com/alibaba-damo-academy/FunASR)ä¸å®ç°çç«¯å°ç«¯SA-ASRç³»ç»ä½ä¸ºåºçº¿ãè¯¥æ¨¡åçç»æå¦å¾3æç¤ºãSpeakerEncoderç¨[ModelScope](https://modelscope.cn/home)ä¸é¢åè®ç»å¥½ç[è¯´è¯äººç¡®è®¤æ¨¡å](https://modelscope.cn/models/damo/speech_xvector_sv-zh-cn-cnceleb-16k-spk3465-pytorch/summary)ä½ä¸ºåå§åãè¿ä¸ªè¯´è¯äººç¡®è®¤æ¨¡åä¹è¢«ç¨æ¥æåè¯´è¯äººæ¡£æ¡ä¸çè¯´è¯äººåµå¥ã

			![model archietecture](images/sa_asr_arch.png)

			## å¿«éå¼å§
			#TODO: fill with the README.md of the baseline

			## åºçº¿ç»æ
			åºçº¿ç³»ç»çç»æå¦è¡¨3æç¤ºãå¨è®ç»æé´ï¼è¯´è¯äººæ¡£æ¡éç¨äºçå®è¯´è¯äººåµå¥ãç¶èç±äºå¨è¯ä¼°è¿ç¨ä¸ç¼ºä¹çå®è¯´è¯äººæ ç¾ï¼å æ¤ä½¿ç¨äºç±é¢å¤çè°±èç±»æä¾çè¯´è¯äººç¹å¾ãåæ¶æä»¬è¿æä¾äºå¨è¯ä¼°åæµè¯éä¸ä½¿ç¨çå®è¯´è¯äººæ¡£æ¡çç»æï¼ä»¥æ¾ç¤ºè¯´è¯äººæ¡£æ¡åç¡®æ§çå½±åã
			![baseline result](images/baseline_result.png)

New file
			@@ -0,0 +1,24 @@
			# æ°æ®é
			## æ°æ®éæ¦è¿°
			å¨éå®æ°æ®éæ¡ä»¶ä¸ï¼è®ç»æ°æ®éä»éäºä¸ä¸ªå¬å¼çè¯æåºï¼å³AliMeetingãAISHELL-4åCN-Celebãä¸ºäºè¯ä¼°åèµèæäº¤çæ¨¡åçæ§è½ï¼æä»¬å°åå¸ä¸ä¸ªæ°çæµè¯éï¼Test-2023ï¼ç¨äºæååæåãä¸é¢æä»¬å°è¯¦ç»æè¿°AliMeetingæ°æ®éåTest-2023æµè¯éã

			## Alimeetingæ°æ®éä»ç»
			AliMeetingæ»å±åå«118.75å°æ¶çè¯é³æ°æ®ï¼åæ¬104.75å°æ¶çè®ç»éï¼Trainï¼ã4å°æ¶çéªè¯éï¼Evalï¼å10å°æ¶çæµè¯éï¼Testï¼ãè®ç»éåéªè¯éåå«åå«212åºå8åºä¼è®®ï¼å¶ä¸æ¯åºä¼è®®ç±å¤ä¸ªè¯´è¯äººè¿è¡15å°30åéçè®¨è®ºãè®ç»åéªè¯éä¸åä¸ä¼è®®çæ»äººæ°åå«ä¸º456äººå25äººï¼å¹¶ä¸åä¼çç·å¥³æ¯ä¾äººæ°åè¡¡ã

			è¯¥æ°æ®éæ¶éäº13ä¸ªä¸åçä¼è®®å®¤ï¼æç§å¤§å°è§æ ¼åä¸ºå°åãä¸ååå¤§åä¸ç§ï¼æ¿é´é¢ç§¯ä»8å°55å¹³æ¹ç±³ä¸çãä¸åæ¿é´å·æä¸åçå¸å±åå£°å¦ç¹æ§ï¼æ¯ä¸ªæ¿é´çè¯¦ç»åæ°ä¹å°åéç»åä¸èãä¼è®®åºå°çå¢ä½ææç±»ååæ¬æ°´æ³¥ãç»ççãä¼è®®åºå°çå®¶å·åæ¬æ²åãçµè§ãé»æ¿ãé£æãç©ºè°ãæ¤ç©çãå¨å½å¶è¿ç¨ä¸ï¼éº¦åé£éµåæ¾ç½®äºæ¡ä¸ï¼å¤ä¸ªè¯´è¯äººå´åå¨æ¡è¾¹è¿è¡èªç¶å¯¹è¯ãéº¦åé£éµåç¦»è¯´è¯äººè·ç¦»çº¦0.3å°5.0ç±³ä¹é´ãææè¯´è¯äººçæ¯è¯åæ¯æ±è¯ï¼å¹¶ä¸è¯´çé½æ¯æ®éè¯ï¼æ²¡ææµéçå£é³ãå¨ä¼è®®å½å¶æé´å¯è½ä¼äº§çåç§å®¤åçåªé³ï¼åæ¬é®çå£°ãå¼é¨/å³é¨å£°ãé£æå£°ãæ°æ³¡å£°çãææè¯´è¯äººå¨ä¼è®®çå½å¶æé´åä¿æç¸åä½ç½®ï¼ä¸åçèµ°å¨ãè®ç»éåéªè¯éçè¯´è¯äººæ²¡æéå¤ãå¾1å±ç¤ºäºä¸ä¸ªä¼è®®å®¤çå¸å±ä»¥åéº¦åé£çææç»æã

			![meeting room](images/meeting_room.png)

			æ¯åºä¼è®®çè¯´è¯äººæ°éä»2å°4äººä¸çãåæ¶ä¸ºäºè¦çåç§åå®¹çä¼è®®åºæ¯ï¼æä»¬éæ©äºå¤ç§ä¼è®®ä¸»é¢ï¼åæ¬å»çãæè²ãåä¸ãç»ç»ç®¡çãå·¥ä¸çäº§çä¸ååå®¹çä¾ä¼ãè®ç»éåéªè¯éçå¹³åè¯é³éå çåå«ä¸º42.27\%å34.76\%ãAliMeetingè®ç»éåéªè¯éçè¯¦ç»ä¿¡æ¯è§è¡¨1ãè¡¨2æ¾ç¤ºäºè®ç»éåéªè¯éä¸ä¸ååè¨èäººæ°ä¼è®®çè¯é³éå çåä¼è®®æ°éã

			![dataset detail](images/dataset_detail.png)
			Test-2023æµè¯éç±20åºä¼è®®ç»æï¼è¿äºä¼è®®æ¯å¨ä¸AliMeetingæ°æ®éç¸åçå£°å¦ç¯å¢ä¸å½å¶çãTest-2023æµè¯éä¸çæ¯ä¸ªä¼è®®ç¯èç±2å°4ä¸ªåä¸èç»æå¹¶ä¸ä¸AliMeetingæµè¯éçéç½®ç¸ä¼¼ã

			æä»¬è¿ä½¿ç¨è³æºéº¦åé£è®°å½äºæ¯ä¸ªè¯´è¯äººçè¿åºé³é¢ä¿¡å·ï¼å¹¶ç¡®ä¿åªè½¬å½å¯¹åºè¯´è¯äººèªå·±çè¯é³ãéè¦æ³¨æçæ¯ï¼éº¦åé£éµåè®°å½çè¿åºé³é¢åè³æºéº¦åé£è®°å½çè¿åºé³é¢å¨æ¶é´ä¸æ¯åæ¥çãæ¯åºä¼è®®çææææ¬åä»¥TextGridæ ¼å¼åå¨ï¼åå®¹åæ¬ä¼è®®çæ¶é¿ãè¯´è¯äººä¿¡æ¯ï¼è¯´è¯äººæ°éãè¯´è¯äººIDãæ§å«çï¼ãæ¯ä¸ªè¯´è¯äººççæ®µæ»æ°ãæ¯ä¸ªçæ®µçæ¶é´æ³åè½¬å½åå®¹ã


			## è·åæ°æ®
			ä»¥ä¸æå°çä¸ä¸ªè®ç»éåå¯ä»¥å¨[OpenSLR](https://openslr.org/resources.php)ä¸è½½. åèµèå¯ä»¥ä½¿ç¨ä¸æ¹é¾æ¥ç´æ¥ä¸è½½. éå¯¹AliMeetingæ°æ®éï¼æ¯èµæä¾çbaselineä¸åå«äºå®æ´çæ°æ®å¤çæµç¨ã
			- [AliMeeting](https://openslr.org/119/)
			- [AISHELL-4](https://openslr.org/111/)
			- [CN-Celeb](https://openslr.org/82/)

New file
			@@ -0,0 +1,27 @@
			# ç®ä»
			## ç«èµä»ç»
			è¯é³è¯å«ï¼Automatic Speech Recognitionï¼ãè¯´è¯äººæ¥å¿ï¼Speaker Diarizationï¼çè¯é³å¤çææ¯çææ°åå±æ¿åäºä¼å¤æºè½è¯é³çå¹¿æ³åºç¨ãä¼è®®åºæ¯æ¯è¯é³ææ¯åºç¨ä¸ææä»·å¼ãåæ¶ä¹æ¯æå·æææ§çåºæ¯ä¹ä¸ãå ä¸ºè¿æ ·çåºæ¯åå«äºä¸°å¯çè®²è¯é£æ ¼åå¤æçå£°å¦æ¡ä»¶ï¼éè¦èèå°éå è¯é³ãæ°éæªç¥çè¯´è¯äººãå¤§åä¼è®®å®¤ä¸çè¿åºä¿¡å·ãåªé³åæ··åçææã

			ä¸ºäºæ¨å¨ä¼è®®åºæ¯è¯é³è¯å«çåå±ï¼å·²ç»æå¾å¤ç¸å³çææèµï¼å¦ Rich Transcription evaluation å CHIMEï¼Computational Hearing in Multisource Environmentsï¼ ææèµãç¶èä¸åè¯è¨ä¹é´çå·®å¼éå¶äºéè±è¯ä¼è®®è½¬å½çè¿å±ãMISPï¼Multimodal Information Based Speech Processingï¼åM2MeTï¼Multi-Channel Multi-Party Meeting Transcriptionï¼ææèµä¸ºæ¨å¨æ®éè¯ä¼è®®åºæ¯è¯é³è¯å«ååºäºè´¡ç®ãMISPææèµä¾§éäºç¨è§å¬å¤æ¨¡æçæ¹æ³è§£å³æ¥å¸¸å®¶åºç¯å¢ä¸çè¿è·ç¦»å¤éº¦åé£ä¿¡å·å¤çé®é¢ï¼èM2MeTææåä¾§éäºè§£å³ç¦»çº¿ä¼è®®å®¤ä¸ä¼è®®è½¬å½çè¯é³éå é®é¢ã

			å¨ä¸ä¸å±M2METæåä¸¾åçåºç¡ä¸ï¼æä»¬å°å¨ASRU2023ä¸ç»§ç»ä¸¾åM2MET2.0ææèµãå¨ä¸ä¸å±M2METææèµä¸ï¼è¯ä¼°ææ æ¯è¯´è¯äººæ å³çï¼æä»¬åªè½å¾å°è¯å«ææ¬ï¼èä¸è½ç¡®å®ç¸åºçè¯´è¯äººã
			ä¸ºäºå°ç°å¨çå¤è¯´è¯äººè¯é³è¯å«ç³»ç»æ¨åå®ç¨åï¼M2MET2.0ææèµå°å¨è¯´è¯äººç¸å³çäººç©ä¸è¯ä¼°ï¼å¹¶ä¸åæ¶è®¾ç«éå®æ°æ®ä¸ä¸éå®æ°æ®ä¸¤ä¸ªåèµéã
			æä»¬å¯¹æ°æ®éãè§åãåºçº¿ç³»ç»åè¯ä¼°æ¹æ³è¿è¡äºè¯¦ç»ä»ç»ï¼ä»¥è¿ä¸æ¥ä¿è¿å¤è¯´è¯äººè¯é³è¯å«é¢åç ç©¶çåå±ãä¸»åæ¹å°éæ©åä¸åè®ºæå¹¶å°å¶çº³å¥ASRU2023è®ºæéã


			## æ¶é´å®æ(AOEæ¶é´)

			- $ 2023.5.5: $ åèµèæ³¨åæªæ¢
			- $ 2023.6.9: $ æµè¯éæ°æ®åå¸
			- $ 2023.6.13: $ æç»ç»ææäº¤æªæ¢
			- $ 2023.6.19: $ è¯ä¼°ç»æåæååå¸
			- $ 2023.7.3: $ è®ºææäº¤æªæ¢
			- $ 2023.7.10: $ æç»çè®ºææäº¤æªæ¢

			## ç«èµæ¥å

			æ¥èªå¦æ¯çåå·¥ä¸ççææååèµèååºå¨2023å¹´5æ5æ¥åå m2met.alimeeting@gmail.com åéé®ä»¶ï¼æç§ä»¥ä¸è¦æ±æ³¨ååå ææèµï¼
			- ä¸»é¢: [ICASSP2022 M2MeT2.0 Challenge Registration] â å¢éåï¼è±ææèæ¼é³ï¼- åä¸çåèµéï¼
			- æä¾å¢éåç§°ãé¶å±å³ç³»ãåä¸çèµéãå¢ééé¿ä»¥åèç³»äººä¿¡æ¯ï¼å¢éäººæ°ä¸éå®ï¼ï¼

			ä¸»åæ¹å°å¨3ä¸ªå·¥ä½æ¥åéè¿çµåé®ä»¶éç¥ç¬¦åæ¡ä»¶çåèµå¢éï¼å¢éå¿é¡»éµå®å°å¨ææç½ç«ä¸åå¸çææè§åã

New file
			@@ -0,0 +1,16 @@
			# ç«èµè§å
			ææåèµèé½åºéµå®ä»¥ä¸è§å:

			- åè®¸å¨åå§è®ç»æ°æ®éä¸è¿è¡æ°æ®å¢å¼ºï¼åæ¬ä½ä¸éäºæ·»å åªå£°ææ··åãéåº¦æ°å¨åé³è°ååã

			- ä¸¥æ ¼ç¦æ¢ä»¥ä»»ä½å½¢å¼ä½¿ç¨æµè¯æ°æ®éï¼åæ¬ä½ä¸éäºä½¿ç¨æµè¯æ°æ®éå¾®è°æè®ç»æ¨¡åã

			- åè®¸å¤ç³»ç»èåï¼ä½ä¸é¼å±ä½¿ç¨å·æç¸åç»æä»åæ°ä¸åçåç³»ç»èåã

			- å¦æä¸¤ä¸ªç³»ç»çæµè¯cpCERç¸åï¼åè®¡ç®å¤æåº¦è¾ä½çç³»ç»å°è¢«è®¤å®ä¸ºæ´ä¼ã

			- å¦æä½¿ç¨å¼ºå¶å¯¹é½æ¨¡åè·å¾äºéå¸§åç±»æ ç¾ï¼åå¿é¡»ä½¿ç¨ç¸åºåèµéåè®¸çæ°æ®å¯¹å¼ºå¶å¯¹é½æ¨¡åè¿è¡è®ç»ã

			- ç«¯å°ç«¯æ¹æ³ä¸åè®¸ä½¿ç¨æµå±èåè¯è¨æ¨¡åï¼æ¨¡åå¯ä»¥éæ©LASãRNNTåTransformerçï¼ä½æµå±èåè¯è¨æ¨¡åçè®ç»æ°æ®åªè½æ¥èªäºåè®¸çè®ç»æ°æ®éçè½¬å½ææ¬ã

			- æç»è§£éæå±äºä¸»åæ¹ãå¦éç¹æ®æåµï¼ä¸»åæ¹å°åè°è§£éã

New file
			@@ -0,0 +1,15 @@
			# èµéè®¾ç½®ä¸è¯ä¼°
			## è¯´è¯äººç¸å³çè¯é³è¯å« (ä¸»èµé)
			è¯´è¯äººç¸å³çASRä»»å¡éè¦ä»éå çè¯é³ä¸è¯å«æ¯ä¸ªè¯´è¯äººçè¯é³ï¼å¹¶ä¸ºè¯å«åå®¹åéä¸ä¸ªè¯´è¯äººæ ç¾ãå¨æ¬æ¬¡ç«èµä¸AliMeetingãAishell4åCn-Celebæ°æ®éå¯ä½ä¸ºåéæ°æ®æºãå¨M2MeTææèµä¸ä½¿ç¨çAliMeetingæ°æ®éåå«è®ç»ãè¯ä¼°åæµè¯éï¼å¨M2MET2.0å¯ä»¥å¨è®ç»åè¯ä¼°ä¸ä½¿ç¨ãæ¤å¤ï¼ä¸ä¸ªåå«çº¦10å°æ¶ä¼è®®æ°æ®çæ°çTest-2023éå°æ ¹æ®èµç¨å®æåå¸å¹¶ç¨äºææèµçè¯ååæåãå¼å¾æ³¨æçæ¯ï¼ç»ç»èå°ä¸æä¾è³æºçè¿åºé³é¢ãè½¬å½ä»¥åçå®æ¶é´æ³ãä¸»åæ¹å°ä¸åæä¾æ¯ä¸ªè¯´è¯äººççå®æ¶é´æ³ï¼èæ¯å¨Test-2023éä¸æä¾åå«å¤ä¸ªè¯´è¯äººççæ®µãè¿äºçæ®µå¯ä»¥éè¿ä¸ä¸ªç®åçvadæ¨¡åè·å¾ã

			## è¯ä¼°æ¹æ³
			ä½¿ç¨ä¸²èæä¼æåºåç¬¦éè¯¯çï¼cpCERï¼ææ æ¥è¯ä¼°è¯´è¯äººç¸å³çASRç³»ç»çåç¡®æ§ãcpCERçè®¡ç®åæ¬ä¸ä¸ªæ¥éª¤ãé¦åï¼å°ä¸åºä¼è®®ä¸æ¯ä¸ªè¯´è¯äººçåèååè®¾è½¬å½ææ¶é´é¡ºåºä¸²èèµ·æ¥ãå¶æ¬¡ï¼è®¡ç®çå®æ ç¾åé¢æµè¾åºä¹é´çåç¬¦éè¯¯çï¼CERï¼ï¼å¹¶å¯¹ææå¯è½çè¯´è¯äººæåç»åéå¤è¿ä¸è¿ç¨ãæåï¼éæ©CERæä½çæåç»åä½ä¸ºè¯¥æ¶æ®µçcpCERãCERæ¯éè¿å°ASRè¾åºè½¬åä¸ºåèææ¬æéçæå¥ï¼Insï¼ãæ¿æ¢ï¼Subï¼åå é¤ï¼Delï¼çåç¬¦æ»æ°é¤ä»¥åèææ¬çåç¬¦æ»æ°å¾å°çãå·ä½æ¥è¯´ï¼CERçè®¡ç®æ¹æ³æ¯ï¼

			$$ \text{CER} = \frac {\mathcal N_{\text{Ins}} + \mathcal N_{\text{Sub}} + \mathcal N_{\text{Del}} }{\mathcal N_{\text{Total}}} \times 100\%, $$

			å¶ä¸ $\mathcal N_{\text{Ins}}$ , $\mathcal N_{\text{Sub}}$ , $\mathcal N_{\text{Del}}$ æ¯ä¸ç§éè¯¯çåç¬¦æ°, $\mathcal N_{\text{Total}}$ æ¯åç¬¦æ»æ°.
			## åèµéè®¾ç½®
			### åèµéä¸ (éå®è®ç»æ°æ®):
			åä¸èåªè½ä½¿ç¨éå®æ°æ®æå»ºä¸¤ä¸ªç³»ç»ï¼ä¸¥ç¦ä½¿ç¨é¢å¤æ°æ®ãåèµèå¨ç³»ç»æå»ºè¿ç¨ä¸ä»è½ä½¿ç¨AliMeetingãAISHELL-4åCN Celebãåèµèå¯ä»¥ä½¿ç¨[Hugging Face](https://huggingface.co/models)ä»¥å[ModelScope](https://www.modelscope.cn/models)ä¸æä¾çå¼æºé¢è®ç»æ¨¡åï¼å¹¶ä¸éè¦å¨æç»çç³»ç»æè¿°ææ¡£ä¸è¯¦ç»ååºä½¿ç¨çé¢è®ç»æ¨¡ååç§°ä»¥åé¾æ¥ã
			### åèµéäº (å¼æ¾è®ç»æ°æ®):
			é¤äºéå®æ°æ®å¤ï¼åä¸èå¯ä»¥ä½¿ç¨ä»»ä½å¬å¼å¯ç¨ãç§äººå½å¶åæ¨¡æä»¿ççæ°æ®éãä½æ¯ï¼åä¸èå¿é¡»æ¸æ¥å°ååºä½¿ç¨çæ°æ®ãå¦æä½¿ç¨æ¨¡æä»¿çæ°æ®ï¼è¯·è¯¦ç»æè¿°æ°æ®æ¨¡æçæ¹æ¡ã