python/FunASR-XL.git

			@@ -179,7 +179,12 @@
			langs = tuple(LANGUAGES.keys())[: self.num_languages]
			sot_sequence = [sot]
			if self.language is not None:
			sot_sequence.append(sot + 1 + langs.index(self.language))
			if self.language == 'nospeech':
			sot_sequence.append(self.no_speech)
			else:
			sot_sequence.append(sot + 1 + langs.index(self.language))
			# if self.language is not None:
			# sot_sequence.append(sot + 1 + langs.index(self.language))
			if self.task is not None:
			task_token: int = transcribe if self.task == "transcribe" else translate
			sot_sequence.append(task_token)
			@@ -363,8 +368,10 @@


			@lru_cache(maxsize=None)
			def get_encoding(name: str = "gpt2", num_languages: int = 99):
			vocab_path = os.path.join(os.path.dirname(__file__), "assets", f"{name}.tiktoken")
			def get_encoding(name: str = "gpt2", num_languages: int = 99, vocab_path:str=None):
			if vocab_path is None:
			vocab_path = os.path.join(os.path.dirname(__file__), "assets", f"{name}.tiktoken")

			ranks = {
			base64.b64decode(token): int(rank)
			for token, rank in (line.split() for line in open(vocab_path) if line)
			@@ -423,12 +430,15 @@
			language: Optional[str] = None,
			task: Optional[str] = None, # Literal["transcribe", "translate", None]
			encoding_path: Optional[str] = None,
			vocab_path: Optional[str] = None,
			) -> Tokenizer:
			if language is not None:
			language = language.lower()
			if language not in LANGUAGES:
			if language in TO_LANGUAGE_CODE:
			language = TO_LANGUAGE_CODE[language]
			elif language == 'nospeech':
			pass
			else:
			raise ValueError(f"Unsupported language: {language}")

			@@ -443,7 +453,9 @@
			if encoding_path is not None:
			encoding_name = encoding_path

			encoding = get_encoding(name=encoding_name, num_languages=num_languages)

			encoding = get_encoding(name=encoding_name, num_languages=num_languages, vocab_path=vocab_path)


			return Tokenizer(
			encoding=encoding, num_languages=num_languages, language=language, task=task