python/FunASR-XL.git

			@@ -19,7 +19,9 @@
			from funasr.torch_utils.model_summary import model_summary
			from funasr.torch_utils.pytorch_version import pytorch_cudnn_version
			from funasr.torch_utils.set_all_random_seed import set_all_random_seed
			from funasr.utils.nested_dict_action import NestedDictAction
			from funasr.utils.prepare_data import prepare_data
			from funasr.utils.types import int_or_none
			from funasr.utils.types import str2bool
			from funasr.utils.types import str_or_none
			from funasr.utils.yaml_no_alias_safe_dump import yaml_no_alias_safe_dump
			@@ -57,7 +59,7 @@
			)
			parser.add_argument(
			"--dist_world_size",
			default=None,
			default=1,
			help="number of nodes for distributed training",
			)
			parser.add_argument(
			@@ -71,11 +73,31 @@
			help="local rank for distributed training",
			)
			parser.add_argument(
			"--dist_master_addr",
			default=None,
			type=str_or_none,
			help="The master address for distributed training. "
			"This value is used when dist_init_method == 'env://'",
			)
			parser.add_argument(
			"--dist_master_port",
			default=None,
			type=int_or_none,
			help="The master port for distributed training"
			"This value is used when dist_init_method == 'env://'",
			)
			parser.add_argument(
			"--unused_parameters",
			type=str2bool,
			default=False,
			help="Whether to use the find_unused_parameters in "
			"torch.nn.parallel.DistributedDataParallel ",
			)
			parser.add_argument(
			"--gpu_id",
			type=int,
			default=0,
			help="local gpu id.",
			)

			# cudnn related
			@@ -279,10 +301,47 @@
			default=[],
			)
			parser.add_argument(
			"--train_shape_file",
			type=str, action="append",
			default=[],
			)
			parser.add_argument(
			"--valid_shape_file",
			type=str,
			action="append",
			default=[],
			)
			parser.add_argument(
			"--use_preprocessor",
			type=str2bool,
			default=True,
			help="Apply preprocessing to data or not",
			)

			# optimization related
			parser.add_argument(
			"--optim",
			type=lambda x: x.lower(),
			default="adam",
			help="The optimizer type",
			)
			parser.add_argument(
			"--optim_conf",
			action=NestedDictAction,
			default=dict(),
			help="The keyword arguments for optimizer",
			)
			parser.add_argument(
			"--scheduler",
			type=lambda x: str_or_none(x.lower()),
			default=None,
			help="The lr scheduler type",
			)
			parser.add_argument(
			"--scheduler_conf",
			action=NestedDictAction,
			default=dict(),
			help="The keyword arguments for lr scheduler",
			)

			# most task related
			@@ -399,7 +458,8 @@
			torch.backends.cudnn.deterministic = args.cudnn_deterministic

			# ddp init
			args.distributed = args.dist_world_size > 1
			os.environ['CUDA_VISIBLE_DEVICES'] = str(args.gpu_id)
			args.distributed = args.ngpu > 1 or args.dist_world_size > 1
			distributed_option = build_distributed(args)

			# for logging