python/FunASR-XL.git - Gitblit

python / FunASR-XL

FUNASR训练

parent: 4bac5949 | 补丁 | 提交 | ignore whitespace

Merge pull request #391 from alibaba-damo-academy/dev_wjm3

zhifu gao

2023-04-20 f0a909d463bb98fc9908e88fc7674baab917995a

Merge pull request #391 from alibaba-damo-academy/dev_wjm3

fix model save bug

1个文件已修改

funasr/train/trainer.py

10 ●●●●● 补丁 | 查看 | 原始文档 | blame | 历史

 funasr/train/trainer.py

@@ -582,10 +582,16 @@
                if num_batch_updates % batch_interval == 0:
                    if options.use_pai and options.oss_bucket is not None:
                        buffer = BytesIO()
                        torch.save(model.state_dict(), buffer)
                        if hasattr(model, "module"):
                            torch.save(model.module.state_dict(), buffer)
                        else:
                            torch.save(model.state_dict(), buffer)
                        options.oss_bucket.put_object(os.path.join(output_dir, f"{num_batch_updates}step.pb"), buffer.getvalue())
                    else:
                        torch.save(model.state_dict(), os.path.join(output_dir, f"{num_batch_updates}step.pb"))
                        if hasattr(model, "module"):
                            torch.save(model.module.state_dict(), os.path.join(output_dir, f"{num_batch_updates}step.pb"))
                        else:
                            torch.save(model.state_dict(), os.path.join(output_dir, f"{num_batch_updates}step.pb"))

            if distributed:
                torch.distributed.all_reduce(iterator_stop, ReduceOp.SUM)