remove update_ema_freq
This commit is contained in:
parent
e1ef4ca1cf
commit
c0921a1fb5
@ -83,7 +83,6 @@ class PreTrainAgent:
|
|||||||
# Training params
|
# Training params
|
||||||
self.n_epochs = cfg.train.n_epochs
|
self.n_epochs = cfg.train.n_epochs
|
||||||
self.batch_size = cfg.train.batch_size
|
self.batch_size = cfg.train.batch_size
|
||||||
self.update_ema_freq = cfg.train.update_ema_freq
|
|
||||||
self.epoch_start_ema = cfg.train.epoch_start_ema
|
self.epoch_start_ema = cfg.train.epoch_start_ema
|
||||||
self.val_freq = cfg.train.get("val_freq", 100)
|
self.val_freq = cfg.train.get("val_freq", 100)
|
||||||
|
|
||||||
|
@ -38,7 +38,6 @@ class TrainDiffusionAgent(PreTrainAgent):
|
|||||||
self.optimizer.zero_grad()
|
self.optimizer.zero_grad()
|
||||||
|
|
||||||
# update ema
|
# update ema
|
||||||
if self.epoch % self.update_ema_freq == 0:
|
|
||||||
self.step_ema()
|
self.step_ema()
|
||||||
loss_train = np.mean(loss_train_epoch)
|
loss_train = np.mean(loss_train_epoch)
|
||||||
|
|
||||||
|
@ -46,7 +46,6 @@ class TrainGaussianAgent(PreTrainAgent):
|
|||||||
self.optimizer.zero_grad()
|
self.optimizer.zero_grad()
|
||||||
|
|
||||||
# update ema
|
# update ema
|
||||||
if self.epoch % self.update_ema_freq == 0:
|
|
||||||
self.step_ema()
|
self.step_ema()
|
||||||
loss_train = np.mean(loss_train_epoch)
|
loss_train = np.mean(loss_train_epoch)
|
||||||
ent_train = np.mean(ent_train_epoch)
|
ent_train = np.mean(ent_train_epoch)
|
||||||
|
@ -34,7 +34,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -34,7 +34,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -34,7 +34,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -34,7 +34,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -34,7 +34,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -34,7 +34,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -35,7 +35,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -35,7 +35,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -34,7 +34,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -35,7 +35,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -35,7 +35,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -34,7 +34,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -35,7 +35,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -35,7 +35,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -34,7 +34,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -35,7 +35,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -35,7 +35,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -34,7 +34,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -35,7 +35,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -35,7 +35,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -34,7 +34,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -35,7 +35,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -35,7 +35,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -34,7 +34,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 1
|
warmup_steps: 1
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 100
|
save_model_freq: 100
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 1
|
warmup_steps: 1
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 100
|
save_model_freq: 100
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 1
|
warmup_steps: 1
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 100
|
save_model_freq: 100
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 1
|
warmup_steps: 1
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 100
|
save_model_freq: 100
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 1
|
warmup_steps: 1
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 1
|
warmup_steps: 1
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 1
|
warmup_steps: 1
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 1
|
warmup_steps: 1
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 1
|
warmup_steps: 1
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 1
|
warmup_steps: 1
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 100
|
save_model_freq: 100
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 1
|
warmup_steps: 1
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 100
|
save_model_freq: 100
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -43,7 +43,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -42,7 +42,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -43,7 +43,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -42,7 +42,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -43,7 +43,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-4
|
min_lr: 1e-4
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -42,7 +42,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -43,7 +43,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -42,7 +42,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -32,7 +32,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
@ -33,7 +33,6 @@ train:
|
|||||||
warmup_steps: 100
|
warmup_steps: 100
|
||||||
min_lr: 1e-5
|
min_lr: 1e-5
|
||||||
epoch_start_ema: 20
|
epoch_start_ema: 20
|
||||||
update_ema_freq: 1
|
|
||||||
save_model_freq: 500
|
save_model_freq: 500
|
||||||
|
|
||||||
model:
|
model:
|
||||||
|
Loading…
Reference in New Issue
Block a user