remove update_ema_freq
This commit is contained in:
parent
e1ef4ca1cf
commit
c0921a1fb5
@ -83,7 +83,6 @@ class PreTrainAgent:
|
||||
# Training params
|
||||
self.n_epochs = cfg.train.n_epochs
|
||||
self.batch_size = cfg.train.batch_size
|
||||
self.update_ema_freq = cfg.train.update_ema_freq
|
||||
self.epoch_start_ema = cfg.train.epoch_start_ema
|
||||
self.val_freq = cfg.train.get("val_freq", 100)
|
||||
|
||||
|
@ -38,8 +38,7 @@ class TrainDiffusionAgent(PreTrainAgent):
|
||||
self.optimizer.zero_grad()
|
||||
|
||||
# update ema
|
||||
if self.epoch % self.update_ema_freq == 0:
|
||||
self.step_ema()
|
||||
self.step_ema()
|
||||
loss_train = np.mean(loss_train_epoch)
|
||||
|
||||
# validate
|
||||
|
@ -46,8 +46,7 @@ class TrainGaussianAgent(PreTrainAgent):
|
||||
self.optimizer.zero_grad()
|
||||
|
||||
# update ema
|
||||
if self.epoch % self.update_ema_freq == 0:
|
||||
self.step_ema()
|
||||
self.step_ema()
|
||||
loss_train = np.mean(loss_train_epoch)
|
||||
ent_train = np.mean(ent_train_epoch)
|
||||
|
||||
|
@ -34,7 +34,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -34,7 +34,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -34,7 +34,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -34,7 +34,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -34,7 +34,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -34,7 +34,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -35,7 +35,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -35,7 +35,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -34,7 +34,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -35,7 +35,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -35,7 +35,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -34,7 +34,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -35,7 +35,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -35,7 +35,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -34,7 +34,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -35,7 +35,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -35,7 +35,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -34,7 +34,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -35,7 +35,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -35,7 +35,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -34,7 +34,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -35,7 +35,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -35,7 +35,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -34,7 +34,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 1
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 100
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 1
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 100
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 1
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 100
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 1
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 100
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 1
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 1
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 1
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 1
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 1
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 1
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 100
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 1
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 100
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -43,7 +43,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -42,7 +42,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -43,7 +43,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -42,7 +42,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -43,7 +43,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-4
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -42,7 +42,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -43,7 +43,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -42,7 +42,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -32,7 +32,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
@ -33,7 +33,6 @@ train:
|
||||
warmup_steps: 100
|
||||
min_lr: 1e-5
|
||||
epoch_start_ema: 20
|
||||
update_ema_freq: 1
|
||||
save_model_freq: 500
|
||||
|
||||
model:
|
||||
|
Loading…
Reference in New Issue
Block a user