Unify how init_std is passed into policy

2024-01-29 18:11:33 +01:00 · 2024-01-29 18:11:33 +01:00 · 6e79fce9ae
commit 6e79fce9ae
parent 5fa351db22
1 changed files with 6 additions and 0 deletions
--- a/metastable_baselines2/common/policies.py
+++ b/metastable_baselines2/common/policies.py
@ -11,6 +11,7 @@ import numpy as np
 import torch as th
 from gymnasium import spaces
 from torch import nn
+import math

 from stable_baselines3.common.distributions import (
    BernoulliDistribution,
@ -514,6 +515,11 @@ class ActorCriticPolicy(BasePolicy):
                "learn_features": False,
            }
            dist_kwargs.update(add_dist_kwargs)
+        if use_pca:
+            add_dist_kwargs = {
+                "init_std": math.exp(self.log_std_init)
+            }
+            dist_kwargs.update(add_dist_kwargs)

        self.use_sde = use_sde
        self.use_pca = use_pca