refractoring of projection layer, improved modularization of code

2020-12-11 09:46:35 +01:00 · 2020-12-11 09:46:35 +01:00 · b8f0c91a90
commit b8f0c91a90
parent 768ae14655
3 changed files with 7 additions and 4 deletions
--- a/README.md
+++ b/README.md
@ -31,7 +31,7 @@ Currently we have the following environements:
 |`Rosenbrock{dim}-v0`| Gym interface for Rosenbrock function. `{dim}` is one of 5, 10, 25, 50 or 100. | 


-## INSTALL
+## Install
 1. Clone the repository 
 ```bash 
 git clone git@github.com:ALRhub/alr_envs.git
--- a/alr_envs/init.py
+++ b/alr_envs/init.py
@ -64,7 +64,7 @@ register(
 )

 register(
-    id='ALRReacherSparse-v0',
+    id='ALRReacher7Sparse-v0',
    entry_point='alr_envs.mujoco:ALRReacherEnv',
    max_episode_steps=200,
    kwargs={
--- a/alr_envs/mujoco/alr_reacher.py
+++ b/alr_envs/mujoco/alr_reacher.py
@ -37,11 +37,14 @@ class ALRReacherEnv(mujoco_env.MujocoEnv, utils.EzPickle):

        reward_dist = 0.0
        angular_vel = 0.0
+        reward_balance = 0.0
        if self._steps >= self.steps_before_reward:
            vec = self.get_body_com("fingertip") - self.get_body_com("target")
            reward_dist -= self.reward_weight * np.linalg.norm(vec)
            angular_vel -= np.linalg.norm(self.sim.data.qvel.flat[:self.n_links])
        reward_ctrl = - np.square(a).sum()
+
+        if self.balance:
            reward_balance = - self.balance_weight * np.abs(
                angle_normalize(np.sum(self.sim.data.qpos.flat[:self.n_links]), type="rad"))