fancy_gym/alr_envs/alr/__init__.py

import numpy as np
from gym import register

from . import classic_control, mujoco
from .classic_control.hole_reacher.hole_reacher import HoleReacherEnv
from .classic_control.simple_reacher.simple_reacher import SimpleReacherEnv
from .classic_control.viapoint_reacher.viapoint_reacher import ViaPointReacherEnv
from .mujoco.ball_in_a_cup.ball_in_a_cup import ALRBallInACupEnv
from .mujoco.ball_in_a_cup.biac_pd import ALRBallInACupPDEnv
from .mujoco.reacher.alr_reacher import ALRReacherEnv
from .mujoco.reacher.balancing import BalancingEnv

ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS = {"DMP": [], "ProMP": [], "DetPMP": []}

# Classic Control
## Simple Reacher
register(
    id='SimpleReacher-v0',
    entry_point='alr_envs.alr.classic_control:SimpleReacherEnv',
    max_episode_steps=200,
    kwargs={
        "n_links": 2,
    }
)

register(
    id='SimpleReacher-v1',
    entry_point='alr_envs.alr.classic_control:SimpleReacherEnv',
    max_episode_steps=200,
    kwargs={
        "n_links": 2,
        "random_start": False
    }
)

register(
    id='LongSimpleReacher-v0',
    entry_point='alr_envs.alr.classic_control:SimpleReacherEnv',
    max_episode_steps=200,
    kwargs={
        "n_links": 5,
    }
)

register(
    id='LongSimpleReacher-v1',
    entry_point='alr_envs.alr.classic_control:SimpleReacherEnv',
    max_episode_steps=200,
    kwargs={
        "n_links": 5,
        "random_start": False
    }
)

## Viapoint Reacher

register(
    id='ViaPointReacher-v0',
    entry_point='alr_envs.alr.classic_control:ViaPointReacherEnv',
    max_episode_steps=200,
    kwargs={
        "n_links": 5,
        "allow_self_collision": False,
        "collision_penalty": 1000
    }
)

## Hole Reacher
register(
    id='HoleReacher-v0',
    entry_point='alr_envs.alr.classic_control:HoleReacherEnv',
    max_episode_steps=200,
    kwargs={
        "n_links": 5,
        "random_start": True,
        "allow_self_collision": False,
        "allow_wall_collision": False,
        "hole_width": None,
        "hole_depth": 1,
        "hole_x": None,
        "collision_penalty": 100,
    }
)

register(
    id='HoleReacher-v1',
    entry_point='alr_envs.alr.classic_control:HoleReacherEnvOld',
    max_episode_steps=200,
    kwargs={
        "n_links": 5,
        "random_start": False,
        "allow_self_collision": False,
        "allow_wall_collision": False,
        "hole_width": 0.25,
        "hole_depth": 1,
        "hole_x": None,
        "collision_penalty": 100,
    }
)

register(
    id='HoleReacher-v2',
    entry_point='alr_envs.alr.classic_control:HoleReacherEnv',
    max_episode_steps=200,
    kwargs={
        "n_links": 5,
        "random_start": False,
        "allow_self_collision": False,
        "allow_wall_collision": False,
        "hole_width": 0.25,
        "hole_depth": 1,
        "hole_x": 2,
        "collision_penalty": 100,
    }
)

# Mujoco

## Reacher
register(
    id='ALRReacher-v0',
    entry_point='alr_envs.alr.mujoco:ALRReacherEnv',
    max_episode_steps=200,
    kwargs={
        "steps_before_reward": 0,
        "n_links": 5,
        "balance": False,
    }
)

register(
    id='ALRReacherSparse-v0',
    entry_point='alr_envs.alr.mujoco:ALRReacherEnv',
    max_episode_steps=200,
    kwargs={
        "steps_before_reward": 200,
        "n_links": 5,
        "balance": False,
    }
)

register(
    id='ALRReacherSparseBalanced-v0',
    entry_point='alr_envs.alr.mujoco:ALRReacherEnv',
    max_episode_steps=200,
    kwargs={
        "steps_before_reward": 200,
        "n_links": 5,
        "balance": True,
    }
)

register(
    id='ALRLongReacher-v0',
    entry_point='alr_envs.alr.mujoco:ALRReacherEnv',
    max_episode_steps=200,
    kwargs={
        "steps_before_reward": 0,
        "n_links": 7,
        "balance": False,
    }
)

register(
    id='ALRLongReacherSparse-v0',
    entry_point='alr_envs.alr.mujoco:ALRReacherEnv',
    max_episode_steps=200,
    kwargs={
        "steps_before_reward": 200,
        "n_links": 7,
        "balance": False,
    }
)

register(
    id='ALRLongReacherSparseBalanced-v0',
    entry_point='alr_envs.alr.mujoco:ALRReacherEnv',
    max_episode_steps=200,
    kwargs={
        "steps_before_reward": 200,
        "n_links": 7,
        "balance": True,
    }
)

## Balancing Reacher

register(
    id='Balancing-v0',
    entry_point='alr_envs.alr.mujoco:BalancingEnv',
    max_episode_steps=200,
    kwargs={
        "n_links": 5,
    }
)

## Table Tennis
from alr_envs.alr.mujoco.table_tennis.tt_gym import MAX_EPISODE_STEPS
register(id='TableTennis2DCtxt-v0',
         entry_point='alr_envs.alr.mujoco:TT_Env_Gym',
         max_episode_steps=MAX_EPISODE_STEPS,
         kwargs={'ctxt_dim':2})

register(id='TableTennis4DCtxt-v0',
         entry_point='alr_envs.alr.mujoco:TT_Env_Gym',
         max_episode_steps=MAX_EPISODE_STEPS,
         kwargs={'ctxt_dim':4})

## BeerPong
difficulties = ["simple", "intermediate", "hard", "hardest"]

for v, difficulty in enumerate(difficulties):
    register(
        id='ALRBeerPong-v{}'.format(v),
        entry_point='alr_envs.alr.mujoco:ALRBeerBongEnv',
        max_episode_steps=600,
        kwargs={
            "difficulty": difficulty,
            "reward_type": "staged",
        }
    )

# Motion Primitive Environments

## Simple Reacher
_versions = ["SimpleReacher-v0", "SimpleReacher-v1", "LongSimpleReacher-v0", "LongSimpleReacher-v1"]
for _v in _versions:
    _name = _v.split("-")
    _env_id = f'{_name[0]}DMP-{_name[1]}'
    register(
        id=_env_id,
        entry_point='alr_envs.utils.make_env_helpers:make_dmp_env_helper',
        # max_episode_steps=1,
        kwargs={
            "name": f"alr_envs:{_v}",
            "wrappers": [classic_control.simple_reacher.MPWrapper],
            "mp_kwargs": {
                "num_dof": 2 if "long" not in _v.lower() else 5,
                "num_basis": 5,
                "duration": 20,
                "alpha_phase": 2,
                "learn_goal": True,
                "policy_type": "velocity",
                "weights_scale": 50,
            }
        }
    )
    ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DMP"].append(_env_id)

    _env_id = f'{_name[0]}DetPMP-{_name[1]}'
    register(
        id=_env_id,
        entry_point='alr_envs.utils.make_env_helpers:make_detpmp_env_helper',
        # max_episode_steps=1,
        kwargs={
            "name": f"alr_envs:{_v}",
            "wrappers": [classic_control.simple_reacher.MPWrapper],
            "mp_kwargs": {
                "num_dof": 2 if "long" not in _v.lower() else 5,
                "num_basis": 5,
                "duration": 20,
                "width": 0.025,
                "policy_type": "velocity",
                "weights_scale": 0.2,
                "zero_start": True
            }
        }
    )
    ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DetPMP"].append(_env_id)

# Viapoint reacher
register(
    id='ViaPointReacherDMP-v0',
    entry_point='alr_envs.utils.make_env_helpers:make_dmp_env_helper',
    # max_episode_steps=1,
    kwargs={
        "name": "alr_envs:ViaPointReacher-v0",
        "wrappers": [classic_control.viapoint_reacher.MPWrapper],
        "mp_kwargs": {
            "num_dof": 5,
            "num_basis": 5,
            "duration": 2,
            "learn_goal": True,
            "alpha_phase": 2,
            "policy_type": "velocity",
            "weights_scale": 50,
        }
    }
)
ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DMP"].append("ViaPointReacherDMP-v0")

register(
    id='ViaPointReacherDetPMP-v0',
    entry_point='alr_envs.utils.make_env_helpers:make_detpmp_env_helper',
    # max_episode_steps=1,
    kwargs={
        "name": "alr_envs:ViaPointReacher-v0",
        "wrappers": [classic_control.viapoint_reacher.MPWrapper],
        "mp_kwargs": {
            "num_dof": 5,
            "num_basis": 5,
            "duration": 2,
            "width": 0.025,
            "policy_type": "velocity",
            "weights_scale": 0.2,
            "zero_start": True
        }
    }
)
ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DetPMP"].append("ViaPointReacherDetPMP-v0")

## Hole Reacher
_versions = ["v0", "v1", "v2"]
for _v in _versions:
    _env_id = f'HoleReacherDMP-{_v}'
    register(
        id=_env_id,
        entry_point='alr_envs.utils.make_env_helpers:make_dmp_env_helper',
        # max_episode_steps=1,
        kwargs={
            "name": f"alr_envs:HoleReacher-{_v}",
            "wrappers": [classic_control.hole_reacher.MPWrapper],
            "mp_kwargs": {
                "num_dof": 5,
                "num_basis": 5,
                "duration": 2,
                "learn_goal": True,
                "alpha_phase": 2,
                "bandwidth_factor": 2,
                "policy_type": "velocity",
                "weights_scale": 50,
                "goal_scale": 0.1
            }
        }
    )
    ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DMP"].append(_env_id)

    _env_id = f'HoleReacherProMP-{_v}'
    register(
        id=_env_id,
        entry_point='alr_envs.utils.make_env_helpers:make_promp_env_helper',
        kwargs={
            "name": f"alr_envs:HoleReacher-{_v}",
            "wrappers": [classic_control.hole_reacher.MPWrapper],
            "mp_kwargs": {
                "num_dof": 5,
                "num_basis": 5,
                "duration": 2,
                "policy_type": "velocity",
                "weights_scale": 0.2,
                "zero_start": True
            }
        }
    )
    ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["ProMP"].append(_env_id)

    _env_id = f'HoleReacherDetPMP-{_v}'
    register(
        id=_env_id,
        entry_point='alr_envs.utils.make_env_helpers:make_detpmp_env_helper',
        kwargs={
            "name": f"alr_envs:HoleReacher-{_v}",
            "wrappers": [classic_control.hole_reacher.MPWrapper],
            "mp_kwargs": {
                "num_dof": 5,
                "num_basis": 5,
                "duration": 2,
                "width": 0.025,
                "policy_type": "velocity",
                "weights_scale": 0.2,
                "zero_start": True
            }
        }
    )
    ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DetPMP"].append(_env_id)

## Beerpong
register(
    id='BeerpongDetPMP-v0',
    entry_point='alr_envs.utils.make_env_helpers:make_detpmp_env_helper',
    kwargs={
        "name": "alr_envs:ALRBeerPong-v0",
        "wrappers": [mujoco.beerpong.MPWrapper],
        "mp_kwargs": {
            "num_dof": 7,
            "num_basis": 2,
            "n_zero_bases": 2,
            "duration": 0.5,
            "post_traj_time": 2.5,
            "width": 0.01,
            "off": 0.01,
            "policy_type": "motor",
            "weights_scale": 0.08,
            "zero_start": True,
            "zero_goal": False,
            "policy_kwargs": {
                "p_gains": np.array([       1.5,   5,   2.55,    3,   2.,    2,   1.25]),
                "d_gains": np.array([0.02333333, 0.1, 0.0625, 0.08, 0.03, 0.03, 0.0125])
            }
        }
    }
)
ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DetPMP"].append("BeerpongDetPMP-v0")

## Table Tennis
register(
    id='TableTennisDetPMP-v0',
    entry_point='alr_envs.utils.make_env_helpers:make_detpmp_env_helper',
    kwargs={
        "name": "alr_envs:TableTennis4DCtxt-v0",
        "wrappers": [mujoco.table_tennis.MPWrapper],
        "mp_kwargs": {
            "num_dof": 7,
            "num_basis": 2,
            "n_zero_bases": 2,
            "duration": 1.25,
            "post_traj_time": 4.5,
            "width": 0.01,
            "off": 0.01,
            "policy_type": "motor",
            "weights_scale": 1.0,
            "zero_start": True,
            "zero_goal": False,
            "policy_kwargs": {
                "p_gains": 0.5*np.array([1.0, 4.0, 2.0, 4.0, 1.0, 4.0, 1.0]),
                "d_gains": 0.5*np.array([0.1, 0.4, 0.2, 0.4, 0.1, 0.4, 0.1])
            }
        }
    }
)
ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DetPMP"].append("TableTennisDetPMP-v0")
Working Beerpong and TableTennis with MPWrapper 2021-11-05 11:04:04 +01:00			`import numpy as np`
improved project structure and exposed methods 2021-08-25 17:16:20 +02:00			`from gym import register`

			`from . import classic_control, mujoco`
			`from .classic_control.hole_reacher.hole_reacher import HoleReacherEnv`
			`from .classic_control.simple_reacher.simple_reacher import SimpleReacherEnv`
			`from .classic_control.viapoint_reacher.viapoint_reacher import ViaPointReacherEnv`
			`from .mujoco.ball_in_a_cup.ball_in_a_cup import ALRBallInACupEnv`
			`from .mujoco.ball_in_a_cup.biac_pd import ALRBallInACupPDEnv`
			`from .mujoco.reacher.alr_reacher import ALRReacherEnv`
			`from .mujoco.reacher.balancing import BalancingEnv`

added promp wrapped environments 2021-11-15 09:10:03 +01:00			`ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS = {"DMP": [], "ProMP": [], "DetPMP": []}`
improved project structure and exposed methods 2021-08-25 17:16:20 +02:00
			`# Classic Control`
			`## Simple Reacher`
			`register(`
			`id='SimpleReacher-v0',`
			`entry_point='alr_envs.alr.classic_control:SimpleReacherEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"n_links": 2,`
			`}`
			`)`

			`register(`
			`id='SimpleReacher-v1',`
			`entry_point='alr_envs.alr.classic_control:SimpleReacherEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"n_links": 2,`
			`"random_start": False`
			`}`
			`)`

			`register(`
			`id='LongSimpleReacher-v0',`
			`entry_point='alr_envs.alr.classic_control:SimpleReacherEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"n_links": 5,`
			`}`
			`)`

			`register(`
			`id='LongSimpleReacher-v1',`
			`entry_point='alr_envs.alr.classic_control:SimpleReacherEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"n_links": 5,`
			`"random_start": False`
			`}`
			`)`

			`## Viapoint Reacher`

			`register(`
			`id='ViaPointReacher-v0',`
			`entry_point='alr_envs.alr.classic_control:ViaPointReacherEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"n_links": 5,`
			`"allow_self_collision": False,`
			`"collision_penalty": 1000`
			`}`
			`)`

			`## Hole Reacher`
			`register(`
			`id='HoleReacher-v0',`
			`entry_point='alr_envs.alr.classic_control:HoleReacherEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"n_links": 5,`
			`"random_start": True,`
			`"allow_self_collision": False,`
			`"allow_wall_collision": False,`
			`"hole_width": None,`
			`"hole_depth": 1,`
			`"hole_x": None,`
			`"collision_penalty": 100,`
			`}`
			`)`

			`register(`
			`id='HoleReacher-v1',`
wip 2021-11-17 17:14:13 +01:00			`entry_point='alr_envs.alr.classic_control:HoleReacherEnvOld',`
improved project structure and exposed methods 2021-08-25 17:16:20 +02:00			`max_episode_steps=200,`
			`kwargs={`
			`"n_links": 5,`
			`"random_start": False,`
			`"allow_self_collision": False,`
			`"allow_wall_collision": False,`
			`"hole_width": 0.25,`
			`"hole_depth": 1,`
			`"hole_x": None,`
			`"collision_penalty": 100,`
			`}`
			`)`

			`register(`
			`id='HoleReacher-v2',`
			`entry_point='alr_envs.alr.classic_control:HoleReacherEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"n_links": 5,`
			`"random_start": False,`
			`"allow_self_collision": False,`
			`"allow_wall_collision": False,`
			`"hole_width": 0.25,`
			`"hole_depth": 1,`
			`"hole_x": 2,`
			`"collision_penalty": 100,`
			`}`
			`)`

			`# Mujoco`

			`## Reacher`
			`register(`
			`id='ALRReacher-v0',`
			`entry_point='alr_envs.alr.mujoco:ALRReacherEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"steps_before_reward": 0,`
			`"n_links": 5,`
			`"balance": False,`
			`}`
			`)`

			`register(`
			`id='ALRReacherSparse-v0',`
			`entry_point='alr_envs.alr.mujoco:ALRReacherEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"steps_before_reward": 200,`
			`"n_links": 5,`
			`"balance": False,`
			`}`
			`)`

			`register(`
			`id='ALRReacherSparseBalanced-v0',`
			`entry_point='alr_envs.alr.mujoco:ALRReacherEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"steps_before_reward": 200,`
			`"n_links": 5,`
			`"balance": True,`
			`}`
			`)`

			`register(`
			`id='ALRLongReacher-v0',`
			`entry_point='alr_envs.alr.mujoco:ALRReacherEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"steps_before_reward": 0,`
			`"n_links": 7,`
			`"balance": False,`
			`}`
			`)`

			`register(`
			`id='ALRLongReacherSparse-v0',`
			`entry_point='alr_envs.alr.mujoco:ALRReacherEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"steps_before_reward": 200,`
			`"n_links": 7,`
			`"balance": False,`
			`}`
			`)`

			`register(`
			`id='ALRLongReacherSparseBalanced-v0',`
			`entry_point='alr_envs.alr.mujoco:ALRReacherEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"steps_before_reward": 200,`
			`"n_links": 7,`
			`"balance": True,`
			`}`
			`)`

			`## Balancing Reacher`

			`register(`
			`id='Balancing-v0',`
			`entry_point='alr_envs.alr.mujoco:BalancingEnv',`
			`max_episode_steps=200,`
			`kwargs={`
			`"n_links": 5,`
			`}`
			`)`

Working Beerpong and TableTennis with MPWrapper 2021-11-05 11:04:04 +01:00			`## Table Tennis`
			`from alr_envs.alr.mujoco.table_tennis.tt_gym import MAX_EPISODE_STEPS`
			`register(id='TableTennis2DCtxt-v0',`
			`entry_point='alr_envs.alr.mujoco:TT_Env_Gym',`
			`max_episode_steps=MAX_EPISODE_STEPS,`
			`kwargs={'ctxt_dim':2})`

			`register(id='TableTennis4DCtxt-v0',`
			`entry_point='alr_envs.alr.mujoco:TT_Env_Gym',`
			`max_episode_steps=MAX_EPISODE_STEPS,`
			`kwargs={'ctxt_dim':4})`

			`## BeerPong`
			`difficulties = ["simple", "intermediate", "hard", "hardest"]`

			`for v, difficulty in enumerate(difficulties):`
			`register(`
			`id='ALRBeerPong-v{}'.format(v),`
			`entry_point='alr_envs.alr.mujoco:ALRBeerBongEnv',`
			`max_episode_steps=600,`
			`kwargs={`
			`"difficulty": difficulty,`
			`"reward_type": "staged",`
			`}`
			`)`

improved project structure and exposed methods 2021-08-25 17:16:20 +02:00			`# Motion Primitive Environments`

			`## Simple Reacher`
			`_versions = ["SimpleReacher-v0", "SimpleReacher-v1", "LongSimpleReacher-v0", "LongSimpleReacher-v1"]`
			`for _v in _versions:`
			`_name = _v.split("-")`
			`_env_id = f'{_name[0]}DMP-{_name[1]}'`
			`register(`
			`id=_env_id,`
			`entry_point='alr_envs.utils.make_env_helpers:make_dmp_env_helper',`
			`# max_episode_steps=1,`
			`kwargs={`
			`"name": f"alr_envs:{_v}",`
			`"wrappers": [classic_control.simple_reacher.MPWrapper],`
			`"mp_kwargs": {`
			`"num_dof": 2 if "long" not in _v.lower() else 5,`
			`"num_basis": 5,`
			`"duration": 20,`
			`"alpha_phase": 2,`
			`"learn_goal": True,`
			`"policy_type": "velocity",`
			`"weights_scale": 50,`
			`}`
			`}`
			`)`
			`ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DMP"].append(_env_id)`

			`_env_id = f'{_name[0]}DetPMP-{_name[1]}'`
			`register(`
			`id=_env_id,`
			`entry_point='alr_envs.utils.make_env_helpers:make_detpmp_env_helper',`
			`# max_episode_steps=1,`
			`kwargs={`
			`"name": f"alr_envs:{_v}",`
			`"wrappers": [classic_control.simple_reacher.MPWrapper],`
			`"mp_kwargs": {`
			`"num_dof": 2 if "long" not in _v.lower() else 5,`
			`"num_basis": 5,`
			`"duration": 20,`
			`"width": 0.025,`
			`"policy_type": "velocity",`
			`"weights_scale": 0.2,`
			`"zero_start": True`
			`}`
			`}`
			`)`
			`ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DetPMP"].append(_env_id)`

			`# Viapoint reacher`
			`register(`
			`id='ViaPointReacherDMP-v0',`
			`entry_point='alr_envs.utils.make_env_helpers:make_dmp_env_helper',`
			`# max_episode_steps=1,`
			`kwargs={`
			`"name": "alr_envs:ViaPointReacher-v0",`
			`"wrappers": [classic_control.viapoint_reacher.MPWrapper],`
			`"mp_kwargs": {`
			`"num_dof": 5,`
			`"num_basis": 5,`
			`"duration": 2,`
			`"learn_goal": True,`
			`"alpha_phase": 2,`
			`"policy_type": "velocity",`
			`"weights_scale": 50,`
			`}`
			`}`
			`)`
			`ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DMP"].append("ViaPointReacherDMP-v0")`

			`register(`
			`id='ViaPointReacherDetPMP-v0',`
			`entry_point='alr_envs.utils.make_env_helpers:make_detpmp_env_helper',`
			`# max_episode_steps=1,`
			`kwargs={`
			`"name": "alr_envs:ViaPointReacher-v0",`
			`"wrappers": [classic_control.viapoint_reacher.MPWrapper],`
			`"mp_kwargs": {`
			`"num_dof": 5,`
			`"num_basis": 5,`
			`"duration": 2,`
			`"width": 0.025,`
			`"policy_type": "velocity",`
			`"weights_scale": 0.2,`
			`"zero_start": True`
			`}`
			`}`
			`)`
			`ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DetPMP"].append("ViaPointReacherDetPMP-v0")`

			`## Hole Reacher`
			`_versions = ["v0", "v1", "v2"]`
			`for _v in _versions:`
			`_env_id = f'HoleReacherDMP-{_v}'`
			`register(`
			`id=_env_id,`
			`entry_point='alr_envs.utils.make_env_helpers:make_dmp_env_helper',`
			`# max_episode_steps=1,`
			`kwargs={`
			`"name": f"alr_envs:HoleReacher-{_v}",`
			`"wrappers": [classic_control.hole_reacher.MPWrapper],`
			`"mp_kwargs": {`
			`"num_dof": 5,`
			`"num_basis": 5,`
			`"duration": 2,`
			`"learn_goal": True,`
			`"alpha_phase": 2,`
			`"bandwidth_factor": 2,`
			`"policy_type": "velocity",`
			`"weights_scale": 50,`
			`"goal_scale": 0.1`
			`}`
			`}`
			`)`
			`ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DMP"].append(_env_id)`

added promp wrapped environments 2021-11-15 09:10:03 +01:00			`_env_id = f'HoleReacherProMP-{_v}'`
			`register(`
			`id=_env_id,`
			`entry_point='alr_envs.utils.make_env_helpers:make_promp_env_helper',`
			`kwargs={`
			`"name": f"alr_envs:HoleReacher-{_v}",`
			`"wrappers": [classic_control.hole_reacher.MPWrapper],`
			`"mp_kwargs": {`
			`"num_dof": 5,`
			`"num_basis": 5,`
			`"duration": 2,`
			`"policy_type": "velocity",`
			`"weights_scale": 0.2,`
			`"zero_start": True`
			`}`
			`}`
			`)`
			`ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["ProMP"].append(_env_id)`

improved project structure and exposed methods 2021-08-25 17:16:20 +02:00			`_env_id = f'HoleReacherDetPMP-{_v}'`
			`register(`
			`id=_env_id,`
			`entry_point='alr_envs.utils.make_env_helpers:make_detpmp_env_helper',`
			`kwargs={`
			`"name": f"alr_envs:HoleReacher-{_v}",`
			`"wrappers": [classic_control.hole_reacher.MPWrapper],`
			`"mp_kwargs": {`
			`"num_dof": 5,`
			`"num_basis": 5,`
			`"duration": 2,`
			`"width": 0.025,`
			`"policy_type": "velocity",`
			`"weights_scale": 0.2,`
			`"zero_start": True`
			`}`
			`}`
			`)`
			`ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DetPMP"].append(_env_id)`
Working Beerpong and TableTennis with MPWrapper 2021-11-05 11:04:04 +01:00
			`## Beerpong`
			`register(`
			`id='BeerpongDetPMP-v0',`
			`entry_point='alr_envs.utils.make_env_helpers:make_detpmp_env_helper',`
			`kwargs={`
			`"name": "alr_envs:ALRBeerPong-v0",`
			`"wrappers": [mujoco.beerpong.MPWrapper],`
			`"mp_kwargs": {`
			`"num_dof": 7,`
			`"num_basis": 2,`
			`"n_zero_bases": 2,`
			`"duration": 0.5,`
			`"post_traj_time": 2.5,`
			`"width": 0.01,`
			`"off": 0.01,`
			`"policy_type": "motor",`
			`"weights_scale": 0.08,`
			`"zero_start": True,`
			`"zero_goal": False,`
			`"policy_kwargs": {`
			`"p_gains": np.array([ 1.5, 5, 2.55, 3, 2., 2, 1.25]),`
			`"d_gains": np.array([0.02333333, 0.1, 0.0625, 0.08, 0.03, 0.03, 0.0125])`
			`}`
			`}`
			`}`
			`)`
			`ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DetPMP"].append("BeerpongDetPMP-v0")`

			`## Table Tennis`
			`register(`
			`id='TableTennisDetPMP-v0',`
			`entry_point='alr_envs.utils.make_env_helpers:make_detpmp_env_helper',`
			`kwargs={`
			`"name": "alr_envs:TableTennis4DCtxt-v0",`
			`"wrappers": [mujoco.table_tennis.MPWrapper],`
			`"mp_kwargs": {`
			`"num_dof": 7,`
			`"num_basis": 2,`
			`"n_zero_bases": 2,`
			`"duration": 1.25,`
			`"post_traj_time": 4.5,`
			`"width": 0.01,`
			`"off": 0.01,`
			`"policy_type": "motor",`
			`"weights_scale": 1.0,`
			`"zero_start": True,`
			`"zero_goal": False,`
			`"policy_kwargs": {`
			`"p_gains": 0.5*np.array([1.0, 4.0, 2.0, 4.0, 1.0, 4.0, 1.0]),`
			`"d_gains": 0.5*np.array([0.1, 0.4, 0.2, 0.4, 0.1, 0.4, 0.1])`
			`}`
			`}`
			`}`
			`)`
			`ALL_ALR_MOTION_PRIMITIVE_ENVIRONMENTS["DetPMP"].append("TableTennisDetPMP-v0")`