fancy_gym/alr_envs/utils/policies.py

from gym import Env

from alr_envs.mujoco.alr_mujoco_env import AlrMujocoEnv


class BaseController:
    def __init__(self, env: Env):
        self.env = env

    def get_action(self, des_pos, des_vel):
        raise NotImplementedError


class PosController(BaseController):
    def get_action(self, des_pos, des_vel):
        return des_pos


class VelController(BaseController):
    def get_action(self, des_pos, des_vel):
        return des_vel


class PDController(BaseController):
    def __init__(self, env: AlrMujocoEnv):
        self.p_gains = env.p_gains
        self.d_gains = env.d_gains
        super(PDController, self).__init__(env)

    def get_action(self, des_pos, des_vel):
        # TODO: make standardized ALRenv such that all of them have current_pos/vel attributes
        cur_pos = self.env.current_pos
        cur_vel = self.env.current_vel
        if len(des_pos) != len(cur_pos):
            des_pos = self.env.extend_des_pos(des_pos)
        if len(des_vel) != len(cur_vel):
            des_vel = self.env.extend_des_vel(des_vel)
        trq = self.p_gains * (des_pos - cur_pos) + self.d_gains * (des_vel - cur_vel)
        return trq


def get_policy_class(policy_type):
    if policy_type == "motor":
        return PDController
    elif policy_type == "velocity":
        return VelController
    elif policy_type == "position":
        return PosController
refractoring of DMP environmets to fit gym interface better. 2021-03-26 14:05:16 +01:00			`from gym import Env`

support for contexts, policy classes, pd controller example, breaking changes etc 2021-02-11 10:49:57 +01:00			`from alr_envs.mujoco.alr_mujoco_env import AlrMujocoEnv`
lots of new stuff... 2021-02-05 17:10:03 +01:00
support for contexts, policy classes, pd controller example, breaking changes etc 2021-02-11 10:49:57 +01:00
			`class BaseController:`
refractoring of DMP environmets to fit gym interface better. 2021-03-26 14:05:16 +01:00			`def __init__(self, env: Env):`
support for contexts, policy classes, pd controller example, breaking changes etc 2021-02-11 10:49:57 +01:00			`self.env = env`

			`def get_action(self, des_pos, des_vel):`
			`raise NotImplementedError`


			`class PosController(BaseController):`
			`def get_action(self, des_pos, des_vel):`
			`return des_pos`


			`class VelController(BaseController):`
			`def get_action(self, des_pos, des_vel):`
			`return des_vel`


			`class PDController(BaseController):`
refractoring of DMP environmets to fit gym interface better. 2021-03-26 14:05:16 +01:00			`def __init__(self, env: AlrMujocoEnv):`
support for contexts, policy classes, pd controller example, breaking changes etc 2021-02-11 10:49:57 +01:00			`self.p_gains = env.p_gains`
			`self.d_gains = env.d_gains`
			`super(PDController, self).__init__(env)`

			`def get_action(self, des_pos, des_vel):`
lots of new stuff... 2021-02-05 17:10:03 +01:00			`# TODO: make standardized ALRenv such that all of them have current_pos/vel attributes`
support for contexts, policy classes, pd controller example, breaking changes etc 2021-02-11 10:49:57 +01:00			`cur_pos = self.env.current_pos`
			`cur_vel = self.env.current_vel`
lots of new stuff... 2021-02-05 17:10:03 +01:00			`if len(des_pos) != len(cur_pos):`
support for contexts, policy classes, pd controller example, breaking changes etc 2021-02-11 10:49:57 +01:00			`des_pos = self.env.extend_des_pos(des_pos)`
lots of new stuff... 2021-02-05 17:10:03 +01:00			`if len(des_vel) != len(cur_vel):`
support for contexts, policy classes, pd controller example, breaking changes etc 2021-02-11 10:49:57 +01:00			`des_vel = self.env.extend_des_vel(des_vel)`
lots of new stuff... 2021-02-05 17:10:03 +01:00			`trq = self.p_gains * (des_pos - cur_pos) + self.d_gains * (des_vel - cur_vel)`
			`return trq`
updates 2021-02-15 16:31:34 +01:00

			`def get_policy_class(policy_type):`
			`if policy_type == "motor":`
			`return PDController`
			`elif policy_type == "velocity":`
			`return VelController`
			`elif policy_type == "position":`
			`return PosController`