fancy_gym/alr_envs/alr/mujoco/alr_reward_fct.py

class AlrReward:
    """
    A base class for non-Markovian reward functions which may need trajectory information to calculate an episodic
    reward. Call the methods in reset() and step() of the environment.
    """

    # methods to override:
    # ----------------------------
    def reset(self, *args, **kwargs):
        """
        Reset the reward function, empty state buffers before an episode, set contexts that influence reward, etc.
        """
        raise NotImplementedError

    def compute_reward(self, *args, **kwargs):
        """

        Returns: Useful things to return are reward values, success flags or crash flags

        """
        raise NotImplementedError
support for contexts, policy classes, pd controller example, breaking changes etc 2021-02-11 10:49:57 +01:00			`class AlrReward:`
			`"""`
			`A base class for non-Markovian reward functions which may need trajectory information to calculate an episodic`
			`reward. Call the methods in reset() and step() of the environment.`
			`"""`

			`# methods to override:`
			`# ----------------------------`
			`def reset(self, args, *kwargs):`
			`"""`
			`Reset the reward function, empty state buffers before an episode, set contexts that influence reward, etc.`
			`"""`
			`raise NotImplementedError`

			`def compute_reward(self, args, *kwargs):`
			`"""`

			`Returns: Useful things to return are reward values, success flags or crash flags`

			`"""`
			`raise NotImplementedError`