doc/html/classicreinforce_8h_source.html

 /***************************************************************************

  *   Copyright (C) 2005-2011 by                                            *

  *    Georg Martius  <georg dot martius at web dot de>                     *

  *    Ralf Der       <ralfder at mis dot mpg dot de>                       *

  *                                                                         *

  *   ANY COMMERCIAL USE FORBIDDEN!                                         *

  *   LICENSE:                                                              *

  *   This work is licensed under the Creative Commons                      *

  *   Attribution-NonCommercial-ShareAlike 2.5 License. To view a copy of   *

  *   this license, visit http://creativecommons.org/licenses/by-nc-sa/2.5/ *

  *   or send a letter to Creative Commons, 543 Howard Street, 5th Floor,   *

  *   San Francisco, California, 94105, USA.                                *

  *                                                                         *

  *   This program is distributed in the hope that it will be useful,       *

  *   but WITHOUT ANY WARRANTY; without even the implied warranty of        *

  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.                  *

  *                                                                         *

  ***************************************************************************/

 #ifndef __CLASSICREINFORCE_H

 #define __CLASSICREINFORCE_H


 #include <selforg/abstractcontroller.h>


 #include <assert.h>

 #include <cmath>


 #include <selforg/matrix.h>

 #include <selforg/noisegenerator.h>

 #include <selforg/qlearning.h>


 typedef struct ClassicReinforceConf {

   unsigned short buffersize; ///< size of the ringbuffers for sensors, motors,...

   int    numContext;    ///< number of context sensors (ignored)

   int reinforce_interval; ///<  time between consecutive reinforcement selections


   QLearning* qlearning;      ///< QLearning instance

 } ClassicReinforceConf;


 /**

  * class for robot controller

  * using Q-learning algorithm. Needs to be inherited from to overwrite calcReinforcement()

  */

 class ClassicReinforce : public AbstractController {


 public:

   ClassicReinforce(const ClassicReinforceConf& conf = getDefaultConf());

   virtual void init(int sensornumber, int motornumber, RandGen* randGen = 0);


   virtual ~ClassicReinforce();


   /// returns the number of sensors the controller was initialised with or 0 if not initialised

   virtual int getSensorNumber() const { return number_sensors; }

   /// returns the mumber of motors the controller was initialised with or 0 if not initialised

   virtual int getMotorNumber() const  { return number_motors; }


   /// performs one step (includes learning).

   /// Calulates motor commands from sensor inputs.

   virtual void step(const sensor* , int number_sensors, motor* , int number_motors);


   /// performs one step without learning. Calulates motor commands from sensor inputs.

   virtual void stepNoLearning(const sensor* , int number_sensors,

                               motor* , int number_motors);


   // !!!!!!!!!!!!!!!!!!! MISC STUFF !!!!!!!!


   /** enables/disables manual control, action_ is the sat network number to be used

       if mControl is false, action is ignored

    */

   void setManualControl(bool mControl, int action_ = 0);


   /************** CONFIGURABLE ********************************/

   virtual void notifyOnChange(const paramkey& key);


   /**** STOREABLE ****/

   /** stores the controller values to a given file. */

   virtual bool store(FILE* f) const;

   /** loads the controller values from a given file. */

   virtual bool restore(FILE* f);


   /**** INSPECTABLE ****/

   virtual std::list<iparamkey> getInternalParamNames() const;

   virtual std::list<iparamval> getInternalParams() const;

   virtual std::list<ILayer> getStructuralLayers() const;

   virtual std::list<IConnection> getStructuralConnections() const;


   static ClassicReinforceConf getDefaultConf(){

     ClassicReinforceConf c;

     c.buffersize=10;

     c.numContext=0;

     c.reinforce_interval=10;

     c.qlearning=0;

     return c;

   }


 protected:

   unsigned short number_sensors;

   unsigned short number_motors;


   // sensor, sensor-derivative and motor values storage

   unsigned short buffersize;

   matrix::Matrix* x_buffer;

   matrix::Matrix* y_buffer;

   matrix::Matrix* x_context_buffer;


   bool manualControl;          ///< True if actions (sats) are selected manually


   int action;                  ///< action

   int oldaction;               ///< old action

   int state;                   ///< current state

   double reward;               ///< current reward

   double oldreward;            ///< old reward (nicer for plotting)


   ClassicReinforceConf conf;

   bool initialised;

   int t;

   int managementInterval;       ///< interval between subsequent management calls


   /// returns number of state, to be overwritten

   virtual int getStateNumber() = 0;


   /// returns state, to be overwritten

   virtual int calcState() = 0;


   /// returns number of actions, to be overwritten

   virtual int getActionNumber() = 0;

   /// returns action Matrix from discrete actions, to be overwritten

   virtual matrix::Matrix calcMotor(int action) = 0;


   /// returns the reinforcement (reward), to be overwritten

   virtual double calcReinforcement() = 0;


   // put new value in ring buffer

   void putInBuffer(matrix::Matrix* buffer, const matrix::Matrix& vec, int delay = 0);


   /// puts the sensors in the ringbuffer

   virtual void fillSensorBuffer(const sensor* x_, int number_sensors);

   /// puts the motors in the ringbuffer

   virtual void fillMotorBuffer(const motor* y_, int number_motors);


   /// handles inhibition damping etc.

   virtual void management();


 };


 #endif

matrix::Matrix
Matrix type.
Definition: matrix.h:65

ClassicReinforce::getDefaultConf
static ClassicReinforceConf getDefaultConf()
Definition: classicreinforce.h:87

ClassicReinforce::getMotorNumber
virtual int getMotorNumber() const
returns the mumber of motors the controller was initialised with or 0 if not initialised ...
Definition: classicreinforce.h:54

AbstractController
Abstract class for robot controller (with some basic functionality).
Definition: abstractcontroller.h:46

ClassicReinforce::fillSensorBuffer
virtual void fillSensorBuffer(const sensor *x_, int number_sensors)
puts the sensors in the ringbuffer
Definition: classicreinforce.cpp:139

ClassicReinforce::calcReinforcement
virtual double calcReinforcement()=0
returns the reinforcement (reward), to be overwritten

ClassicReinforceConf::reinforce_interval
int reinforce_interval
time between consecutive reinforcement selections
Definition: classicreinforce.h:34

QLearning
implements QLearning
Definition: qlearning.h:33

ClassicReinforce::setManualControl
void setManualControl(bool mControl, int action_=0)
enables/disables manual control, action_ is the sat network number to be used if mControl is false...
Definition: classicreinforce.cpp:157

ClassicReinforceConf::buffersize
unsigned short buffersize
size of the ringbuffers for sensors, motors,...
Definition: classicreinforce.h:32

paramkey
charArray paramkey
Definition: avrtypes.h:36

ClassicReinforceConf
Definition: classicreinforce.h:31

ClassicReinforce::management
virtual void management()
handles inhibition damping etc.
Definition: classicreinforce.cpp:166

ClassicReinforce::manualControl
bool manualControl
True if actions (sats) are selected manually.
Definition: classicreinforce.h:107

ClassicReinforce::getInternalParams
virtual std::list< iparamval > getInternalParams() const
Definition: classicreinforce.cpp:224

ClassicReinforceConf::qlearning
QLearning * qlearning
QLearning instance.
Definition: classicreinforce.h:36

ClassicReinforce::store
virtual bool store(FILE *f) const
stores the controller values to a given file.
Definition: classicreinforce.cpp:183

sensor
double sensor
Definition: types.h:29

_RandGen
random generator with 48bit integer arithmentic
Definition: randomgenerator.h:34

ClassicReinforce::restore
virtual bool restore(FILE *f)
loads the controller values from a given file.
Definition: classicreinforce.cpp:192

ClassicReinforce::calcMotor
virtual matrix::Matrix calcMotor(int action)=0
returns action Matrix from discrete actions, to be overwritten

ClassicReinforce::managementInterval
int managementInterval
interval between subsequent management calls
Definition: classicreinforce.h:118

ClassicReinforce::getStructuralConnections
virtual std::list< IConnection > getStructuralConnections() const
Specifies which parameter matrix forms a connection between layers (in terms of a neural network) The...
Definition: classicreinforce.cpp:239

ClassicReinforceConf::numContext
int numContext
number of context sensors (ignored)
Definition: classicreinforce.h:33

ClassicReinforce::conf
ClassicReinforceConf conf
Definition: classicreinforce.h:115

ClassicReinforce::putInBuffer
void putInBuffer(matrix::Matrix *buffer, const matrix::Matrix &vec, int delay=0)
Definition: classicreinforce.cpp:79

ClassicReinforce::notifyOnChange
virtual void notifyOnChange(const paramkey &key)
Is called when a parameter was changes via setParam().
Definition: classicreinforce.cpp:170

ClassicReinforce::fillMotorBuffer
virtual void fillMotorBuffer(const motor *y_, int number_motors)
puts the motors in the ringbuffer
Definition: classicreinforce.cpp:149

ClassicReinforce::stepNoLearning
virtual void stepNoLearning(const sensor *, int number_sensors, motor *, int number_motors)
performs one step without learning. Calulates motor commands from sensor inputs.
Definition: classicreinforce.cpp:129

AbstractController::sensor
double sensor
Definition: abstractcontroller.h:48

ClassicReinforce::t
int t
Definition: classicreinforce.h:117

ClassicReinforce::oldreward
double oldreward
old reward (nicer for plotting)
Definition: classicreinforce.h:113

ClassicReinforce::number_motors
unsigned short number_motors
Definition: classicreinforce.h:99

ClassicReinforce::buffersize
unsigned short buffersize
Definition: classicreinforce.h:102

ClassicReinforce::step
virtual void step(const sensor *, int number_sensors, motor *, int number_motors)
performs one step (includes learning).
Definition: classicreinforce.cpp:85

ClassicReinforce::init
virtual void init(int sensornumber, int motornumber, RandGen *randGen=0)
initialisation of the controller with the given sensor/ motornumber Must be called before use...
Definition: classicreinforce.cpp:52

ClassicReinforceConf
struct ClassicReinforceConf ClassicReinforceConf

ClassicReinforce::ClassicReinforce
ClassicReinforce(const ClassicReinforceConf &conf=getDefaultConf())
Definition: classicreinforce.cpp:28

ClassicReinforce::oldaction
int oldaction
old action
Definition: classicreinforce.h:110

ClassicReinforce::reward
double reward
current reward
Definition: classicreinforce.h:112

ClassicReinforce::x_buffer
matrix::Matrix * x_buffer
Definition: classicreinforce.h:103

motor
double motor
Definition: types.h:30

ClassicReinforce::action
int action
action
Definition: classicreinforce.h:109

ClassicReinforce
class for robot controller using Q-learning algorithm.
Definition: classicreinforce.h:43

ClassicReinforce::~ClassicReinforce
virtual ~ClassicReinforce()
Definition: classicreinforce.cpp:41

AbstractController::motor
double motor
Definition: abstractcontroller.h:49

ClassicReinforce::getInternalParamNames
virtual std::list< iparamkey > getInternalParamNames() const
The list of the names of all internal parameters given by getInternalParams().
Definition: classicreinforce.cpp:213

ClassicReinforce::number_sensors
unsigned short number_sensors
Definition: classicreinforce.h:98

ClassicReinforce::getStateNumber
virtual int getStateNumber()=0
returns number of state, to be overwritten

ClassicReinforce::calcState
virtual int calcState()=0
returns state, to be overwritten

ClassicReinforce::getSensorNumber
virtual int getSensorNumber() const
returns the number of sensors the controller was initialised with or 0 if not initialised ...
Definition: classicreinforce.h:52

ClassicReinforce::getActionNumber
virtual int getActionNumber()=0
returns number of actions, to be overwritten

ClassicReinforce::y_buffer
matrix::Matrix * y_buffer
Definition: classicreinforce.h:104

lpzrobots::c
int c
Definition: hexapod.cpp:56

ClassicReinforce::state
int state
current state
Definition: classicreinforce.h:111

ClassicReinforce::initialised
bool initialised
Definition: classicreinforce.h:116

ClassicReinforce::getStructuralLayers
virtual std::list< ILayer > getStructuralLayers() const
Specifies which parameter vector forms a structural layer (in terms of a neural network) The ordering...
Definition: classicreinforce.cpp:234

ClassicReinforce::x_context_buffer
matrix::Matrix * x_context_buffer
Definition: classicreinforce.h:105