doc/v618/MethodPyGTB_8cxx_source.html

// @(#)root/tmva/pymva $Id$

// Authors: Omar Zapata, Lorenzo Moneta, Sergei Gleyzer 2015


/**********************************************************************************

 * Project: TMVA - a Root-integrated toolkit for multivariate data analysis       *

 * Package: TMVA                                                                  *

 * Class  : MethodPyGTB                                                           *

 * Web    : http://oproject.org                                                   *

 *                                                                                *

 * Description:                                                                   *

 *      GradientBoostingClassifier Classifiear from Scikit learn                  *

 *                                                                                *

 *                                                                                *

 * Redistribution and use in source and binary forms, with or without             *

 * modification, are permitted according to the terms listed in LICENSE           *

 * (http://tmva.sourceforge.net/LICENSE)                                          *

 *                                                                                *

 **********************************************************************************/


#include <Python.h>    // Needs to be included first to avoid redefinition of _POSIX_C_SOURCE

#include "TMVA/MethodPyGTB.h"


#define NPY_NO_DEPRECATED_API NPY_1_7_API_VERSION

#include <numpy/arrayobject.h>


#include "TMVA/Configurable.h"

#include "TMVA/ClassifierFactory.h"

#include "TMVA/Config.h"

#include "TMVA/DataSet.h"

#include "TMVA/Event.h"

#include "TMVA/IMethod.h"

#include "TMVA/MsgLogger.h"

#include "TMVA/PDF.h"

#include "TMVA/Ranking.h"

#include "TMVA/Results.h"

#include "TMVA/ResultsClassification.h"

#include "TMVA/Tools.h"

#include "TMVA/Types.h"

#include "TMVA/Timer.h"

#include "TMVA/VariableTransformBase.h"


#include "Riostream.h"

#include "TMath.h"

#include "TMatrix.h"

#include "TMatrixD.h"

#include "TVectorD.h"


#include <iomanip>

#include <fstream>


using namespace TMVA;


namespace TMVA {

namespace Internal {

class PyGILRAII {

   PyGILState_STATE m_GILState;


public:

   PyGILRAII() : m_GILState(PyGILState_Ensure()) {}

   ~PyGILRAII() { PyGILState_Release(m_GILState); }

};

} // namespace Internal

} // namespace TMVA


REGISTER_METHOD(PyGTB)


ClassImp(MethodPyGTB);


//_______________________________________________________________________

MethodPyGTB::MethodPyGTB(const TString &jobName,

                         const TString &methodTitle,

                         DataSetInfo &dsi,

                         const TString &theOption) :

   PyMethodBase(jobName, Types::kPyGTB, methodTitle, dsi, theOption),

   fLoss("deviance"),

   fLearningRate(0.1),

   fNestimators(100),

   fSubsample(1.0),

   fMinSamplesSplit(2),

   fMinSamplesLeaf(1),

   fMinWeightFractionLeaf(0.0),

   fMaxDepth(3),

   fInit("None"),

   fRandomState("None"),

   fMaxFeatures("None"),

   fVerbose(0),

   fMaxLeafNodes("None"),

   fWarmStart(kFALSE)

{

}


//_______________________________________________________________________

MethodPyGTB::MethodPyGTB(DataSetInfo &theData, const TString &theWeightFile)

   : PyMethodBase(Types::kPyGTB, theData, theWeightFile),

   fLoss("deviance"),

   fLearningRate(0.1),

   fNestimators(100),

   fSubsample(1.0),

   fMinSamplesSplit(2),

   fMinSamplesLeaf(1),

   fMinWeightFractionLeaf(0.0),

   fMaxDepth(3),

   fInit("None"),

   fRandomState("None"),

   fMaxFeatures("None"),

   fVerbose(0),

   fMaxLeafNodes("None"),

   fWarmStart(kFALSE)

{

}


//_______________________________________________________________________

MethodPyGTB::~MethodPyGTB(void)

{

}


//_______________________________________________________________________

Bool_t MethodPyGTB::HasAnalysisType(Types::EAnalysisType type, UInt_t numberClasses, UInt_t)

{

   if (type == Types::kClassification && numberClasses == 2) return kTRUE;

   if (type == Types::kMulticlass && numberClasses >= 2) return kTRUE;

   return kFALSE;

}


//_______________________________________________________________________

void MethodPyGTB::DeclareOptions()

{

   MethodBase::DeclareCompatibilityOptions();


   DeclareOptionRef(fLoss, "Loss", "{'deviance', 'exponential'}, optional (default='deviance')\

      loss function to be optimized. 'deviance' refers to\

      deviance (= logistic regression) for classification\

      with probabilistic outputs. For loss 'exponential' gradient\

      boosting recovers the AdaBoost algorithm.");


   DeclareOptionRef(fLearningRate, "LearningRate", "float, optional (default=0.1)\

      learning rate shrinks the contribution of each tree by `learning_rate`.\

      There is a trade-off between learning_rate and n_estimators.");


   DeclareOptionRef(fNestimators, "NEstimators", "int (default=100)\

      The number of boosting stages to perform. Gradient boosting\

      is fairly robust to over-fitting so a large number usually\

      results in better performance.");


   DeclareOptionRef(fSubsample, "Subsample", "float, optional (default=1.0)\

      The fraction of samples to be used for fitting the individual base\

      learners. If smaller than 1.0 this results in Stochastic Gradient\

      Boosting. `subsample` interacts with the parameter `n_estimators`.\

      Choosing `subsample < 1.0` leads to a reduction of variance\

      and an increase in bias.");


   DeclareOptionRef(fMinSamplesSplit, "MinSamplesSplit", "integer, optional (default=2)\

      The minimum number of samples required to split an internal node.");


   DeclareOptionRef(fMinSamplesLeaf, "MinSamplesLeaf", "integer, optional (default=1) \

      The minimum number of samples in newly created leaves.  A split is \

      discarded if after the split, one of the leaves would contain less then \

      ``min_samples_leaf`` samples.");


   DeclareOptionRef(fMinWeightFractionLeaf, "MinWeightFractionLeaf", "//float, optional (default=0.) \

      The minimum weighted fraction of the input samples required to be at a \

      leaf node.");


   DeclareOptionRef(fMaxDepth, "MaxDepth", "integer or None, optional (default=None) \

      The maximum depth of the tree. If None, then nodes are expanded until \

      all leaves are pure or until all leaves contain less than \

      min_samples_split samples. \

      Ignored if ``max_leaf_nodes`` is not None.");


   DeclareOptionRef(fInit, "Init", "BaseEstimator, None, optional (default=None)\

      An estimator object that is used to compute the initial\

      predictions. ``init`` has to provide ``fit`` and ``predict``.\

      If None it uses ``loss.init_estimator`");


   DeclareOptionRef(fRandomState, "RandomState", "int, RandomState instance or None, optional (default=None)\

      If int, random_state is the seed used by the random number generator;\

      If RandomState instance, random_state is the random number generator;\

      If None, the random number generator is the RandomState instance used\

      by `np.random`.");


   DeclareOptionRef(fMaxFeatures, "MaxFeatures", "The number of features to consider when looking for the best split");


   DeclareOptionRef(fVerbose, "Verbose", "int, optional (default=0)\

      Controls the verbosity of the tree building process.");


   DeclareOptionRef(fMaxLeafNodes, "MaxLeafNodes", "int or None, optional (default=None)\

      Grow trees with ``max_leaf_nodes`` in best-first fashion.\

      Best nodes are defined as relative reduction in impurity.\

      If None then unlimited number of leaf nodes.\

      If not None then ``max_depth`` will be ignored.");


   DeclareOptionRef(fWarmStart, "WarmStart", "bool, optional (default=False)\

      When set to ``True``, reuse the solution of the previous call to fit\

      and add more estimators to the ensemble, otherwise, just fit a whole\

      new forest.");


   DeclareOptionRef(fFilenameClassifier, "FilenameClassifier",

      "Store trained classifier in this file");

}


//_______________________________________________________________________

// Check options and load them to local python namespace

void MethodPyGTB::ProcessOptions()

{

   if (fLoss != "deviance" && fLoss != "exponential") {

      Log() << kFATAL << Form("Loss = %s ... that does not work!", fLoss.Data())

            << " The options are 'deviance' or 'exponential'." << Endl;

   }

   pLoss = Eval(Form("'%s'", fLoss.Data()));

   PyDict_SetItemString(fLocalNS, "loss", pLoss);


   if (fLearningRate <= 0) {

      Log() << kFATAL << "LearningRate <= 0 ... that does not work!" << Endl;

   }

   pLearningRate = Eval(Form("%f", fLearningRate));

   PyDict_SetItemString(fLocalNS, "learningRate", pLearningRate);


   if (fNestimators <= 0) {

      Log() << kFATAL << "NEstimators <= 0 ... that does not work!" << Endl;

   }

   pNestimators = Eval(Form("%i", fNestimators));

   PyDict_SetItemString(fLocalNS, "nEstimators", pNestimators);


   if (fMinSamplesSplit < 0) {

      Log() << kFATAL << "MinSamplesSplit < 0 ... that does not work!" << Endl;

   }

   pMinSamplesSplit = Eval(Form("%i", fMinSamplesSplit));

   PyDict_SetItemString(fLocalNS, "minSamplesSplit", pMinSamplesSplit);


   if (fSubsample < 0) {

      Log() << kFATAL << "Subsample < 0 ... that does not work!" << Endl;

   }

   pSubsample = Eval(Form("%f", fSubsample));

   PyDict_SetItemString(fLocalNS, "subsample", pSubsample);


   if (fMinSamplesLeaf < 0) {

      Log() << kFATAL << "MinSamplesLeaf < 0 ... that does not work!" << Endl;

   }

   pMinSamplesLeaf = Eval(Form("%i", fMinSamplesLeaf));

   PyDict_SetItemString(fLocalNS, "minSamplesLeaf", pMinSamplesLeaf);


   if (fMinSamplesSplit < 0) {

      Log() << kFATAL << "MinSamplesSplit < 0 ... that does not work!" << Endl;

   }

   pMinSamplesSplit = Eval(Form("%i", fMinSamplesSplit));

   PyDict_SetItemString(fLocalNS, "minSamplesSplit", pMinSamplesSplit);


   if (fMinWeightFractionLeaf < 0) {

      Log() << kFATAL << "MinWeightFractionLeaf < 0 ... that does not work !" << Endl;

   }

   pMinWeightFractionLeaf = Eval(Form("%f", fMinWeightFractionLeaf));

   PyDict_SetItemString(fLocalNS, "minWeightFractionLeaf", pMinWeightFractionLeaf);


   if (fMaxDepth <= 0) {

      Log() << kFATAL << " MaxDepth <= 0 ... that does not work !! " << Endl;

   }

   pMaxDepth = Eval(Form("%i", fMaxDepth));

   PyDict_SetItemString(fLocalNS, "maxDepth", pMaxDepth);


   pInit = Eval(fInit);

   if (!pInit) {

      Log() << kFATAL << Form("Init = %s ... that does not work!", fInit.Data())

            << " The options are None or BaseEstimator, which is an estimator object that"

            << "is used to compute the initial predictions. "

            << "'init' has to provide 'fit' and 'predict' methods."

            << " If None it uses 'loss.init_estimator'." << Endl;

   }

   PyDict_SetItemString(fLocalNS, "init", pInit);


   pRandomState = Eval(fRandomState);

   if (!pRandomState) {

      Log() << kFATAL << Form(" RandomState = %s ... that does not work! ", fRandomState.Data())

            << " If int, random_state is the seed used by the random number generator;"

            << " If RandomState instance, random_state is the random number generator;"

            << " If None, the random number generator is the RandomState instance used by 'np.random'."

            << Endl;

   }

   PyDict_SetItemString(fLocalNS, "randomState", pRandomState);


   if (fMaxFeatures == "auto" || fMaxFeatures == "sqrt" || fMaxFeatures == "log2"){

      fMaxFeatures = Form("'%s'", fMaxFeatures.Data());

   }

   pMaxFeatures = Eval(fMaxFeatures);

   PyDict_SetItemString(fLocalNS, "maxFeatures", pMaxFeatures);


   if (!pMaxFeatures) {

      Log() << kFATAL << Form(" MaxFeatures = %s... that does not work !! ", fMaxFeatures.Data())

            << "int, float, string or None, optional (default='auto')"

            << "The number of features to consider when looking for the best split:"

            << "If int, then consider `max_features` features at each split."

            << "If float, then `max_features` is a percentage and"

            << "`int(max_features * n_features)` features are considered at each split."

            << "If 'auto', then `max_features=sqrt(n_features)`."

            << "If 'sqrt', then `max_features=sqrt(n_features)`."

            << "If 'log2', then `max_features=log2(n_features)`."

            << "If None, then `max_features=n_features`." << Endl;

   }


   pMaxLeafNodes = Eval(fMaxLeafNodes);

   if (!pMaxLeafNodes) {

      Log() << kFATAL << Form(" MaxLeafNodes = %s... that does not work!", fMaxLeafNodes.Data())

            << " The options are None or integer." << Endl;

   }

   PyDict_SetItemString(fLocalNS, "maxLeafNodes", pMaxLeafNodes);


   pVerbose = Eval(Form("%i", fVerbose));

   PyDict_SetItemString(fLocalNS, "verbose", pVerbose);


   pWarmStart = Eval(Form("%i", UInt_t(fWarmStart)));

   PyDict_SetItemString(fLocalNS, "warmStart", pWarmStart);


   // If no filename is given, set default

   if(fFilenameClassifier.IsNull()) {

      fFilenameClassifier = GetWeightFileDir() + "/PyGTBModel_" + GetName() + ".PyData";

   }

}


//_______________________________________________________________________

void  MethodPyGTB::Init()

{

   TMVA::Internal::PyGILRAII raii;

   _import_array(); //require to use numpy arrays


   // Check options and load them to local python namespace

   ProcessOptions();


   // Import module for gradient tree boosting classifier

   PyRunString("import sklearn.ensemble");


   // Get data properties

   fNvars = GetNVariables();

   fNoutputs = DataInfo().GetNClasses();

}


void MethodPyGTB::Train()

{

   // Load training data (data, classes, weights) to python arrays

   int fNrowsTraining = Data()->GetNTrainingEvents(); //every row is an event, a class type and a weight

   npy_intp dimsData[2];

   dimsData[0] = fNrowsTraining;

   dimsData[1] = fNvars;

   fTrainData = (PyArrayObject *)PyArray_SimpleNew(2, dimsData, NPY_FLOAT);

   PyDict_SetItemString(fLocalNS, "trainData", (PyObject*)fTrainData);

   float *TrainData = (float *)(PyArray_DATA(fTrainData));


   npy_intp dimsClasses = (npy_intp) fNrowsTraining;

   fTrainDataClasses = (PyArrayObject *)PyArray_SimpleNew(1, &dimsClasses, NPY_FLOAT);

   PyDict_SetItemString(fLocalNS, "trainDataClasses", (PyObject*)fTrainDataClasses);

   float *TrainDataClasses = (float *)(PyArray_DATA(fTrainDataClasses));


   fTrainDataWeights = (PyArrayObject *)PyArray_SimpleNew(1, &dimsClasses, NPY_FLOAT);

   PyDict_SetItemString(fLocalNS, "trainDataWeights", (PyObject*)fTrainDataWeights);

   float *TrainDataWeights = (float *)(PyArray_DATA(fTrainDataWeights));


   for (int i = 0; i < fNrowsTraining; i++) {

      // Fill training data matrix

      const TMVA::Event *e = Data()->GetTrainingEvent(i);

      for (UInt_t j = 0; j < fNvars; j++) {

         TrainData[j + i * fNvars] = e->GetValue(j);

      }


      // Fill target classes

      TrainDataClasses[i] = e->GetClass();


      // Get event weight

      TrainDataWeights[i] = e->GetWeight();

   }


   // Create classifier object

   PyRunString("classifier = sklearn.ensemble.GradientBoostingClassifier(loss=loss, learning_rate=learningRate, n_estimators=nEstimators, max_depth=maxDepth, min_samples_split=minSamplesSplit, min_samples_leaf=minSamplesLeaf, min_weight_fraction_leaf=minWeightFractionLeaf, subsample=subsample, max_features=maxFeatures, max_leaf_nodes=maxLeafNodes, init=init, verbose=verbose, warm_start=warmStart, random_state=randomState)",

      "Failed to setup classifier");


   // Fit classifier

   // NOTE: We dump the output to a variable so that the call does not pollute stdout

   PyRunString("dump = classifier.fit(trainData, trainDataClasses, trainDataWeights)", "Failed to train classifier");


   // Store classifier

   fClassifier = PyDict_GetItemString(fLocalNS, "classifier");

   if(fClassifier == 0) {

      Log() << kFATAL << "Can't create classifier object from GradientBoostingClassifier" << Endl;

      Log() << Endl;

   }


   if (IsModelPersistence()) {

      Log() << Endl;

      Log() << gTools().Color("bold") << "Saving state file: " << gTools().Color("reset") << fFilenameClassifier << Endl;

      Log() << Endl;

      Serialize(fFilenameClassifier, fClassifier);

   }

}


//_______________________________________________________________________

void MethodPyGTB::TestClassification()

{

   MethodBase::TestClassification();

}


//_______________________________________________________________________

std::vector<Double_t> MethodPyGTB::GetMvaValues(Long64_t firstEvt, Long64_t lastEvt, Bool_t logProgress)

{

   // Load model if not already done

   if (fClassifier == 0) ReadModelFromFile();


   // Determine number of events

   Long64_t nEvents = Data()->GetNEvents();

   if (firstEvt > lastEvt || lastEvt > nEvents) lastEvt = nEvents;

   if (firstEvt < 0) firstEvt = 0;

   nEvents = lastEvt-firstEvt;


   // use timer

   Timer timer( nEvents, GetName(), kTRUE );


   if (logProgress)

      Log() << kHEADER << Form("[%s] : ",DataInfo().GetName())

            << "Evaluation of " << GetMethodName() << " on "

            << (Data()->GetCurrentType() == Types::kTraining ? "training" : "testing")

            << " sample (" << nEvents << " events)" << Endl;


   // Get data

   npy_intp dims[2];

   dims[0] = nEvents;

   dims[1] = fNvars;

   PyArrayObject *pEvent= (PyArrayObject *)PyArray_SimpleNew(2, dims, NPY_FLOAT);

   float *pValue = (float *)(PyArray_DATA(pEvent));


   for (Int_t ievt=0; ievt<nEvents; ievt++) {

      Data()->SetCurrentEvent(ievt);

      const TMVA::Event *e = Data()->GetEvent();

      for (UInt_t i = 0; i < fNvars; i++) {

         pValue[ievt * fNvars + i] = e->GetValue(i);

      }

   }


   // Get prediction from classifier

   PyArrayObject *result = (PyArrayObject *)PyObject_CallMethod(fClassifier, const_cast<char *>("predict_proba"), const_cast<char *>("(O)"), pEvent);

   double *proba = (double *)(PyArray_DATA(result));


   // Return signal probabilities

   if(Long64_t(mvaValues.size()) != nEvents) mvaValues.resize(nEvents);

   for (int i = 0; i < nEvents; ++i) {

      mvaValues[i] = proba[fNoutputs*i + TMVA::Types::kSignal];

   }


   Py_DECREF(pEvent);

   Py_DECREF(result);


   if (logProgress) {

      Log() << kINFO

            << "Elapsed time for evaluation of " << nEvents <<  " events: "

            << timer.GetElapsedTime() << "       " << Endl;

   }


   return mvaValues;

}


//_______________________________________________________________________

Double_t MethodPyGTB::GetMvaValue(Double_t *errLower, Double_t *errUpper)

{

   // cannot determine error

   NoErrorCalc(errLower, errUpper);


   // Load model if not already done

   if (fClassifier == 0) ReadModelFromFile();


   // Get current event and load to python array

   const TMVA::Event *e = Data()->GetEvent();

   npy_intp dims[2];

   dims[0] = 1;

   dims[1] = fNvars;

   PyArrayObject *pEvent= (PyArrayObject *)PyArray_SimpleNew(2, dims, NPY_FLOAT);

   float *pValue = (float *)(PyArray_DATA(pEvent));

   for (UInt_t i = 0; i < fNvars; i++) pValue[i] = e->GetValue(i);


   // Get prediction from classifier

   PyArrayObject *result = (PyArrayObject *)PyObject_CallMethod(fClassifier, const_cast<char *>("predict_proba"), const_cast<char *>("(O)"), pEvent);

   double *proba = (double *)(PyArray_DATA(result));


   // Return MVA value

   Double_t mvaValue;

   mvaValue = proba[TMVA::Types::kSignal]; // getting signal probability


   Py_DECREF(result);

   Py_DECREF(pEvent);


   return mvaValue;

}


//_______________________________________________________________________

std::vector<Float_t>& MethodPyGTB::GetMulticlassValues()

{

   // Load model if not already done

   if (fClassifier == 0) ReadModelFromFile();


   // Get current event and load to python array

   const TMVA::Event *e = Data()->GetEvent();

   npy_intp dims[2];

   dims[0] = 1;

   dims[1] = fNvars;

   PyArrayObject *pEvent= (PyArrayObject *)PyArray_SimpleNew(2, dims, NPY_FLOAT);

   float *pValue = (float *)(PyArray_DATA(pEvent));

   for (UInt_t i = 0; i < fNvars; i++) pValue[i] = e->GetValue(i);


   // Get prediction from classifier

   PyArrayObject *result = (PyArrayObject *)PyObject_CallMethod(fClassifier, const_cast<char *>("predict_proba"), const_cast<char *>("(O)"), pEvent);

   double *proba = (double *)(PyArray_DATA(result));


   // Return MVA values

   if(UInt_t(classValues.size()) != fNoutputs) classValues.resize(fNoutputs);

   for(UInt_t i = 0; i < fNoutputs; i++) classValues[i] = proba[i];


   Py_DECREF(pEvent);

   Py_DECREF(result);


   return classValues;

}


//_______________________________________________________________________

void MethodPyGTB::ReadModelFromFile()

{

   if (!PyIsInitialized()) {

      PyInitialize();

   }


   Log() << Endl;

   Log() << gTools().Color("bold") << "Loading state file: " << gTools().Color("reset") << fFilenameClassifier << Endl;

   Log() << Endl;


   // Load classifier from file

   Int_t err = UnSerialize(fFilenameClassifier, &fClassifier);

   if(err != 0)

   {

       Log() << kFATAL << Form("Failed to load classifier from file (error code: %i): %s", err, fFilenameClassifier.Data()) << Endl;

   }


   // Book classifier object in python dict

   PyDict_SetItemString(fLocalNS, "classifier", fClassifier);


   // Load data properties

   // NOTE: This has to be repeated here for the reader application

   fNvars = GetNVariables();

   fNoutputs = DataInfo().GetNClasses();

}


//_______________________________________________________________________

const Ranking* MethodPyGTB::CreateRanking()

{

   // Get feature importance from classifier as an array with length equal

   // number of variables, higher value signals a higher importance

   PyArrayObject* pRanking = (PyArrayObject*) PyObject_GetAttrString(fClassifier, "feature_importances_");

   if(pRanking == 0) Log() << kFATAL << "Failed to get ranking from classifier" << Endl;


   // Fill ranking object and return it

   fRanking = new Ranking(GetName(), "Variable Importance");

   Double_t* rankingData = (Double_t*) PyArray_DATA(pRanking);

   for(UInt_t iVar=0; iVar<fNvars; iVar++){

      fRanking->AddRank(Rank(GetInputLabel(iVar), rankingData[iVar]));

   }


   Py_DECREF(pRanking);


   return fRanking;

}


//_______________________________________________________________________

void MethodPyGTB::GetHelpMessage() const

{

   // typical length of text line:

   //       "|--------------------------------------------------------------|"

   Log() << "A gradient tree boosting classifier builds a model from an ensemble" << Endl;

   Log() << "of decision trees, which are adapted each boosting step to fit better" << Endl;

   Log() << "to previously misclassified events." << Endl;

   Log() << Endl;

   Log() << "Check out the scikit-learn documentation for more information." << Endl;

}


ClassifierFactory.h

REGISTER_METHOD
#define REGISTER_METHOD(CLASS)
for example
Definition: ClassifierFactory.h:124

Config.h

Configurable.h

DataSet.h

Event.h

IMethod.h

MethodPyGTB.h

MsgLogger.h

PDF.h

e
#define e(i)
Definition: RSha256.hxx:103

Ranking.h

ResultsClassification.h

Results.h

Riostream.h

Int_t
int Int_t
Definition: RtypesCore.h:41

UInt_t
unsigned int UInt_t
Definition: RtypesCore.h:42

kFALSE
const Bool_t kFALSE
Definition: RtypesCore.h:88

Bool_t
bool Bool_t
Definition: RtypesCore.h:59

Double_t
double Double_t
Definition: RtypesCore.h:55

Long64_t
long long Long64_t
Definition: RtypesCore.h:69

kTRUE
const Bool_t kTRUE
Definition: RtypesCore.h:87

ClassImp
#define ClassImp(name)
Definition: Rtypes.h:365

type
int type
Definition: TGX11.cxx:120

TMath.h

TMatrixD.h

TMatrix.h

PyObject
_object PyObject
Definition: TPyArg.h:20

Form
char * Form(const char *fmt,...)

TVectorD.h

Timer.h

Tools.h

VariableTransformBase.h

TMVA::Configurable::DeclareOptionRef
OptionBase * DeclareOptionRef(T &ref, const TString &name, const TString &desc="")

TMVA::Configurable::Log
MsgLogger & Log() const
Definition: Configurable.h:122

TMVA::DataSetInfo
Class that contains all the data information.
Definition: DataSetInfo.h:60

TMVA::DataSetInfo::GetNClasses
UInt_t GetNClasses() const
Definition: DataSetInfo.h:136

TMVA::DataSet::GetEvent
const Event * GetEvent() const
Definition: DataSet.cxx:202

TMVA::DataSet::GetCurrentType
Types::ETreeType GetCurrentType() const
Definition: DataSet.h:205

TMVA::DataSet::GetNEvents
Long64_t GetNEvents(Types::ETreeType type=Types::kMaxTreeType) const
Definition: DataSet.h:217

TMVA::DataSet::GetNTrainingEvents
Long64_t GetNTrainingEvents() const
Definition: DataSet.h:79

TMVA::DataSet::SetCurrentEvent
void SetCurrentEvent(Long64_t ievt) const
Definition: DataSet.h:99

TMVA::DataSet::GetTrainingEvent
const Event * GetTrainingEvent(Long64_t ievt) const
Definition: DataSet.h:85

TMVA::Event
Definition: Event.h:52

TMVA::MethodBase::DeclareCompatibilityOptions
virtual void DeclareCompatibilityOptions()
options that are used ONLY for the READER to ensure backward compatibility they are hence without any...
Definition: MethodBase.cxx:601

TMVA::MethodBase::GetName
const char * GetName() const
Definition: MethodBase.h:325

TMVA::MethodBase::GetWeightFileDir
const TString & GetWeightFileDir() const
Definition: MethodBase.h:481

TMVA::MethodBase::GetMethodName
const TString & GetMethodName() const
Definition: MethodBase.h:322

TMVA::MethodBase::DataInfo
DataSetInfo & DataInfo() const
Definition: MethodBase.h:401

TMVA::MethodBase::TestClassification
virtual void TestClassification()
initialization
Definition: MethodBase.cxx:1116

TMVA::MethodBase::GetNVariables
UInt_t GetNVariables() const
Definition: MethodBase.h:336

TMVA::MethodBase::IsModelPersistence
Bool_t IsModelPersistence()
Definition: MethodBase.h:374

TMVA::MethodBase::NoErrorCalc
void NoErrorCalc(Double_t *const err, Double_t *const errUpper)
Definition: MethodBase.cxx:841

TMVA::MethodBase::GetInputLabel
const TString & GetInputLabel(Int_t i) const
Definition: MethodBase.h:341

TMVA::MethodBase::fRanking
Ranking * fRanking
Definition: MethodBase.h:576

TMVA::MethodBase::Data
DataSet * Data() const
Definition: MethodBase.h:400

TMVA::MethodPyGTB
Definition: MethodPyGTB.h:32

TMVA::MethodPyGTB::fSubsample
Double_t fSubsample
Definition: MethodPyGTB.h:98

TMVA::MethodPyGTB::fVerbose
Int_t fVerbose
Definition: MethodPyGTB.h:154

TMVA::MethodPyGTB::fMinSamplesSplit
Int_t fMinSamplesSplit
Definition: MethodPyGTB.h:106

TMVA::MethodPyGTB::pInit
PyObject * pInit
Definition: MethodPyGTB.h:125

TMVA::MethodPyGTB::fNestimators
Int_t fNestimators
Definition: MethodPyGTB.h:94

TMVA::MethodPyGTB::Train
void Train()
Definition: MethodPyGTB.cxx:337

TMVA::MethodPyGTB::pMinSamplesLeaf
PyObject * pMinSamplesLeaf
Definition: MethodPyGTB.h:109

TMVA::MethodPyGTB::fMinWeightFractionLeaf
Double_t fMinWeightFractionLeaf
Definition: MethodPyGTB.h:114

TMVA::MethodPyGTB::DeclareOptions
void DeclareOptions()
Definition: MethodPyGTB.cxx:128

TMVA::MethodPyGTB::mvaValues
std::vector< Double_t > mvaValues
Definition: MethodPyGTB.h:72

TMVA::MethodPyGTB::pMaxFeatures
PyObject * pMaxFeatures
Definition: MethodPyGTB.h:138

TMVA::MethodPyGTB::GetMvaValues
std::vector< Double_t > GetMvaValues(Long64_t firstEvt=0, Long64_t lastEvt=-1, Bool_t logProgress=false)
get all the MVA values for the events of the current Data type
Definition: MethodPyGTB.cxx:401

TMVA::MethodPyGTB::pMaxDepth
PyObject * pMaxDepth
Definition: MethodPyGTB.h:117

TMVA::MethodPyGTB::pMaxLeafNodes
PyObject * pMaxLeafNodes
Definition: MethodPyGTB.h:156

TMVA::MethodPyGTB::classValues
std::vector< Float_t > classValues
Definition: MethodPyGTB.h:73

TMVA::MethodPyGTB::fMaxDepth
Int_t fMaxDepth
Definition: MethodPyGTB.h:118

TMVA::MethodPyGTB::HasAnalysisType
Bool_t HasAnalysisType(Types::EAnalysisType type, UInt_t numberClasses, UInt_t numberTargets)
Definition: MethodPyGTB.cxx:119

TMVA::MethodPyGTB::fLearningRate
Double_t fLearningRate
Definition: MethodPyGTB.h:89

TMVA::MethodPyGTB::GetHelpMessage
void GetHelpMessage() const
Definition: MethodPyGTB.cxx:568

TMVA::MethodPyGTB::fMaxFeatures
TString fMaxFeatures
Definition: MethodPyGTB.h:139

TMVA::MethodPyGTB::MethodPyGTB
MethodPyGTB(const TString &jobName, const TString &methodTitle, DataSetInfo &theData, const TString &theOption="")
Definition: MethodPyGTB.cxx:70

TMVA::MethodPyGTB::ProcessOptions
void ProcessOptions()
Definition: MethodPyGTB.cxx:205

TMVA::MethodPyGTB::fRandomState
TString fRandomState
Definition: MethodPyGTB.h:132

TMVA::MethodPyGTB::fNoutputs
UInt_t fNoutputs
Definition: MethodPyGTB.h:76

TMVA::MethodPyGTB::pLearningRate
PyObject * pLearningRate
Definition: MethodPyGTB.h:88

TMVA::MethodPyGTB::~MethodPyGTB
~MethodPyGTB(void)
Definition: MethodPyGTB.cxx:114

TMVA::MethodPyGTB::CreateRanking
const Ranking * CreateRanking()
Definition: MethodPyGTB.cxx:548

TMVA::MethodPyGTB::TestClassification
virtual void TestClassification()
initialization
Definition: MethodPyGTB.cxx:395

TMVA::MethodPyGTB::GetMulticlassValues
std::vector< Float_t > & GetMulticlassValues()
Definition: MethodPyGTB.cxx:492

TMVA::MethodPyGTB::fMinSamplesLeaf
Int_t fMinSamplesLeaf
Definition: MethodPyGTB.h:110

TMVA::MethodPyGTB::fLoss
TString fLoss
Definition: MethodPyGTB.h:82

TMVA::MethodPyGTB::fInit
TString fInit
Definition: MethodPyGTB.h:126

TMVA::MethodPyGTB::ReadModelFromFile
virtual void ReadModelFromFile()
Definition: MethodPyGTB.cxx:521

TMVA::MethodPyGTB::pNestimators
PyObject * pNestimators
Definition: MethodPyGTB.h:93

TMVA::MethodPyGTB::fMaxLeafNodes
TString fMaxLeafNodes
Definition: MethodPyGTB.h:157

TMVA::MethodPyGTB::fNvars
UInt_t fNvars
Definition: MethodPyGTB.h:75

TMVA::MethodPyGTB::pVerbose
PyObject * pVerbose
Definition: MethodPyGTB.h:153

TMVA::MethodPyGTB::fWarmStart
Bool_t fWarmStart
Definition: MethodPyGTB.h:164

TMVA::MethodPyGTB::fFilenameClassifier
TString fFilenameClassifier
Definition: MethodPyGTB.h:77

TMVA::MethodPyGTB::pMinSamplesSplit
PyObject * pMinSamplesSplit
Definition: MethodPyGTB.h:105

TMVA::MethodPyGTB::pLoss
PyObject * pLoss
Definition: MethodPyGTB.h:81

TMVA::MethodPyGTB::pSubsample
PyObject * pSubsample
Definition: MethodPyGTB.h:97

TMVA::MethodPyGTB::pRandomState
PyObject * pRandomState
Definition: MethodPyGTB.h:131

TMVA::MethodPyGTB::pWarmStart
PyObject * pWarmStart
Definition: MethodPyGTB.h:163

TMVA::MethodPyGTB::pMinWeightFractionLeaf
PyObject * pMinWeightFractionLeaf
Definition: MethodPyGTB.h:113

TMVA::MethodPyGTB::Init
void Init()
Definition: MethodPyGTB.cxx:321

TMVA::MethodPyGTB::GetMvaValue
Double_t GetMvaValue(Double_t *errLower=0, Double_t *errUpper=0)
Definition: MethodPyGTB.cxx:460

TMVA::PyMethodBase
Definition: PyMethodBase.h:64

TMVA::PyMethodBase::PyIsInitialized
static int PyIsInitialized()
Check Python interpreter initialization status.
Definition: PyMethodBase.cxx:248

TMVA::PyMethodBase::fTrainData
PyArrayObject * fTrainData
Definition: PyMethodBase.h:122

TMVA::PyMethodBase::Eval
PyObject * Eval(TString code)
Evaluate Python code.
Definition: PyMethodBase.cxx:111

TMVA::PyMethodBase::PyInitialize
static void PyInitialize()
Initialize Python interpreter.
Definition: PyMethodBase.cxx:128

TMVA::PyMethodBase::Serialize
static void Serialize(TString file, PyObject *classifier)
Serialize Python object.
Definition: PyMethodBase.cxx:267

TMVA::PyMethodBase::fTrainDataWeights
PyArrayObject * fTrainDataWeights
Definition: PyMethodBase.h:123

TMVA::PyMethodBase::UnSerialize
static Int_t UnSerialize(TString file, PyObject **obj)
Unserialize Python object.
Definition: PyMethodBase.cxx:289

TMVA::PyMethodBase::fClassifier
PyObject * fClassifier
Definition: PyMethodBase.h:120

TMVA::PyMethodBase::fTrainDataClasses
PyArrayObject * fTrainDataClasses
Definition: PyMethodBase.h:124

TMVA::PyMethodBase::PyRunString
void PyRunString(TString code, TString errorMessage="Failed to run python code", int start=Py_single_input)
Execute Python code from string.
Definition: PyMethodBase.cxx:320

TMVA::PyMethodBase::fLocalNS
PyObject * fLocalNS
Definition: PyMethodBase.h:143

TMVA::Rank
Definition: Ranking.h:76

TMVA::Ranking
Ranking for variables in method (implementation)
Definition: Ranking.h:48

TMVA::Ranking::AddRank
virtual void AddRank(const Rank &rank)
Add a new rank take ownership of it.
Definition: Ranking.cxx:86

TMVA::Timer
Timing information for training and evaluation of MVA methods.
Definition: Timer.h:58

TMVA::Timer::GetElapsedTime
TString GetElapsedTime(Bool_t Scientific=kTRUE)
returns pretty string with elapsed time
Definition: Timer.cxx:134

TMVA::Tools::Color
const TString & Color(const TString &)
human readable color strings
Definition: Tools.cxx:840

TMVA::Types
Singleton class for Global types used by TMVA.
Definition: Types.h:73

TMVA::Types::kSignal
@ kSignal
Definition: Types.h:136

TMVA::Types::EAnalysisType
EAnalysisType
Definition: Types.h:127

TMVA::Types::kMulticlass
@ kMulticlass
Definition: Types.h:130

TMVA::Types::kClassification
@ kClassification
Definition: Types.h:128

TMVA::Types::kTraining
@ kTraining
Definition: Types.h:144

TString
Basic string class.
Definition: TString.h:131

TString::Data
const char * Data() const
Definition: TString.h:364

TString::IsNull
Bool_t IsNull() const
Definition: TString.h:402

TMVA
create variable transformations
Definition: GeneticMinimizer.h:21

TMVA::gTools
Tools & gTools()

TMVA::Endl
MsgLogger & Endl(MsgLogger &ml)
Definition: MsgLogger.h:158

Types.h