doc/v612/MethodPyGTB_8cxx_source.html

 // @(#)root/tmva/pymva $Id$
 // Authors: Omar Zapata, Lorenzo Moneta, Sergei Gleyzer 2015

 /**********************************************************************************
  * Project: TMVA - a Root-integrated toolkit for multivariate data analysis       *
  * Package: TMVA                                                                  *
  * Class  : MethodPyGTB                                                           *
  * Web    : http://oproject.org                                                   *
  *                                                                                *
  * Description:                                                                   *
  *      GradientBoostingClassifier Classifiear from Scikit learn                  *
  *                                                                                *
  *                                                                                *
  * Redistribution and use in source and binary forms, with or without             *
  * modification, are permitted according to the terms listed in LICENSE           *
  * (http://tmva.sourceforge.net/LICENSE)                                          *
  *                                                                                *
  **********************************************************************************/

 #include <Python.h>    // Needs to be included first to avoid redefinition of _POSIX_C_SOURCE
 #include "TMVA/MethodPyGTB.h"

 #define NPY_NO_DEPRECATED_API NPY_1_7_API_VERSION
 #include <numpy/arrayobject.h>

 #include "TMVA/Configurable.h"
 #include "TMVA/ClassifierFactory.h"
 #include "TMVA/Config.h"
 #include "TMVA/DataSet.h"
 #include "TMVA/Event.h"
 #include "TMVA/IMethod.h"
 #include "TMVA/MsgLogger.h"
 #include "TMVA/PDF.h"
 #include "TMVA/Ranking.h"
 #include "TMVA/Results.h"
 #include "TMVA/ResultsClassification.h"
 #include "TMVA/Tools.h"
 #include "TMVA/Types.h"
 #include "TMVA/Timer.h"
 #include "TMVA/VariableTransformBase.h"

 #include "Riostream.h"
 #include "TMath.h"
 #include "TMatrix.h"
 #include "TMatrixD.h"
 #include "TVectorD.h"

 #include <iomanip>
 #include <fstream>

 using namespace TMVA;

 REGISTER_METHOD(PyGTB)

 ClassImp(MethodPyGTB);

 //_______________________________________________________________________
 MethodPyGTB::MethodPyGTB(const TString &jobName,
                          const TString &methodTitle,
                          DataSetInfo &dsi,
                          const TString &theOption) :
    PyMethodBase(jobName, Types::kPyGTB, methodTitle, dsi, theOption),
    fLoss("deviance"),
    fLearningRate(0.1),
    fNestimators(100),
    fSubsample(1.0),
    fMinSamplesSplit(2),
    fMinSamplesLeaf(1),
    fMinWeightFractionLeaf(0.0),
    fMaxDepth(3),
    fInit("None"),
    fRandomState("None"),
    fMaxFeatures("None"),
    fVerbose(0),
    fMaxLeafNodes("None"),
    fWarmStart(kFALSE)
 {
 }

 //_______________________________________________________________________
 MethodPyGTB::MethodPyGTB(DataSetInfo &theData, const TString &theWeightFile)
    : PyMethodBase(Types::kPyGTB, theData, theWeightFile),
    fLoss("deviance"),
    fLearningRate(0.1),
    fNestimators(100),
    fSubsample(1.0),
    fMinSamplesSplit(2),
    fMinSamplesLeaf(1),
    fMinWeightFractionLeaf(0.0),
    fMaxDepth(3),
    fInit("None"),
    fRandomState("None"),
    fMaxFeatures("None"),
    fVerbose(0),
    fMaxLeafNodes("None"),
    fWarmStart(kFALSE)
 {
 }


 //_______________________________________________________________________
 MethodPyGTB::~MethodPyGTB(void)
 {
 }

 //_______________________________________________________________________
 Bool_t MethodPyGTB::HasAnalysisType(Types::EAnalysisType type, UInt_t numberClasses, UInt_t)
 {
    if (type == Types::kClassification && numberClasses == 2) return kTRUE;
    if (type == Types::kMulticlass && numberClasses >= 2) return kTRUE;
    return kFALSE;
 }


 //_______________________________________________________________________
 void MethodPyGTB::DeclareOptions()
 {
    MethodBase::DeclareCompatibilityOptions();

    DeclareOptionRef(fLoss, "Loss", "{'deviance', 'exponential'}, optional (default='deviance')\
       loss function to be optimized. 'deviance' refers to\
       deviance (= logistic regression) for classification\
       with probabilistic outputs. For loss 'exponential' gradient\
       boosting recovers the AdaBoost algorithm.");

    DeclareOptionRef(fLearningRate, "LearningRate", "float, optional (default=0.1)\
       learning rate shrinks the contribution of each tree by `learning_rate`.\
       There is a trade-off between learning_rate and n_estimators.");

    DeclareOptionRef(fNestimators, "NEstimators", "int (default=100)\
       The number of boosting stages to perform. Gradient boosting\
       is fairly robust to over-fitting so a large number usually\
       results in better performance.");

    DeclareOptionRef(fSubsample, "Subsample", "float, optional (default=1.0)\
       The fraction of samples to be used for fitting the individual base\
       learners. If smaller than 1.0 this results in Stochastic Gradient\
       Boosting. `subsample` interacts with the parameter `n_estimators`.\
       Choosing `subsample < 1.0` leads to a reduction of variance\
       and an increase in bias.");

    DeclareOptionRef(fMinSamplesSplit, "MinSamplesSplit", "integer, optional (default=2)\
       The minimum number of samples required to split an internal node.");

    DeclareOptionRef(fMinSamplesLeaf, "MinSamplesLeaf", "integer, optional (default=1) \
       The minimum number of samples in newly created leaves.  A split is \
       discarded if after the split, one of the leaves would contain less then \
       ``min_samples_leaf`` samples.");

    DeclareOptionRef(fMinWeightFractionLeaf, "MinWeightFractionLeaf", "//float, optional (default=0.) \
       The minimum weighted fraction of the input samples required to be at a \
       leaf node.");

    DeclareOptionRef(fMaxDepth, "MaxDepth", "integer or None, optional (default=None) \
       The maximum depth of the tree. If None, then nodes are expanded until \
       all leaves are pure or until all leaves contain less than \
       min_samples_split samples. \
       Ignored if ``max_leaf_nodes`` is not None.");

    DeclareOptionRef(fInit, "Init", "BaseEstimator, None, optional (default=None)\
       An estimator object that is used to compute the initial\
       predictions. ``init`` has to provide ``fit`` and ``predict``.\
       If None it uses ``loss.init_estimator`");

    DeclareOptionRef(fRandomState, "RandomState", "int, RandomState instance or None, optional (default=None)\
       If int, random_state is the seed used by the random number generator;\
       If RandomState instance, random_state is the random number generator;\
       If None, the random number generator is the RandomState instance used\
       by `np.random`.");

    DeclareOptionRef(fMaxFeatures, "MaxFeatures", "The number of features to consider when looking for the best split");

    DeclareOptionRef(fVerbose, "Verbose", "int, optional (default=0)\
       Controls the verbosity of the tree building process.");

    DeclareOptionRef(fMaxLeafNodes, "MaxLeafNodes", "int or None, optional (default=None)\
       Grow trees with ``max_leaf_nodes`` in best-first fashion.\
       Best nodes are defined as relative reduction in impurity.\
       If None then unlimited number of leaf nodes.\
       If not None then ``max_depth`` will be ignored.");

    DeclareOptionRef(fWarmStart, "WarmStart", "bool, optional (default=False)\
       When set to ``True``, reuse the solution of the previous call to fit\
       and add more estimators to the ensemble, otherwise, just fit a whole\
       new forest.");

    DeclareOptionRef(fFilenameClassifier, "FilenameClassifier",
       "Store trained classifier in this file");
 }

 //_______________________________________________________________________
 // Check options and load them to local python namespace
 void MethodPyGTB::ProcessOptions()
 {
    if (fLoss != "deviance" && fLoss != "exponential") {
       Log() << kFATAL << Form("Loss = %s ... that does not work!", fLoss.Data())
             << " The options are 'deviance' or 'exponential'." << Endl;
    }
    pLoss = Eval(Form("'%s'", fLoss.Data()));
    PyDict_SetItemString(fLocalNS, "loss", pLoss);

    if (fLearningRate <= 0) {
       Log() << kFATAL << "LearningRate <= 0 ... that does not work!" << Endl;
    }
    pLearningRate = Eval(Form("%f", fLearningRate));
    PyDict_SetItemString(fLocalNS, "learningRate", pLearningRate);

    if (fNestimators <= 0) {
       Log() << kFATAL << "NEstimators <= 0 ... that does not work!" << Endl;
    }
    pNestimators = Eval(Form("%i", fNestimators));
    PyDict_SetItemString(fLocalNS, "nEstimators", pNestimators);

    if (fMinSamplesSplit < 0) {
       Log() << kFATAL << "MinSamplesSplit < 0 ... that does not work!" << Endl;
    }
    pMinSamplesSplit = Eval(Form("%i", fMinSamplesSplit));
    PyDict_SetItemString(fLocalNS, "minSamplesSplit", pMinSamplesSplit);

    if (fSubsample < 0) {
       Log() << kFATAL << "Subsample < 0 ... that does not work!" << Endl;
    }
    pSubsample = Eval(Form("%f", fSubsample));
    PyDict_SetItemString(fLocalNS, "subsample", pSubsample);

    if (fMinSamplesLeaf < 0) {
       Log() << kFATAL << "MinSamplesLeaf < 0 ... that does not work!" << Endl;
    }
    pMinSamplesLeaf = Eval(Form("%i", fMinSamplesLeaf));
    PyDict_SetItemString(fLocalNS, "minSamplesLeaf", pMinSamplesLeaf);

    if (fMinSamplesSplit < 0) {
       Log() << kFATAL << "MinSamplesSplit < 0 ... that does not work!" << Endl;
    }
    pMinSamplesSplit = Eval(Form("%i", fMinSamplesSplit));
    PyDict_SetItemString(fLocalNS, "minSamplesSplit", pMinSamplesSplit);

    if (fMinWeightFractionLeaf < 0) {
       Log() << kFATAL << "MinWeightFractionLeaf < 0 ... that does not work !" << Endl;
    }
    pMinWeightFractionLeaf = Eval(Form("%f", fMinWeightFractionLeaf));
    PyDict_SetItemString(fLocalNS, "minWeightFractionLeaf", pMinWeightFractionLeaf);

    if (fMaxDepth <= 0) {
       Log() << kFATAL << " MaxDepth <= 0 ... that does not work !! " << Endl;
    }
    pMaxDepth = Eval(Form("%i", fMaxDepth));
    PyDict_SetItemString(fLocalNS, "maxDepth", pMaxDepth);

    pInit = Eval(fInit);
    if (!pInit) {
       Log() << kFATAL << Form("Init = %s ... that does not work!", fInit.Data())
             << " The options are None or BaseEstimator, which is an estimator object that"
             << "is used to compute the initial predictions. "
             << "'init' has to provide 'fit' and 'predict' methods."
             << " If None it uses 'loss.init_estimator'." << Endl;
    }
    PyDict_SetItemString(fLocalNS, "init", pInit);

    pRandomState = Eval(fRandomState);
    if (!pRandomState) {
       Log() << kFATAL << Form(" RandomState = %s ... that does not work! ", fRandomState.Data())
             << " If int, random_state is the seed used by the random number generator;"
             << " If RandomState instance, random_state is the random number generator;"
             << " If None, the random number generator is the RandomState instance used by 'np.random'."
             << Endl;
    }
    PyDict_SetItemString(fLocalNS, "randomState", pRandomState);

    if (fMaxFeatures == "auto" || fMaxFeatures == "sqrt" || fMaxFeatures == "log2"){
       fMaxFeatures = Form("'%s'", fMaxFeatures.Data());
    }
    pMaxFeatures = Eval(fMaxFeatures);
    PyDict_SetItemString(fLocalNS, "maxFeatures", pMaxFeatures);

    if (!pMaxFeatures) {
       Log() << kFATAL << Form(" MaxFeatures = %s... that does not work !! ", fMaxFeatures.Data())
             << "int, float, string or None, optional (default='auto')"
             << "The number of features to consider when looking for the best split:"
             << "If int, then consider `max_features` features at each split."
             << "If float, then `max_features` is a percentage and"
             << "`int(max_features * n_features)` features are considered at each split."
             << "If 'auto', then `max_features=sqrt(n_features)`."
             << "If 'sqrt', then `max_features=sqrt(n_features)`."
             << "If 'log2', then `max_features=log2(n_features)`."
             << "If None, then `max_features=n_features`." << Endl;
    }

    pMaxLeafNodes = Eval(fMaxLeafNodes);
    if (!pMaxLeafNodes) {
       Log() << kFATAL << Form(" MaxLeafNodes = %s... that does not work!", fMaxLeafNodes.Data())
             << " The options are None or integer." << Endl;
    }
    PyDict_SetItemString(fLocalNS, "maxLeafNodes", pMaxLeafNodes);

    pVerbose = Eval(Form("%i", fVerbose));
    PyDict_SetItemString(fLocalNS, "verbose", pVerbose);

    pWarmStart = Eval(Form("%i", UInt_t(fWarmStart)));
    PyDict_SetItemString(fLocalNS, "warmStart", pWarmStart);

    // If no filename is given, set default
    if(fFilenameClassifier.IsNull()) {
       fFilenameClassifier = GetWeightFileDir() + "/PyGTBModel_" + GetName() + ".PyData";
    }
 }

 //_______________________________________________________________________
 void  MethodPyGTB::Init()
 {
    _import_array(); //require to use numpy arrays

    // Check options and load them to local python namespace
    ProcessOptions();

    // Import module for gradient tree boosting classifier
    PyRunString("import sklearn.ensemble");

    // Get data properties
    fNvars = GetNVariables();
    fNoutputs = DataInfo().GetNClasses();
 }

 void MethodPyGTB::Train()
 {
    // Load training data (data, classes, weights) to python arrays
    int fNrowsTraining = Data()->GetNTrainingEvents(); //every row is an event, a class type and a weight
    npy_intp dimsData[2];
    dimsData[0] = fNrowsTraining;
    dimsData[1] = fNvars;
    fTrainData = (PyArrayObject *)PyArray_SimpleNew(2, dimsData, NPY_FLOAT);
    PyDict_SetItemString(fLocalNS, "trainData", (PyObject*)fTrainData);
    float *TrainData = (float *)(PyArray_DATA(fTrainData));

    npy_intp dimsClasses = (npy_intp) fNrowsTraining;
    fTrainDataClasses = (PyArrayObject *)PyArray_SimpleNew(1, &dimsClasses, NPY_FLOAT);
    PyDict_SetItemString(fLocalNS, "trainDataClasses", (PyObject*)fTrainDataClasses);
    float *TrainDataClasses = (float *)(PyArray_DATA(fTrainDataClasses));

    fTrainDataWeights = (PyArrayObject *)PyArray_SimpleNew(1, &dimsClasses, NPY_FLOAT);
    PyDict_SetItemString(fLocalNS, "trainDataWeights", (PyObject*)fTrainDataWeights);
    float *TrainDataWeights = (float *)(PyArray_DATA(fTrainDataWeights));

    for (int i = 0; i < fNrowsTraining; i++) {
       // Fill training data matrix
       const TMVA::Event *e = Data()->GetTrainingEvent(i);
       for (UInt_t j = 0; j < fNvars; j++) {
          TrainData[j + i * fNvars] = e->GetValue(j);
       }

       // Fill target classes
       TrainDataClasses[i] = e->GetClass();

       // Get event weight
       TrainDataWeights[i] = e->GetWeight();
    }

    // Create classifier object
    PyRunString("classifier = sklearn.ensemble.GradientBoostingClassifier(loss=loss, learning_rate=learningRate, n_estimators=nEstimators, max_depth=maxDepth, min_samples_split=minSamplesSplit, min_samples_leaf=minSamplesLeaf, min_weight_fraction_leaf=minWeightFractionLeaf, subsample=subsample, max_features=maxFeatures, max_leaf_nodes=maxLeafNodes, init=init, verbose=verbose, warm_start=warmStart, random_state=randomState)",
       "Failed to setup classifier");

    // Fit classifier
    // NOTE: We dump the output to a variable so that the call does not pollute stdout
    PyRunString("dump = classifier.fit(trainData, trainDataClasses, trainDataWeights)", "Failed to train classifier");

    // Store classifier
    fClassifier = PyDict_GetItemString(fLocalNS, "classifier");
    if(fClassifier == 0) {
       Log() << kFATAL << "Can't create classifier object from GradientBoostingClassifier" << Endl;
       Log() << Endl;
    }

    if (IsModelPersistence()) {
       Log() << Endl;
       Log() << gTools().Color("bold") << "Saving state file: " << gTools().Color("reset") << fFilenameClassifier << Endl;
       Log() << Endl;
       Serialize(fFilenameClassifier, fClassifier);
    }
 }

 //_______________________________________________________________________
 void MethodPyGTB::TestClassification()
 {
    MethodBase::TestClassification();
 }

 //_______________________________________________________________________
 std::vector<Double_t> MethodPyGTB::GetMvaValues(Long64_t firstEvt, Long64_t lastEvt, Bool_t)
 {
    // Load model if not already done
    if (fClassifier == 0) ReadModelFromFile();

    // Determine number of events
    Long64_t nEvents = Data()->GetNEvents();
    if (firstEvt > lastEvt || lastEvt > nEvents) lastEvt = nEvents;
    if (firstEvt < 0) firstEvt = 0;
    nEvents = lastEvt-firstEvt;

    // Get data
    npy_intp dims[2];
    dims[0] = nEvents;
    dims[1] = fNvars;
    PyArrayObject *pEvent= (PyArrayObject *)PyArray_SimpleNew(2, dims, NPY_FLOAT);
    float *pValue = (float *)(PyArray_DATA(pEvent));

    for (Int_t ievt=0; ievt<nEvents; ievt++) {
       Data()->SetCurrentEvent(ievt);
       const TMVA::Event *e = Data()->GetEvent();
       for (UInt_t i = 0; i < fNvars; i++) {
          pValue[ievt * fNvars + i] = e->GetValue(i);
       }
    }

    // Get prediction from classifier
    PyArrayObject *result = (PyArrayObject *)PyObject_CallMethod(fClassifier, const_cast<char *>("predict_proba"), const_cast<char *>("(O)"), pEvent);
    double *proba = (double *)(PyArray_DATA(result));

    // Return signal probabilities
    if(Long64_t(mvaValues.size()) != nEvents) mvaValues.resize(nEvents);
    for (int i = 0; i < nEvents; ++i) {
       mvaValues[i] = proba[fNoutputs*i + TMVA::Types::kSignal];
    }

    Py_DECREF(pEvent);
    Py_DECREF(result);

    return mvaValues;
 }

 //_______________________________________________________________________
 Double_t MethodPyGTB::GetMvaValue(Double_t *errLower, Double_t *errUpper)
 {
    // cannot determine error
    NoErrorCalc(errLower, errUpper);

    // Load model if not already done
    if (fClassifier == 0) ReadModelFromFile();

    // Get current event and load to python array
    const TMVA::Event *e = Data()->GetEvent();
    npy_intp dims[2];
    dims[0] = 1;
    dims[1] = fNvars;
    PyArrayObject *pEvent= (PyArrayObject *)PyArray_SimpleNew(2, dims, NPY_FLOAT);
    float *pValue = (float *)(PyArray_DATA(pEvent));
    for (UInt_t i = 0; i < fNvars; i++) pValue[i] = e->GetValue(i);

    // Get prediction from classifier
    PyArrayObject *result = (PyArrayObject *)PyObject_CallMethod(fClassifier, const_cast<char *>("predict_proba"), const_cast<char *>("(O)"), pEvent);
    double *proba = (double *)(PyArray_DATA(result));

    // Return MVA value
    Double_t mvaValue;
    mvaValue = proba[TMVA::Types::kSignal]; // getting signal probability

    Py_DECREF(result);
    Py_DECREF(pEvent);

    return mvaValue;
 }

 //_______________________________________________________________________
 std::vector<Float_t>& MethodPyGTB::GetMulticlassValues()
 {
    // Load model if not already done
    if (fClassifier == 0) ReadModelFromFile();

    // Get current event and load to python array
    const TMVA::Event *e = Data()->GetEvent();
    npy_intp dims[2];
    dims[0] = 1;
    dims[1] = fNvars;
    PyArrayObject *pEvent= (PyArrayObject *)PyArray_SimpleNew(2, dims, NPY_FLOAT);
    float *pValue = (float *)(PyArray_DATA(pEvent));
    for (UInt_t i = 0; i < fNvars; i++) pValue[i] = e->GetValue(i);

    // Get prediction from classifier
    PyArrayObject *result = (PyArrayObject *)PyObject_CallMethod(fClassifier, const_cast<char *>("predict_proba"), const_cast<char *>("(O)"), pEvent);
    double *proba = (double *)(PyArray_DATA(result));

    // Return MVA values
    if(UInt_t(classValues.size()) != fNoutputs) classValues.resize(fNoutputs);
    for(UInt_t i = 0; i < fNoutputs; i++) classValues[i] = proba[i];

    Py_DECREF(pEvent);
    Py_DECREF(result);

    return classValues;
 }

 //_______________________________________________________________________
 void MethodPyGTB::ReadModelFromFile()
 {
    if (!PyIsInitialized()) {
       PyInitialize();
    }

    Log() << Endl;
    Log() << gTools().Color("bold") << "Loading state file: " << gTools().Color("reset") << fFilenameClassifier << Endl;
    Log() << Endl;

    // Load classifier from file
    Int_t err = UnSerialize(fFilenameClassifier, &fClassifier);
    if(err != 0)
    {
        Log() << kFATAL << Form("Failed to load classifier from file (error code: %i): %s", err, fFilenameClassifier.Data()) << Endl;
    }

    // Book classifier object in python dict
    PyDict_SetItemString(fLocalNS, "classifier", fClassifier);

    // Load data properties
    // NOTE: This has to be repeated here for the reader application
    fNvars = GetNVariables();
    fNoutputs = DataInfo().GetNClasses();
 }

 //_______________________________________________________________________
 const Ranking* MethodPyGTB::CreateRanking()
 {
    // Get feature importance from classifier as an array with length equal
    // number of variables, higher value signals a higher importance
    PyArrayObject* pRanking = (PyArrayObject*) PyObject_GetAttrString(fClassifier, "feature_importances_");
    if(pRanking == 0) Log() << kFATAL << "Failed to get ranking from classifier" << Endl;

    // Fill ranking object and return it
    fRanking = new Ranking(GetName(), "Variable Importance");
    Double_t* rankingData = (Double_t*) PyArray_DATA(pRanking);
    for(UInt_t iVar=0; iVar<fNvars; iVar++){
       fRanking->AddRank(Rank(GetInputLabel(iVar), rankingData[iVar]));
    }

    Py_DECREF(pRanking);

    return fRanking;
 }

 //_______________________________________________________________________
 void MethodPyGTB::GetHelpMessage() const
 {
    // typical length of text line:
    //       "|--------------------------------------------------------------|"
    Log() << "A gradient tree boosting classifier builds a model from an ensemble" << Endl;
    Log() << "of decision trees, which are adapted each boosting step to fit better" << Endl;
    Log() << "to previously misclassified events." << Endl;
    Log() << Endl;
    Log() << "Check out the scikit-learn documentation for more information." << Endl;
 }


TMVA::MethodPyGTB::fSubsample
Double_t fSubsample
Definition: MethodPyGTB.h:98

TMVA::MethodPyGTB::fVerbose
Int_t fVerbose
Definition: MethodPyGTB.h:154

TMVA::MethodPyGTB::pNestimators
PyObject * pNestimators
Definition: MethodPyGTB.h:93

TMVA::MethodPyGTB::fMinSamplesSplit
Int_t fMinSamplesSplit
Definition: MethodPyGTB.h:106

TMVA::DataSet::SetCurrentEvent
void SetCurrentEvent(Long64_t ievt) const
Definition: DataSet.h:99

TMVA::Endl
MsgLogger & Endl(MsgLogger &ml)
Definition: MsgLogger.h:158

TMVA::Types
Singleton class for Global types used by TMVA.
Definition: Types.h:73

Long64_t
long long Long64_t
Definition: RtypesCore.h:69

TMVA::MethodPyGTB::fLoss
TString fLoss
Definition: MethodPyGTB.h:82

TMVA::PyMethodBase::fClassifier
PyObject * fClassifier
Definition: PyMethodBase.h:120

TMVA::MethodPyGTB::pMaxFeatures
PyObject * pMaxFeatures
Definition: MethodPyGTB.h:138

TMVA::MethodPyGTB::ProcessOptions
void ProcessOptions()
Definition: MethodPyGTB.cxx:193

TMVA::MethodPyGTB::GetMvaValue
Double_t GetMvaValue(Double_t *errLower=0, Double_t *errUpper=0)
Definition: MethodPyGTB.cxx:431

ResultsClassification.h

TMVA::Configurable::Log
MsgLogger & Log() const
Definition: Configurable.h:122

TMVA::Configurable::DeclareOptionRef
OptionBase * DeclareOptionRef(T &ref, const TString &name, const TString &desc="")

TMVA::Types::EAnalysisType
EAnalysisType
Definition: Types.h:125

TMVA::MethodPyGTB::pMinSamplesSplit
PyObject * pMinSamplesSplit
Definition: MethodPyGTB.h:105

TMVA::Types::kMulticlass
Definition: Types.h:128

TMVA::MethodPyGTB::pWarmStart
PyObject * pWarmStart
Definition: MethodPyGTB.h:163

TMVA::Ranking
Ranking for variables in method (implementation)
Definition: Ranking.h:48

Int_t
int Int_t
Definition: RtypesCore.h:41

Bool_t
bool Bool_t
Definition: RtypesCore.h:59

TMVA::PyMethodBase
Definition: PyMethodBase.h:64

TMVA::DataSetInfo::GetNClasses
UInt_t GetNClasses() const
Definition: DataSetInfo.h:136

TMVA::MethodPyGTB::DeclareOptions
void DeclareOptions()
Definition: MethodPyGTB.cxx:116

TMVA::PyMethodBase::Serialize
static void Serialize(TString file, PyObject *classifier)
Serialize Python object.
Definition: PyMethodBase.cxx:265

TMVA::MethodPyGTB::pRandomState
PyObject * pRandomState
Definition: MethodPyGTB.h:131

TMVA::PyMethodBase::fTrainDataClasses
PyArrayObject * fTrainDataClasses
Definition: PyMethodBase.h:124

TMVA::PyMethodBase::PyIsInitialized
static int PyIsInitialized()
Check Python interpreter initialization status.
Definition: PyMethodBase.cxx:246

TMVA::MethodPyGTB::fInit
TString fInit
Definition: MethodPyGTB.h:126

Config.h

TMVA::PyMethodBase::PyInitialize
static void PyInitialize()
Initialize Python interpreter.
Definition: PyMethodBase.cxx:125

TMVA::MethodBase::GetInputLabel
const TString & GetInputLabel(Int_t i) const
Definition: MethodBase.h:339

TMVA::MethodBase::GetWeightFileDir
const TString & GetWeightFileDir() const
Definition: MethodBase.h:479

TVectorD.h

Timer.h

PDF.h

TMVA::PyMethodBase::PyRunString
void PyRunString(TString code, TString errorMessage="Failed to run python code", int start=Py_single_input)
Execute Python code from string.
Definition: PyMethodBase.cxx:318

TMVA::MethodPyGTB::pInit
PyObject * pInit
Definition: MethodPyGTB.h:125

TMVA::MethodPyGTB::GetHelpMessage
void GetHelpMessage() const
Definition: MethodPyGTB.cxx:539

TMVA::MethodPyGTB::pVerbose
PyObject * pVerbose
Definition: MethodPyGTB.h:153

TMVA::MethodBase::Data
DataSet * Data() const
Definition: MethodBase.h:398

TMVA::MethodPyGTB::fNvars
UInt_t fNvars
Definition: MethodPyGTB.h:75

TMVA::MethodPyGTB::~MethodPyGTB
~MethodPyGTB(void)
Definition: MethodPyGTB.cxx:102

TMVA::MethodPyGTB::fFilenameClassifier
TString fFilenameClassifier
Definition: MethodPyGTB.h:77

TMVA::Event::GetClass
UInt_t GetClass() const
Definition: Event.h:81

TMVA::PyMethodBase::Eval
PyObject * Eval(TString code)
Evaluate Python code.
Definition: PyMethodBase.cxx:108

TMVA::MethodPyGTB::fMinSamplesLeaf
Int_t fMinSamplesLeaf
Definition: MethodPyGTB.h:110

TMVA::MethodBase::DataInfo
DataSetInfo & DataInfo() const
Definition: MethodBase.h:399

TMVA::MethodPyGTB::pMaxDepth
PyObject * pMaxDepth
Definition: MethodPyGTB.h:117

TMVA::DataSetInfo
Class that contains all the data information.
Definition: DataSetInfo.h:60

TMVA::PyMethodBase::fTrainDataWeights
PyArrayObject * fTrainDataWeights
Definition: PyMethodBase.h:123

TMVA::MethodPyGTB::Train
void Train()
Definition: MethodPyGTB.cxx:324

TMVA::Event::GetWeight
Double_t GetWeight() const
return the event weight - depending on whether the flag IgnoreNegWeightsInTraining is or not...
Definition: Event.cxx:382

TMVA::DataSet::GetNTrainingEvents
Long64_t GetNTrainingEvents() const
Definition: DataSet.h:79

DataSet.h

TMVA::MethodPyGTB::pSubsample
PyObject * pSubsample
Definition: MethodPyGTB.h:97

Types.h

Ranking.h

TMVA::DataSet::GetTrainingEvent
const Event * GetTrainingEvent(Long64_t ievt) const
Definition: DataSet.h:85

TMVA::MethodPyGTB::mvaValues
std::vector< Double_t > mvaValues
Definition: MethodPyGTB.h:72

TMVA::MethodPyGTB
Definition: MethodPyGTB.h:32

TMVA::MethodPyGTB::HasAnalysisType
Bool_t HasAnalysisType(Types::EAnalysisType type, UInt_t numberClasses, UInt_t numberTargets)
Definition: MethodPyGTB.cxx:107

TMVA::MethodPyGTB::CreateRanking
const Ranking * CreateRanking()
Definition: MethodPyGTB.cxx:519

TMVA::MethodBase::GetName
const char * GetName() const
Definition: MethodBase.h:323

TMVA::Event
Definition: Event.h:52

UInt_t
unsigned int UInt_t
Definition: RtypesCore.h:42

Form
char * Form(const char *fmt,...)

TMVA::Types::kClassification
Definition: Types.h:126

TMVA::PyMethodBase::fTrainData
PyArrayObject * fTrainData
Definition: PyMethodBase.h:122

MsgLogger.h

TMVA::MethodPyGTB::pLoss
PyObject * pLoss
Definition: MethodPyGTB.h:81

TMVA::gTools
Tools & gTools()

TMVA::MethodPyGTB::Init
void Init()
Definition: MethodPyGTB.cxx:309

TMVA::MethodPyGTB::fLearningRate
Double_t fLearningRate
Definition: MethodPyGTB.h:89

Riostream.h

TMVA::MethodBase::GetNVariables
UInt_t GetNVariables() const
Definition: MethodBase.h:334

kFALSE
const Bool_t kFALSE
Definition: RtypesCore.h:88

TMVA::Event::GetValue
Float_t GetValue(UInt_t ivar) const
return value of i&#39;th variable
Definition: Event.cxx:237

IMethod.h

ClassImp
#define ClassImp(name)
Definition: Rtypes.h:359

TMVA::PyMethodBase::UnSerialize
static Int_t UnSerialize(TString file, PyObject **obj)
Unserialize Python object.
Definition: PyMethodBase.cxx:287

Double_t
double Double_t
Definition: RtypesCore.h:55

TMVA::MethodPyGTB::fNoutputs
UInt_t fNoutputs
Definition: MethodPyGTB.h:76

type
int type
Definition: TGX11.cxx:120

Event.h

TMVA::MethodPyGTB::fWarmStart
Bool_t fWarmStart
Definition: MethodPyGTB.h:164

TMVA::MethodPyGTB::ReadModelFromFile
virtual void ReadModelFromFile()
Definition: MethodPyGTB.cxx:492

e
you should not use this method at all Int_t Int_t Double_t Double_t Double_t e
Definition: TRolke.cxx:630

TMVA::MethodPyGTB::pMinWeightFractionLeaf
PyObject * pMinWeightFractionLeaf
Definition: MethodPyGTB.h:113

TMVA::MethodPyGTB::GetMulticlassValues
std::vector< Float_t > & GetMulticlassValues()
Definition: MethodPyGTB.cxx:463

TMVA::MethodPyGTB::fNestimators
Int_t fNestimators
Definition: MethodPyGTB.h:94

TMVA::Rank
Definition: Ranking.h:76

TMVA::Tools::Color
const TString & Color(const TString &)
human readable color strings
Definition: Tools.cxx:839

Results.h

REGISTER_METHOD
#define REGISTER_METHOD(CLASS)
for example
Definition: ClassifierFactory.h:124

TMVA
Abstract ClassifierFactory template that handles arbitrary types.
Definition: GeneticMinimizer.h:21

TMVA::MethodBase::fRanking
Ranking * fRanking
Definition: MethodBase.h:574

VariableTransformBase.h

TMVA::MethodPyGTB::fMinWeightFractionLeaf
Double_t fMinWeightFractionLeaf
Definition: MethodPyGTB.h:114

Tools.h

TMatrixD.h

TMVA::Ranking::AddRank
virtual void AddRank(const Rank &rank)
Add a new rank take ownership of it.
Definition: Ranking.cxx:86

TMVA::MethodBase::DeclareCompatibilityOptions
virtual void DeclareCompatibilityOptions()
options that are used ONLY for the READER to ensure backward compatibility they are hence without any...
Definition: MethodBase.cxx:601

TMVA::PyMethodBase::fLocalNS
PyObject * fLocalNS
Definition: PyMethodBase.h:143

TMVA::MethodPyGTB::fMaxDepth
Int_t fMaxDepth
Definition: MethodPyGTB.h:118

TMVA::MethodPyGTB::fMaxFeatures
TString fMaxFeatures
Definition: MethodPyGTB.h:139

TMVA::DataSet::GetNEvents
Long64_t GetNEvents(Types::ETreeType type=Types::kMaxTreeType) const
Definition: DataSet.h:215

TMatrix.h

MethodPyGTB.h

TMVA::MethodPyGTB::pLearningRate
PyObject * pLearningRate
Definition: MethodPyGTB.h:88

Configurable.h

TMVA::MethodPyGTB::pMinSamplesLeaf
PyObject * pMinSamplesLeaf
Definition: MethodPyGTB.h:109

TMath.h

TMVA::MethodPyGTB::GetMvaValues
std::vector< Double_t > GetMvaValues(Long64_t firstEvt=0, Long64_t lastEvt=-1, Bool_t logProgress=false)
get all the MVA values for the events of the current Data type
Definition: MethodPyGTB.cxx:388

TMVA::MethodPyGTB::fRandomState
TString fRandomState
Definition: MethodPyGTB.h:132

ClassifierFactory.h

kTRUE
const Bool_t kTRUE
Definition: RtypesCore.h:87

TMVA::MethodPyGTB::MethodPyGTB
MethodPyGTB(const TString &jobName, const TString &methodTitle, DataSetInfo &theData, const TString &theOption="")
Definition: MethodPyGTB.cxx:58

TMVA::MethodBase::TestClassification
virtual void TestClassification()
initialization
Definition: MethodBase.cxx:1084

TMVA::MethodPyGTB::pMaxLeafNodes
PyObject * pMaxLeafNodes
Definition: MethodPyGTB.h:156

TMVA::MethodPyGTB::TestClassification
virtual void TestClassification()
initialization
Definition: MethodPyGTB.cxx:382

TMVA::DataSet::GetEvent
const Event * GetEvent() const
Definition: DataSet.cxx:202

PyObject
_object PyObject
Definition: TPyArg.h:20

TMVA::MethodBase::NoErrorCalc
void NoErrorCalc(Double_t *const err, Double_t *const errUpper)
Definition: MethodBase.cxx:829

TMVA::MethodPyGTB::fMaxLeafNodes
TString fMaxLeafNodes
Definition: MethodPyGTB.h:157

TMVA::MethodPyGTB::classValues
std::vector< Float_t > classValues
Definition: MethodPyGTB.h:73

TMVA::Types::kSignal
Definition: Types.h:134

TMVA::MethodBase::IsModelPersistence
Bool_t IsModelPersistence()
Definition: MethodBase.h:372