doc/master/RuleFitAPI_8cxx_source.html

// @(#)root/tmva $Id$

// Author: Andreas Hoecker, Joerg Stelzer, Fredrik Tegenfeldt, Helge Voss


/**********************************************************************************

 * Project: TMVA - a Root-integrated toolkit for multivariate data analysis       *

 * Package: TMVA                                                                  *

 * Class  : RuleFitAPI                                                            *

 *                                             *

 *                                                                                *

 * Description:                                                                   *

 *      Implementation (see header file for description)                          *

 *                                                                                *

 * Authors (alphabetical):                                                        *

 *      Fredrik Tegenfeldt <Fredrik.Tegenfeldt@cern.ch>  - Iowa State U., USA     *

 *                                                                                *

 * Copyright (c) 2005:                                                            *

 *      CERN, Switzerland                                                         *

 *      Iowa State U.                                                             *

 *      MPI-KP Heidelberg, Germany                                                *

 *                                                                                *

 * Redistribution and use in source and binary forms, with or without             *

 * modification, are permitted according to the terms listed in LICENSE           *

 * (see tmva/doc/LICENSE)                                          *

 **********************************************************************************/


/*! \class TMVA::RuleFitAPI

\ingroup TMVA

J Friedman's RuleFit method

*/


#include "TMVA/RuleFitAPI.h"


#include "TMVA/DataSet.h"

#include "TMVA/DataSetInfo.h"

#include "TMVA/MethodRuleFit.h"

#include "TMVA/RuleFit.h"

#include "TMVA/Timer.h"

#include "TMVA/Tools.h"

#include "TMVA/Types.h"

#include "TMVA/VariableInfo.h"


#include "TSystem.h"


#include <algorithm>


ClassImp(TMVA::RuleFitAPI);


TMVA::RuleFitAPI::RuleFitAPI( const MethodRuleFit *rfbase,

                              RuleFit *rulefit,

                              EMsgType minType = kINFO ) :

fMethodRuleFit(rfbase),

   fRuleFit(rulefit),

   fRFProgram(kRfTrain),

   fLogger("RuleFitAPI",minType)

{

   // standard constructor

   if (rfbase) {

      SetRFWorkDir(rfbase->GetRFWorkDir());

   } else {

      SetRFWorkDir("./rulefit");

   }

   InitRuleFit();

}


////////////////////////////////////////////////////////////////////////////////

/// destructor


TMVA::RuleFitAPI::~RuleFitAPI()

{

}


////////////////////////////////////////////////////////////////////////////////

/// welcome message


void TMVA::RuleFitAPI::WelcomeMessage()

{

   fLogger << kINFO

           << "\n"

           << "---------------------------------------------------------------------------\n"

           << "-   You are running the interface to Jerome Friedmans RuleFit(tm) code.   -\n"

           << "-   For a full manual see the following web page:                         -\n"

           << "-                                                                         -\n"

           << "-        http://www-stat.stanford.edu/~jhf/R-RuleFit.html                 -\n"

           << "-                                                                         -\n"

           << "---------------------------------------------------------------------------"

           << Endl;

}

////////////////////////////////////////////////////////////////////////////////

/// howto message


void TMVA::RuleFitAPI::HowtoSetupRF()

{

   fLogger << kINFO

           << "\n"

           << "------------------------ RULEFIT-JF INTERFACE SETUP -----------------------\n"

           << "\n"

           << "1. Create a rulefit directory in your current work directory:\n"

           << "       mkdir " << fRFWorkDir << "\n\n"

           << "   the directory may be set using the option RuleFitDir\n"

           << "\n"

           << "2. Copy (or make a link) the file rf_go.exe into this directory\n"

           << "\n"

           << "The file can be obtained from Jerome Friedmans homepage (linux):\n"

           << "   wget http://www-stat.stanford.edu/~jhf/r-rulefit/linux/rf_go.exe\n"

           << "\n"

           << "Don't forget to do:\n"

           << "   chmod +x rf_go.exe\n"

           << "\n"

           << "For Windows download:\n"

           << "   http://www-stat.stanford.edu/~jhf/r-rulefit/windows/rf_go.exe\n"

           << "\n"

           << "NOTE: other platforms are not supported (see Friedmans homepage)\n"

           << "\n"

           << "---------------------------------------------------------------------------\n"

           << Endl;

}

////////////////////////////////////////////////////////////////////////////////

/// default initialisation

///   SetRFWorkDir("./rulefit");


void TMVA::RuleFitAPI::InitRuleFit()

{

   CheckRFWorkDir();

   FillIntParmsDef();

   FillRealParmsDef();

}


////////////////////////////////////////////////////////////////////////////////

/// import setup from MethodRuleFit


void TMVA::RuleFitAPI::ImportSetup()

{

   fRFIntParms.p            = fMethodRuleFit->DataInfo().GetNVariables();

   fRFIntParms.max_rules    = fMethodRuleFit->GetRFNrules();

   fRFIntParms.tree_size    = fMethodRuleFit->GetRFNendnodes();

   fRFIntParms.path_steps   = fMethodRuleFit->GetGDNPathSteps();

   //

   fRFRealParms.path_inc    = fMethodRuleFit->GetGDPathStep();

   fRFRealParms.samp_fract  = fMethodRuleFit->GetTreeEveFrac();

   fRFRealParms.trim_qntl   = fMethodRuleFit->GetLinQuantile();

   fRFRealParms.conv_fac    = fMethodRuleFit->GetGDErrScale();

   //

   if      (fRuleFit->GetRuleEnsemblePtr()->DoOnlyLinear() )

      fRFIntParms.lmode = kRfLinear;

   else if (fRuleFit->GetRuleEnsemblePtr()->DoOnlyRules() )

      fRFIntParms.lmode = kRfRules;

   else

      fRFIntParms.lmode = kRfBoth;

}


////////////////////////////////////////////////////////////////////////////////

/// set the directory containing rf_go.exe.


void TMVA::RuleFitAPI::SetRFWorkDir(const char * wdir)

{

   fRFWorkDir = wdir;

}


////////////////////////////////////////////////////////////////////////////////

/// check if the rulefit work dir is properly setup.

/// it aborts (kFATAL) if not.

///

/// Check existence of directory


void TMVA::RuleFitAPI::CheckRFWorkDir()

{

   TString oldDir = gSystem->pwd();

   if (!gSystem->cd(fRFWorkDir)) {

      fLogger << kWARNING << "Must create a rulefit directory named : " << fRFWorkDir << Endl;

      HowtoSetupRF();

      fLogger << kFATAL << "Setup failed - aborting!" << Endl;

   }

   // check rf_go.exe

   FILE *f = fopen("rf_go.exe","r");

   if (f==0) {

      fLogger << kWARNING << "No rf_go.exe file in directory : " << fRFWorkDir << Endl;

      HowtoSetupRF();

      fLogger << kFATAL << "Setup failed - aborting!" << Endl;

   }

   fclose(f);

   gSystem->cd(oldDir.Data());

}


////////////////////////////////////////////////////////////////////////////////

/// set the training parameters


void TMVA::RuleFitAPI::SetTrainParms()

{

   ImportSetup();

   //

   Int_t    n    = fMethodRuleFit->Data()->GetNTrainingEvents();

   //   Double_t neff = Double_t(n); // When weights are added: should be sum(wt)^2/sum(wt^2)

   fRFIntParms.n = n; // number of data points in tree

   fRFProgram    = kRfTrain;

}


////////////////////////////////////////////////////////////////////////////////

/// set the test params


void TMVA::RuleFitAPI::SetTestParms()

{

   ImportSetup();

   Int_t    n    = fMethodRuleFit->Data()->GetNTestEvents();

   //   Double_t neff = Double_t(n); // When weights are added: should be sum(wt)^2/sum(wt^2)

   fRFIntParms.n = n; // number of data points in tree

   fRFProgram    = kRfPredict;

}


////////////////////////////////////////////////////////////////////////////////

/// set default real params


void TMVA::RuleFitAPI::FillRealParmsDef()

{

   fRFRealParms.xmiss       = 9.0e30;

   fRFRealParms.trim_qntl   = 0.025;

   fRFRealParms.huber       = 0.8;

   fRFRealParms.inter_supp  = 3.0;

   fRFRealParms.memory_par  = 0.01;

   fRFRealParms.samp_fract  = 0.5; // calculated later

   fRFRealParms.path_inc    = 0.01;

   fRFRealParms.conv_fac    = 1.1;

}


////////////////////////////////////////////////////////////////////////////////

/// set default int params


void TMVA::RuleFitAPI::FillIntParmsDef()

{

   fRFIntParms.mode           = (int)kRfClass;

   fRFIntParms.lmode          = (int)kRfBoth;

   //   fRFIntParms.n;

   //   fRFIntParms.p;

   fRFIntParms.max_rules      = 2000;

   fRFIntParms.tree_size      = 4;

   fRFIntParms.path_speed     = 2;

   fRFIntParms.path_xval      = 3;

   fRFIntParms.path_steps     = 50000;

   fRFIntParms.path_testfreq  = 100;

   fRFIntParms.tree_store     = 10000000;

   fRFIntParms.cat_store      = 1000000;


}


////////////////////////////////////////////////////////////////////////////////

/// write all files read by rf_go.exe


Bool_t TMVA::RuleFitAPI::WriteAll()

{

   WriteIntParms();

   WriteRealParms();

   WriteLx();

   WriteProgram();

   WriteVarNames();

   if (fRFProgram==kRfTrain)   WriteTrain();

   if (fRFProgram==kRfPredict) WriteTest();

   if (fRFProgram==kRfVarimp)  WriteRealVarImp();

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// write int params file


Bool_t TMVA::RuleFitAPI::WriteIntParms()

{

   std::ofstream f;

   if (!OpenRFile("intparms",f)) return kFALSE;

   WriteInt(f,&fRFIntParms.mode,sizeof(fRFIntParms)/sizeof(Int_t));

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// write int params file


Bool_t TMVA::RuleFitAPI::WriteRealParms()

{

   std::ofstream f;

   if (!OpenRFile("realparms",f)) return kFALSE;

   WriteFloat(f,&fRFRealParms.xmiss,sizeof(fRFRealParms)/sizeof(Float_t));

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// Save input variable mask

///

/// If the lx vector size is not the same as inputVars,

/// resize it and fill it with 1

/// NOTE: Always set all to 1

///  if (fRFLx.size() != m_inputVars->size()) {


Bool_t TMVA::RuleFitAPI::WriteLx()

{

   fRFLx.clear();

   fRFLx.resize(fMethodRuleFit->DataInfo().GetNVariables(),1);

   //  }

   std::ofstream f;

   if (!OpenRFile("lx",f)) return kFALSE;

   WriteInt(f,&fRFLx[0],fRFLx.size());

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// write command to rf_go.exe


Bool_t TMVA::RuleFitAPI::WriteProgram()

{

   std::ofstream f;

   if (!OpenRFile("program",f)) return kFALSE;

   TString program;

   switch (fRFProgram) {

   case kRfTrain:

      program = "rulefit";

      break;

   case kRfPredict:

      program = "rulefit_pred";

      break;

      // calculate variable importance

   case kRfVarimp:

      program = "varimp";

      break;

   default:

      fRFProgram = kRfTrain;

      program="rulefit";

      break;

   }

   f << program;

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// write the minimum importance to be considered


Bool_t TMVA::RuleFitAPI::WriteRealVarImp()

{

   std::ofstream f;

   if (!OpenRFile("realvarimp",f)) return kFALSE;

   Float_t rvp[2];

   rvp[0] = 0.0; // Mode: see varimp() in rulefit.r

   rvp[1] = 0.0; // Minimum importance considered (1 is max)

   WriteFloat(f,&rvp[0],2);

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// written by rf_go.exe; write rulefit output (rfout)


Bool_t TMVA::RuleFitAPI::WriteRfOut()

{

   fLogger << kWARNING << "WriteRfOut is not yet implemented" << Endl;

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// written by rf_go.exe; write rulefit status


Bool_t TMVA::RuleFitAPI::WriteRfStatus()

{

   fLogger << kWARNING << "WriteRfStatus is not yet implemented" << Endl;

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// written by rf_go.exe (NOTE:Format unknown!)


Bool_t TMVA::RuleFitAPI::WriteRuleFitMod()

{

   fLogger << kWARNING << "WriteRuleFitMod is not yet implemented" << Endl;

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// written by rf_go.exe (NOTE: format unknown!)


Bool_t TMVA::RuleFitAPI::WriteRuleFitSum()

{

   fLogger << kWARNING << "WriteRuleFitSum is not yet implemented" << Endl;

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// write training data, column wise


Bool_t TMVA::RuleFitAPI::WriteTrain()

{

   std::ofstream fx;

   std::ofstream fy;

   std::ofstream fw;

   //

   if (!OpenRFile("train.x",fx)) return kFALSE;

   if (!OpenRFile("train.y",fy)) return kFALSE;

   if (!OpenRFile("train.w",fw)) return kFALSE;

   //

   Float_t x,y,w;

   //

   // The loop order cannot be changed.

   // The data is stored <var1(eve1), var1(eve2), ...var1(eveN), var2(eve1),....

   //

   for (UInt_t ivar=0; ivar<fMethodRuleFit->DataInfo().GetNVariables(); ivar++) {

      for (Int_t ievt=0;ievt<fMethodRuleFit->Data()->GetNTrainingEvents(); ievt++) {

         const Event * ev = fMethodRuleFit->GetTrainingEvent(ievt);

         x = ev->GetValue(ivar);

         WriteFloat(fx,&x,1);

         if (ivar==0) {

            w = ev->GetWeight();

            y = fMethodRuleFit->DataInfo().IsSignal(ev)? 1.0 : -1.0;

            WriteFloat(fy,&y,1);

            WriteFloat(fw,&w,1);

         }

      }

   }

   fLogger << kINFO << "Number of training data written: " << fMethodRuleFit->Data()->GetNTrainingEvents() << Endl;

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// Write test data


Bool_t TMVA::RuleFitAPI::WriteTest()

{

   fMethodRuleFit->Data()->SetCurrentType(Types::kTesting);


   std::ofstream f;

   //

   if (!OpenRFile("test.x",f)) return kFALSE;

   //

   Float_t vf;

   Float_t neve;

   //

   neve = static_cast<Float_t>(fMethodRuleFit->Data()->GetNEvents());

   WriteFloat(f,&neve,1);

   // Test data is saved as:

   // 0      : <N> num of events, type float, 4 bytes

   // 1-N    : First variable for all events

   // N+1-2N : Second variable...

   // ...

   for (UInt_t ivar=0; ivar<fMethodRuleFit->DataInfo().GetNVariables(); ivar++) {

      for (Int_t ievt=0;ievt<fMethodRuleFit->Data()->GetNEvents(); ievt++) {

         vf =   fMethodRuleFit->GetEvent(ievt)->GetValue(ivar);

         WriteFloat(f,&vf,1);

      }

   }

   fLogger << kINFO << "Number of test data written: " << fMethodRuleFit->Data()->GetNEvents() << Endl;

   //

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// write variable names, ascii


Bool_t TMVA::RuleFitAPI::WriteVarNames()

{

   std::ofstream f;

   if (!OpenRFile("varnames",f)) return kFALSE;

   for (UInt_t ivar=0; ivar<fMethodRuleFit->DataInfo().GetNVariables(); ivar++) {

      f << fMethodRuleFit->DataInfo().GetVariableInfo(ivar).GetExpression() << '\n';

   }

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////


Bool_t TMVA::RuleFitAPI::WriteVarImp()


{

   // written by rf_go.exe

   fLogger << kWARNING << "WriteVarImp is not yet implemented" << Endl;

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// written by rf_go.exe


Bool_t TMVA::RuleFitAPI::WriteYhat()

{

   fLogger << kWARNING << "WriteYhat is not yet implemented" << Endl;

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// read the score


Bool_t TMVA::RuleFitAPI::ReadYhat()

{

   fRFYhat.clear();

   //

   std::ifstream f;

   if (!OpenRFile("yhat",f)) return kFALSE;

   Int_t   neve;

   Float_t xval;

   ReadFloat(f,&xval,1);

   neve = static_cast<Int_t>(xval);

   if (neve!=fMethodRuleFit->Data()->GetNTestEvents()) {

      fLogger << kWARNING << "Inconsistent size of yhat file and test tree!" << Endl;

      fLogger << kWARNING << "neve = " << neve << " , tree = " << fMethodRuleFit->Data()->GetNTestEvents() << Endl;

      return kFALSE;

   }

   for (Int_t ievt=0; ievt<fMethodRuleFit->Data()->GetNTestEvents(); ievt++) {

      ReadFloat(f,&xval,1);

      fRFYhat.push_back(xval);

   }

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// read variable importance


Bool_t TMVA::RuleFitAPI::ReadVarImp()

{

   fRFVarImp.clear();

   //

   std::ifstream f;

   if (!OpenRFile("varimp",f)) return kFALSE;

   UInt_t   nvars;

   Float_t xval;

   Float_t xmax=1.0;

   nvars=fMethodRuleFit->DataInfo().GetNVariables();

   //

   // First read all importances

   //

   for (UInt_t ivar=0; ivar<nvars; ivar++) {

      ReadFloat(f,&xval,1);

      if (ivar==0) {

         xmax=xval;

      } else {

         if (xval>xmax) xmax=xval;

      }

      fRFVarImp.push_back(xval);

   }

   //

   // Read the indices.

   // They are saved as float (!) by rf_go.exe.

   //

   for (UInt_t ivar=0; ivar<nvars; ivar++) {

      fRFVarImp[ivar] = fRFVarImp[ivar]/xmax;

      ReadFloat(f,&xval,1);

      fRFVarImpInd.push_back(Int_t(xval)-1);

   }

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// read model from rulefit.sum


Bool_t TMVA::RuleFitAPI::ReadModelSum()

{

   fRFVarImp.clear();

   //

   fLogger << kVERBOSE << "Reading RuleFit summary file" << Endl;

   std::ifstream f;

   if (!OpenRFile("rulefit.sum",f)) return kFALSE;

   Int_t    nrules=0;

   Int_t    nvars=0;

   Int_t    nvarsOpt=0;

   Int_t    dumI;

   Float_t  dumF;

   Float_t  offset;

   Double_t impref=-1.0;

   Double_t imp;


   fRuleFit->GetRuleEnsemblePtr()->SetAverageRuleSigma(0.4); // value used by Friedmans RuleFit

   //

   //--------------------------------------------

   //       first read rulefit.sum header

   //--------------------------------------------

   // line      type    val     descr

   //   0       <int>   86      N(rules)x2

   //   1       <int>   155     ???

   //   2       <int>   1       ???

   //   3       <int>   1916    ???

   //   4       <int>   2       N(vars) ?

   //   5       <int>   2       N(vars) ?

   //   6       <float> 9e+30   xmiss

   //   7       <float> 1.1e-1  a0 (model offset)

   //--------------------------------------------

   //

   // NOTE: a model without any rules, will look like

   // for the first four lines:

   //

   //   0        1

   //   1        1

   //   2        1

   //   3        0

   //

   // There will later be one block of dummy data for one rule.

   // In order to catch this situation, some special checks are made below.

   //

   Bool_t norules;

   ReadInt(f,&nrules);

   norules = (nrules==1);

   ReadInt(f,&dumI);

   norules = norules && (dumI==1);

   ReadInt(f,&dumI);

   norules = norules && (dumI==1);

   ReadInt(f,&dumI);

   norules = norules && (dumI==0);

   if (nrules==0) norules=kTRUE; // this ugly construction is needed:(

   if (norules) nrules = 0;

   //

   ReadInt(f,&nvars);

   ReadInt(f,&nvarsOpt);

   ReadFloat(f,&dumF);

   ReadFloat(f,&offset);

   fLogger << kDEBUG << "N(rules) = " << nrules   << Endl;

   fLogger << kDEBUG << "N(vars)  = " << nvars    << Endl;

   fLogger << kDEBUG << "N(varsO) = " << nvarsOpt << Endl;

   fLogger << kDEBUG << "xmiss    = " << dumF     << Endl;

   fLogger << kDEBUG << "offset   = " << offset   << Endl;

   if (nvars!=nvarsOpt) {

      fLogger << kWARNING << "Format of rulefit.sum is ... weird?? Continuing but who knows how it will end...?" << Endl;

   }

   std::vector<Double_t> rfSupp;

   std::vector<Double_t> rfCoef;

   std::vector<Int_t>    rfNcut;

   std::vector<Rule *>   rfRules;

   if (norules) {

      // if no rules, read 8 blocks of data

      // this corresponds to one dummy rule

      for (Int_t t=0; t<8; t++) {

         ReadFloat(f,&dumF);

      }

   }

   //

   //--------------------------------------------

   //       read first part of rule info

   //--------------------------------------------

   //

   //   8       <int>   10      ???

   //   9       <float> 0.185   support

   //   10      <float> 0.051   coefficient

   //   11      <float> 2       num of cuts in rule

   //   12      <float> 1       ??? not used by this interface

   //

   for (Int_t r=0; r<nrules; r++) {

      ReadFloat(f,&dumF);

      ReadFloat(f,&dumF);

      rfSupp.push_back(dumF);

      ReadFloat(f,&dumF);

      rfCoef.push_back(dumF);

      ReadFloat(f,&dumF);

      rfNcut.push_back(static_cast<int>(dumF+0.5));

      ReadFloat(f,&dumF);

      //

   }

   //--------------------------------------------

   //       read second part of rule info

   //--------------------------------------------

   //

   // Per range (cut):

   //   0    <float> 1       varind

   //   1    <float> -1.0    low

   //   2    <float>  1.56   high

   //


   for (Int_t r=0; r<nrules; r++) {

      Int_t    varind;

      Double_t xmin;

      Double_t xmax;

      Rule *rule = new Rule(fRuleFit->GetRuleEnsemblePtr());

      rfRules.push_back( rule );

      RuleCut *rfcut = new RuleCut();

      rfcut->SetNvars(rfNcut[r]);

      rule->SetRuleCut( rfcut );

      // the below are set to default values since no info is

      // available in rulefit.sum

      rule->SetNorm(1.0);

      rule->SetSupport(0);

      rule->SetSSB(0.0);

      rule->SetSSBNeve(0.0);

      rule->SetImportanceRef(1.0);

      rule->SetSSB(0.0);

      rule->SetSSBNeve(0.0);

      // set support etc

      rule->SetSupport(rfSupp[r]);

      rule->SetCoefficient(rfCoef[r]);

      rule->CalcImportance();

      imp = rule->GetImportance();

      if (imp>impref) impref = imp; // find max importance

      //

      fLogger << kDEBUG << "Rule #" << r << " : " << nvars << Endl;

      fLogger << kDEBUG << "  support  = " << rfSupp[r] << Endl;

      fLogger << kDEBUG << "  sigma    = " << rule->GetSigma() << Endl;

      fLogger << kDEBUG << "  coeff    = " << rfCoef[r] << Endl;

      fLogger << kDEBUG << "  N(cut)   = " << rfNcut[r] << Endl;


      for (Int_t c=0; c<rfNcut[r]; c++) {

         ReadFloat(f,&dumF);

         varind = static_cast<Int_t>(dumF+0.5)-1;

         ReadFloat(f,&dumF);

         xmin   = static_cast<Double_t>(dumF);

         ReadFloat(f,&dumF);

         xmax   = static_cast<Double_t>(dumF);

         // create Rule HERE!

         rfcut->SetSelector(c,varind);

         rfcut->SetCutMin(c,xmin);

         rfcut->SetCutMax(c,xmax);

         // the following is not nice - this is however defined

         // by the rulefit.sum format.

         rfcut->SetCutDoMin(c,(xmin<-8.99e35 ? kFALSE:kTRUE));

         rfcut->SetCutDoMax(c,(xmax> 8.99e35 ? kFALSE:kTRUE));

         //

      }

   }

   fRuleFit->GetRuleEnsemblePtr()->SetRules( rfRules );

   fRuleFit->GetRuleEnsemblePtr()->SetOffset( offset );

   //--------------------------------------------

   //       read second part of rule info

   //--------------------------------------------

   //

   // Per linear term:

   // 73      1               var index

   // 74      -1.99594        min

   // 75      1.99403         max

   // 76      -0.000741858    ??? average ???

   // 77      0.970935        std

   // 78      0               coeff

   //

   std::vector<Int_t>    varind;

   std::vector<Double_t> xmin;

   std::vector<Double_t> xmax;

   std::vector<Double_t> average;

   std::vector<Double_t> stdev;

   std::vector<Double_t> norm;

   std::vector<Double_t> coeff;

   //

   for (Int_t c=0; c<nvars; c++) {

      ReadFloat(f,&dumF);

      varind.push_back(static_cast<Int_t>(dumF+0.5)-1);

      ReadFloat(f,&dumF);

      xmin.push_back(static_cast<Double_t>(dumF));

      ReadFloat(f,&dumF);

      xmax.push_back(static_cast<Double_t>(dumF));

      ReadFloat(f,&dumF);

      average.push_back(static_cast<Double_t>(dumF));

      ReadFloat(f,&dumF);

      stdev.push_back(static_cast<Double_t>(dumF));

      Double_t nv = fRuleFit->GetRuleEnsemblePtr()->CalcLinNorm(stdev.back());

      norm.push_back(nv);

      ReadFloat(f,&dumF);

      coeff.push_back(dumF/nv); // save coefficient for normalised var

      //

      fLogger << kDEBUG << "Linear #" << c << Endl;

      fLogger << kDEBUG << "  varind   = " << varind.back()  << Endl;

      fLogger << kDEBUG << "  xmin     = " << xmin.back()    << Endl;

      fLogger << kDEBUG << "  xmax     = " << xmax.back()    << Endl;

      fLogger << kDEBUG << "  average  = " << average.back() << Endl;

      fLogger << kDEBUG << "  stdev    = " << stdev.back()  << Endl;

      fLogger << kDEBUG << "  coeff    = " << coeff.back()  << Endl;

   }

   if (xmin.size()>0) {

      fRuleFit->GetRuleEnsemblePtr()->SetLinCoefficients(coeff);

      fRuleFit->GetRuleEnsemblePtr()->SetLinDM(xmin);

      fRuleFit->GetRuleEnsemblePtr()->SetLinDP(xmax);

      fRuleFit->GetRuleEnsemblePtr()->SetLinNorm(norm);

   }

   //   fRuleFit->GetRuleEnsemblePtr()->CalcImportance();

   imp = fRuleFit->GetRuleEnsemblePtr()->CalcLinImportance();

   if (imp>impref) impref=imp;

   fRuleFit->GetRuleEnsemblePtr()->SetImportanceRef(impref);

   fRuleFit->GetRuleEnsemblePtr()->CleanupLinear(); // to fill fLinTermOK vector


   fRuleFit->GetRuleEnsemblePtr()->CalcVarImportance();

   //   fRuleFit->GetRuleEnsemblePtr()->CalcRuleSupport();


   fLogger << kDEBUG << "Reading model done" << Endl;

   return kTRUE;

}


////////////////////////////////////////////////////////////////////////////////

/// execute rf_go.exe


Int_t TMVA::RuleFitAPI::RunRuleFit()

{

   TString oldDir = gSystem->pwd();

   TString cmd = "./rf_go.exe";

   gSystem->cd(fRFWorkDir.Data());

   int rval = gSystem->Exec(cmd.Data());

   gSystem->cd(oldDir.Data());

   return rval;

}

DataSetInfo.h

DataSet.h

MethodRuleFit.h

f
#define f(i)
Definition RSha256.hxx:104

c
#define c(i)
Definition RSha256.hxx:101

Int_t
int Int_t
Definition RtypesCore.h:45

Float_t
float Float_t
Definition RtypesCore.h:57

kFALSE
constexpr Bool_t kFALSE
Definition RtypesCore.h:94

kTRUE
constexpr Bool_t kTRUE
Definition RtypesCore.h:93

ClassImp
#define ClassImp(name)
Definition Rtypes.h:382

RuleFitAPI.h

RuleFit.h

w
winID w
Definition TGWin32VirtualGLProxy.cxx:39

offset
Option_t Option_t TPoint TPoint const char GetTextMagnitude GetFillStyle GetLineColor GetLineWidth GetMarkerStyle GetTextAlign GetTextColor GetTextSize void char Point_t Rectangle_t WindowAttributes_t Float_t Float_t Float_t Int_t Int_t UInt_t UInt_t Rectangle_t Int_t Int_t Window_t TString Int_t GCValues_t GetPrimarySelectionOwner GetDisplay GetScreen GetColormap GetNativeEvent const char const char dpyName wid window const char font_name cursor keysym reg const char only_if_exist regb h Point_t winding char text const char depth char const char Int_t count const char ColorStruct_t color const char Pixmap_t Pixmap_t PictureAttributes_t attr const char char ret_data h unsigned char height h offset
Definition TGWin32VirtualXProxy.cxx:245

r
Option_t Option_t TPoint TPoint const char GetTextMagnitude GetFillStyle GetLineColor GetLineWidth GetMarkerStyle GetTextAlign GetTextColor GetTextSize void char Point_t Rectangle_t WindowAttributes_t Float_t r
Definition TGWin32VirtualXProxy.cxx:168

xmin
float xmin
Definition THbookFile.cxx:95

xmax
float xmax
Definition THbookFile.cxx:95

TSystem.h

gSystem
R__EXTERN TSystem * gSystem
Definition TSystem.h:561

Timer.h

Tools.h

VariableInfo.h

TMVA::Event
Definition Event.h:51

TMVA::Event::GetValue
Float_t GetValue(UInt_t ivar) const
return value of i'th variable
Definition Event.cxx:236

TMVA::Event::GetWeight
Double_t GetWeight() const
return the event weight - depending on whether the flag IgnoreNegWeightsInTraining is or not.
Definition Event.cxx:389

TMVA::MethodRuleFit
J Friedman's RuleFit method.
Definition MethodRuleFit.h:48

TMVA::MethodRuleFit::GetRFWorkDir
const TString GetRFWorkDir() const
Definition MethodRuleFit.h:111

TMVA::RuleCut
A class describing a 'rule cut'.
Definition RuleCut.h:36

TMVA::RuleCut::SetSelector
void SetSelector(Int_t i, UInt_t s)
Definition RuleCut.h:65

TMVA::RuleCut::SetCutDoMin
void SetCutDoMin(Int_t i, Bool_t v)
Definition RuleCut.h:68

TMVA::RuleCut::SetCutMin
void SetCutMin(Int_t i, Double_t v)
Definition RuleCut.h:66

TMVA::RuleCut::SetCutMax
void SetCutMax(Int_t i, Double_t v)
Definition RuleCut.h:67

TMVA::RuleCut::SetNvars
void SetNvars(UInt_t nc)
Definition RuleCut.h:143

TMVA::RuleCut::SetCutDoMax
void SetCutDoMax(Int_t i, Bool_t v)
Definition RuleCut.h:69

TMVA::RuleFitAPI
J Friedman's RuleFit method.
Definition RuleFitAPI.h:51

TMVA::RuleFitAPI::SetTestParms
void SetTestParms()
set the test params
Definition RuleFitAPI.cxx:201

TMVA::RuleFitAPI::WriteRuleFitSum
Bool_t WriteRuleFitSum()
written by rf_go.exe (NOTE: format unknown!)
Definition RuleFitAPI.cxx:374

TMVA::RuleFitAPI::WriteYhat
Bool_t WriteYhat()
written by rf_go.exe
Definition RuleFitAPI.cxx:473

TMVA::RuleFitAPI::WriteAll
Bool_t WriteAll()
write all files read by rf_go.exe
Definition RuleFitAPI.cxx:248

TMVA::RuleFitAPI::ImportSetup
void ImportSetup()
import setup from MethodRuleFit
Definition RuleFitAPI.cxx:132

TMVA::RuleFitAPI::WriteRfStatus
Bool_t WriteRfStatus()
written by rf_go.exe; write rulefit status
Definition RuleFitAPI.cxx:356

TMVA::RuleFitAPI::WriteIntParms
Bool_t WriteIntParms()
write int params file
Definition RuleFitAPI.cxx:264

TMVA::RuleFitAPI::CheckRFWorkDir
void CheckRFWorkDir()
check if the rulefit work dir is properly setup.
Definition RuleFitAPI.cxx:166

TMVA::RuleFitAPI::WriteProgram
Bool_t WriteProgram()
write command to rf_go.exe
Definition RuleFitAPI.cxx:305

TMVA::RuleFitAPI::ReadModelSum
Bool_t ReadModelSum()
read model from rulefit.sum
Definition RuleFitAPI.cxx:544

TMVA::RuleFitAPI::WriteVarImp
Bool_t WriteVarImp()
Definition RuleFitAPI.cxx:462

TMVA::RuleFitAPI::SetRFWorkDir
void SetRFWorkDir(const char *wdir)
set the directory containing rf_go.exe.
Definition RuleFitAPI.cxx:155

TMVA::RuleFitAPI::ReadVarImp
Bool_t ReadVarImp()
read variable importance
Definition RuleFitAPI.cxx:507

TMVA::RuleFitAPI::WriteRuleFitMod
Bool_t WriteRuleFitMod()
written by rf_go.exe (NOTE:Format unknown!)
Definition RuleFitAPI.cxx:365

TMVA::RuleFitAPI::WriteRfOut
Bool_t WriteRfOut()
written by rf_go.exe; write rulefit output (rfout)
Definition RuleFitAPI.cxx:347

TMVA::RuleFitAPI::InitRuleFit
void InitRuleFit()
default initialisation SetRFWorkDir("./rulefit");
Definition RuleFitAPI.cxx:122

TMVA::RuleFitAPI::FillRealParmsDef
void FillRealParmsDef()
set default real params
Definition RuleFitAPI.cxx:213

TMVA::RuleFitAPI::WriteVarNames
Bool_t WriteVarNames()
write variable names, ascii
Definition RuleFitAPI.cxx:450

TMVA::RuleFitAPI::WriteRealVarImp
Bool_t WriteRealVarImp()
write the minimum importance to be considered
Definition RuleFitAPI.cxx:333

TMVA::RuleFitAPI::FillIntParmsDef
void FillIntParmsDef()
set default int params
Definition RuleFitAPI.cxx:228

TMVA::RuleFitAPI::WelcomeMessage
void WelcomeMessage()
welcome message
Definition RuleFitAPI.cxx:76

TMVA::RuleFitAPI::RuleFitAPI
RuleFitAPI()

TMVA::RuleFitAPI::WriteTrain
Bool_t WriteTrain()
write training data, column wise
Definition RuleFitAPI.cxx:383

TMVA::RuleFitAPI::~RuleFitAPI
virtual ~RuleFitAPI()
destructor
Definition RuleFitAPI.cxx:69

TMVA::RuleFitAPI::WriteRealParms
Bool_t WriteRealParms()
write int params file
Definition RuleFitAPI.cxx:275

TMVA::RuleFitAPI::WriteLx
Bool_t WriteLx()
Save input variable mask.
Definition RuleFitAPI.cxx:291

TMVA::RuleFitAPI::ReadYhat
Bool_t ReadYhat()
read the score
Definition RuleFitAPI.cxx:482

TMVA::RuleFitAPI::HowtoSetupRF
void HowtoSetupRF()
howto message
Definition RuleFitAPI.cxx:92

TMVA::RuleFitAPI::WriteTest
Bool_t WriteTest()
Write test data.
Definition RuleFitAPI.cxx:418

TMVA::RuleFitAPI::SetTrainParms
void SetTrainParms()
set the training parameters
Definition RuleFitAPI.cxx:188

TMVA::RuleFitAPI::RunRuleFit
Int_t RunRuleFit()
execute rf_go.exe
Definition RuleFitAPI.cxx:771

TMVA::RuleFit
A class implementing various fits of rule ensembles.
Definition RuleFit.h:46

TMVA::Rule
Implementation of a rule.
Definition Rule.h:50

TMVA::Rule::SetImportanceRef
void SetImportanceRef(Double_t v)
Definition Rule.h:96

TMVA::Rule::SetCoefficient
void SetCoefficient(Double_t v)
Definition Rule.h:84

TMVA::Rule::SetNorm
void SetNorm(Double_t norm)
Definition Rule.h:81

TMVA::Rule::GetImportance
Double_t GetImportance() const
Definition Rule.h:145

TMVA::Rule::GetSigma
Double_t GetSigma() const
Definition Rule.h:143

TMVA::Rule::SetSSBNeve
void SetSSBNeve(Double_t v)
Definition Rule.h:93

TMVA::Rule::SetRuleCut
void SetRuleCut(RuleCut *rc)
Definition Rule.h:78

TMVA::Rule::CalcImportance
void CalcImportance()
Definition Rule.h:99

TMVA::Rule::SetSupport
void SetSupport(Double_t v)
Definition Rule.h:87

TMVA::Rule::SetSSB
void SetSSB(Double_t v)
Definition Rule.h:90

TMVA::Types::kTesting
@ kTesting
Definition Types.h:144

TString
Basic string class.
Definition TString.h:139

TString::Data
const char * Data() const
Definition TString.h:376

TSystem::cd
Bool_t cd(const char *path)
Definition TSystem.h:423

TSystem::pwd
const char * pwd()
Definition TSystem.h:424

TSystem::Exec
virtual Int_t Exec(const char *shellcmd)
Execute a command.
Definition TSystem.cxx:653

bool

double

int

unsigned int

y
Double_t y[n]
Definition legend1.C:17

x
Double_t x[n]
Definition legend1.C:17

n
const Int_t n
Definition legend1.C:16

TMVA::Endl
MsgLogger & Endl(MsgLogger &ml)
Definition MsgLogger.h:148

Types.h