TMVA Classification Example Using a Convolutional Neural Network
This is an example of using a CNN in TMVA. We do classification using a toy image data set that is generated when running the example macro
Running with nthreads = 4
DataSetInfo : [dataset] : Added class "Signal"
: Add Tree sig_tree of type Signal with 1000 events
DataSetInfo : [dataset] : Added class "Background"
: Add Tree bkg_tree of type Background with 1000 events
Factory : Booking method: ␛[1mBDT␛[0m
:
: Rebuilding Dataset dataset
: Building event vectors for type 2 Signal
: Dataset[dataset] : create input formulas for tree sig_tree
: Using variable vars[0] from array expression vars of size 256
: Building event vectors for type 2 Background
: Dataset[dataset] : create input formulas for tree bkg_tree
: Using variable vars[0] from array expression vars of size 256
DataSetFactory : [dataset] : Number of events in input trees
:
:
: Number of training and testing events
: ---------------------------------------------------------------------------
: Signal -- training events : 800
: Signal -- testing events : 200
: Signal -- training and testing events: 1000
: Background -- training events : 800
: Background -- testing events : 200
: Background -- training and testing events: 1000
:
Factory : ␛[1mTrain all methods␛[0m
Factory : Train method: BDT for Classification
:
BDT : #events: (reweighted) sig: 800 bkg: 800
: #events: (unweighted) sig: 800 bkg: 800
: Training 400 Decision Trees ... patience please
: Elapsed time for training with 1600 events: 1.32 sec
BDT : [dataset] : Evaluation of BDT on training sample (1600 events)
: Elapsed time for evaluation of 1600 events: 0.0153 sec
: Creating xml weight file: ␛[0;36mdataset/weights/TMVA_CNN_Classification_BDT.weights.xml␛[0m
: Creating standalone class: ␛[0;36mdataset/weights/TMVA_CNN_Classification_BDT.class.C␛[0m
: TMVA_CNN_ClassificationOutput.root:/dataset/Method_BDT/BDT
Factory : Training finished
:
: Ranking input variables (method specific)...
BDT : Ranking result (top variable is best ranked)
: --------------------------------------
: Rank : Variable : Variable Importance
: --------------------------------------
: 1 : vars : 9.266e-03
: 2 : vars : 8.509e-03
: 3 : vars : 8.433e-03
: 4 : vars : 8.186e-03
: 5 : vars : 7.939e-03
: 6 : vars : 7.661e-03
: 7 : vars : 7.424e-03
: 8 : vars : 7.406e-03
: 9 : vars : 7.397e-03
: 10 : vars : 7.283e-03
: 11 : vars : 7.188e-03
: 12 : vars : 7.136e-03
: 13 : vars : 7.041e-03
: 14 : vars : 7.039e-03
: 15 : vars : 7.032e-03
: 16 : vars : 7.015e-03
: 17 : vars : 7.014e-03
: 18 : vars : 6.933e-03
: 19 : vars : 6.895e-03
: 20 : vars : 6.836e-03
: 21 : vars : 6.657e-03
: 22 : vars : 6.635e-03
: 23 : vars : 6.620e-03
: 24 : vars : 6.613e-03
: 25 : vars : 6.593e-03
: 26 : vars : 6.520e-03
: 27 : vars : 6.451e-03
: 28 : vars : 6.450e-03
: 29 : vars : 6.403e-03
: 30 : vars : 6.341e-03
: 31 : vars : 6.303e-03
: 32 : vars : 6.295e-03
: 33 : vars : 6.203e-03
: 34 : vars : 6.195e-03
: 35 : vars : 6.065e-03
: 36 : vars : 6.039e-03
: 37 : vars : 5.987e-03
: 38 : vars : 5.952e-03
: 39 : vars : 5.851e-03
: 40 : vars : 5.829e-03
: 41 : vars : 5.758e-03
: 42 : vars : 5.747e-03
: 43 : vars : 5.708e-03
: 44 : vars : 5.687e-03
: 45 : vars : 5.671e-03
: 46 : vars : 5.608e-03
: 47 : vars : 5.543e-03
: 48 : vars : 5.537e-03
: 49 : vars : 5.513e-03
: 50 : vars : 5.498e-03
: 51 : vars : 5.455e-03
: 52 : vars : 5.432e-03
: 53 : vars : 5.428e-03
: 54 : vars : 5.425e-03
: 55 : vars : 5.412e-03
: 56 : vars : 5.377e-03
: 57 : vars : 5.330e-03
: 58 : vars : 5.323e-03
: 59 : vars : 5.299e-03
: 60 : vars : 5.241e-03
: 61 : vars : 5.240e-03
: 62 : vars : 5.240e-03
: 63 : vars : 5.233e-03
: 64 : vars : 5.207e-03
: 65 : vars : 5.189e-03
: 66 : vars : 5.188e-03
: 67 : vars : 5.184e-03
: 68 : vars : 5.179e-03
: 69 : vars : 5.127e-03
: 70 : vars : 5.088e-03
: 71 : vars : 5.008e-03
: 72 : vars : 4.987e-03
: 73 : vars : 4.950e-03
: 74 : vars : 4.941e-03
: 75 : vars : 4.940e-03
: 76 : vars : 4.928e-03
: 77 : vars : 4.918e-03
: 78 : vars : 4.894e-03
: 79 : vars : 4.866e-03
: 80 : vars : 4.855e-03
: 81 : vars : 4.832e-03
: 82 : vars : 4.808e-03
: 83 : vars : 4.746e-03
: 84 : vars : 4.740e-03
: 85 : vars : 4.728e-03
: 86 : vars : 4.725e-03
: 87 : vars : 4.620e-03
: 88 : vars : 4.562e-03
: 89 : vars : 4.556e-03
: 90 : vars : 4.551e-03
: 91 : vars : 4.532e-03
: 92 : vars : 4.512e-03
: 93 : vars : 4.496e-03
: 94 : vars : 4.481e-03
: 95 : vars : 4.469e-03
: 96 : vars : 4.437e-03
: 97 : vars : 4.389e-03
: 98 : vars : 4.322e-03
: 99 : vars : 4.322e-03
: 100 : vars : 4.288e-03
: 101 : vars : 4.283e-03
: 102 : vars : 4.258e-03
: 103 : vars : 4.256e-03
: 104 : vars : 4.242e-03
: 105 : vars : 4.232e-03
: 106 : vars : 4.180e-03
: 107 : vars : 4.164e-03
: 108 : vars : 4.157e-03
: 109 : vars : 4.127e-03
: 110 : vars : 4.124e-03
: 111 : vars : 4.120e-03
: 112 : vars : 4.086e-03
: 113 : vars : 4.075e-03
: 114 : vars : 4.072e-03
: 115 : vars : 4.036e-03
: 116 : vars : 4.025e-03
: 117 : vars : 4.018e-03
: 118 : vars : 4.014e-03
: 119 : vars : 3.971e-03
: 120 : vars : 3.968e-03
: 121 : vars : 3.966e-03
: 122 : vars : 3.957e-03
: 123 : vars : 3.955e-03
: 124 : vars : 3.947e-03
: 125 : vars : 3.940e-03
: 126 : vars : 3.934e-03
: 127 : vars : 3.930e-03
: 128 : vars : 3.904e-03
: 129 : vars : 3.895e-03
: 130 : vars : 3.851e-03
: 131 : vars : 3.844e-03
: 132 : vars : 3.790e-03
: 133 : vars : 3.765e-03
: 134 : vars : 3.763e-03
: 135 : vars : 3.761e-03
: 136 : vars : 3.760e-03
: 137 : vars : 3.724e-03
: 138 : vars : 3.652e-03
: 139 : vars : 3.626e-03
: 140 : vars : 3.619e-03
: 141 : vars : 3.608e-03
: 142 : vars : 3.593e-03
: 143 : vars : 3.591e-03
: 144 : vars : 3.573e-03
: 145 : vars : 3.572e-03
: 146 : vars : 3.558e-03
: 147 : vars : 3.487e-03
: 148 : vars : 3.426e-03
: 149 : vars : 3.418e-03
: 150 : vars : 3.418e-03
: 151 : vars : 3.410e-03
: 152 : vars : 3.393e-03
: 153 : vars : 3.379e-03
: 154 : vars : 3.358e-03
: 155 : vars : 3.345e-03
: 156 : vars : 3.336e-03
: 157 : vars : 3.324e-03
: 158 : vars : 3.305e-03
: 159 : vars : 3.292e-03
: 160 : vars : 3.292e-03
: 161 : vars : 3.291e-03
: 162 : vars : 3.277e-03
: 163 : vars : 3.234e-03
: 164 : vars : 3.223e-03
: 165 : vars : 3.213e-03
: 166 : vars : 3.202e-03
: 167 : vars : 3.201e-03
: 168 : vars : 3.188e-03
: 169 : vars : 3.182e-03
: 170 : vars : 3.158e-03
: 171 : vars : 3.142e-03
: 172 : vars : 3.116e-03
: 173 : vars : 3.089e-03
: 174 : vars : 3.071e-03
: 175 : vars : 3.068e-03
: 176 : vars : 3.050e-03
: 177 : vars : 3.037e-03
: 178 : vars : 3.030e-03
: 179 : vars : 3.014e-03
: 180 : vars : 2.948e-03
: 181 : vars : 2.946e-03
: 182 : vars : 2.863e-03
: 183 : vars : 2.833e-03
: 184 : vars : 2.795e-03
: 185 : vars : 2.762e-03
: 186 : vars : 2.706e-03
: 187 : vars : 2.654e-03
: 188 : vars : 2.642e-03
: 189 : vars : 2.640e-03
: 190 : vars : 2.637e-03
: 191 : vars : 2.628e-03
: 192 : vars : 2.597e-03
: 193 : vars : 2.560e-03
: 194 : vars : 2.545e-03
: 195 : vars : 2.514e-03
: 196 : vars : 2.463e-03
: 197 : vars : 2.452e-03
: 198 : vars : 2.413e-03
: 199 : vars : 2.374e-03
: 200 : vars : 2.371e-03
: 201 : vars : 2.345e-03
: 202 : vars : 2.342e-03
: 203 : vars : 2.342e-03
: 204 : vars : 2.314e-03
: 205 : vars : 2.310e-03
: 206 : vars : 2.280e-03
: 207 : vars : 2.276e-03
: 208 : vars : 2.241e-03
: 209 : vars : 2.224e-03
: 210 : vars : 2.208e-03
: 211 : vars : 2.199e-03
: 212 : vars : 2.129e-03
: 213 : vars : 2.098e-03
: 214 : vars : 2.084e-03
: 215 : vars : 2.081e-03
: 216 : vars : 2.035e-03
: 217 : vars : 2.029e-03
: 218 : vars : 2.007e-03
: 219 : vars : 1.942e-03
: 220 : vars : 1.913e-03
: 221 : vars : 1.897e-03
: 222 : vars : 1.892e-03
: 223 : vars : 1.891e-03
: 224 : vars : 1.855e-03
: 225 : vars : 1.808e-03
: 226 : vars : 1.723e-03
: 227 : vars : 1.715e-03
: 228 : vars : 1.695e-03
: 229 : vars : 1.678e-03
: 230 : vars : 1.620e-03
: 231 : vars : 1.592e-03
: 232 : vars : 1.560e-03
: 233 : vars : 1.490e-03
: 234 : vars : 1.442e-03
: 235 : vars : 1.397e-03
: 236 : vars : 1.380e-03
: 237 : vars : 1.330e-03
: 238 : vars : 1.269e-03
: 239 : vars : 1.250e-03
: 240 : vars : 1.189e-03
: 241 : vars : 1.184e-03
: 242 : vars : 1.020e-03
: 243 : vars : 6.780e-04
: 244 : vars : 6.717e-04
: 245 : vars : 6.708e-04
: 246 : vars : 0.000e+00
: 247 : vars : 0.000e+00
: 248 : vars : 0.000e+00
: 249 : vars : 0.000e+00
: 250 : vars : 0.000e+00
: 251 : vars : 0.000e+00
: 252 : vars : 0.000e+00
: 253 : vars : 0.000e+00
: 254 : vars : 0.000e+00
: 255 : vars : 0.000e+00
: 256 : vars : 0.000e+00
: --------------------------------------
Factory : === Destroy and recreate all methods via weight files for testing ===
:
: Reading weight file: ␛[0;36mdataset/weights/TMVA_CNN_Classification_BDT.weights.xml␛[0m
Factory : ␛[1mTest all methods␛[0m
Factory : Test method: BDT for Classification performance
:
BDT : [dataset] : Evaluation of BDT on testing sample (400 events)
: Elapsed time for evaluation of 400 events: 0.00448 sec
Factory : ␛[1mEvaluate all methods␛[0m
Factory : Evaluate classifier: BDT
:
BDT : [dataset] : Loop over test events and fill histograms with classifier response...
:
: Dataset[dataset] : variable plots are not produces ! The number of variables is 256 , it is larger than 200
:
: Evaluation results ranked by best signal efficiency and purity (area)
: -------------------------------------------------------------------------------------------------------------------
: DataSet MVA
: Name: Method: ROC-integ
: dataset BDT : 0.719
: -------------------------------------------------------------------------------------------------------------------
:
: Testing efficiency compared to training efficiency (overtraining check)
: -------------------------------------------------------------------------------------------------------------------
: DataSet MVA Signal efficiency: from test sample (from training sample)
: Name: Method: @B=0.01 @B=0.10 @B=0.30
: -------------------------------------------------------------------------------------------------------------------
: dataset BDT : 0.060 (0.295) 0.300 (0.652) 0.639 (0.850)
: -------------------------------------------------------------------------------------------------------------------
:
Dataset:dataset : Created tree 'TestTree' with 400 events
:
Dataset:dataset : Created tree 'TrainTree' with 1600 events
:
Factory : ␛[1mThank you for using TMVA!␛[0m
: ␛[1mFor citation information, please visit: http://tmva.sf.net/citeTMVA.html␛[0m
import ROOT
import os
opt = [1, 1, 1, 1, 1]
useTMVACNN = opt[0]
if len(opt) > 0
else False
useKerasCNN = opt[1]
if len(opt) > 1
else False
useTMVADNN = opt[2]
if len(opt) > 2
else False
useTMVABDT = opt[3]
if len(opt) > 3
else False
usePyTorchCNN = opt[4]
if len(opt) > 4
else False
ntot = nh * nw
fileOutName = "images_data_16x16.root"
nRndmEvts = 10000
delta_sigma = 0.1
pixelNoise = 5
sX1 = 3
sY1 = 3
sX2 = sX1 + delta_sigma
sY2 = sY1 - delta_sigma
h1 =
ROOT.TH2D(
"h1",
"h1", nh, 0, 10, nw, 0, 10)
h2 =
ROOT.TH2D(
"h2",
"h2", nh, 0, 10, nw, 0, 10)
f =
TFile(fileOutName,
"RECREATE")
ROOT.Info(
"TMVA_CNN_Classification",
"Filling ROOT tree \n")
if i % 1000 == 0:
print("Generating image event ...", i)
m = k * nw + l
print(
"Signal and background tree with images data written to the file %s",
f.GetName())
nevt = 1000
if (not hasCPU and not hasGPU) :
ROOT.Warning(
"TMVA_CNN_Classificaton",
"ROOT is not supporting tmva-cpu and tmva-gpu skip using TMVA-DNN and TMVA-CNN")
useTMVACNN = False
useTMVADNN = False
useKerasCNN = False
usePyTorchCNN = False
else:
if not useTMVACNN:
"TMVA_CNN_Classificaton",
"TMVA is not build with GPU or CPU multi-thread support. Cannot use TMVA Deep Learning for CNN",
)
writeOutputFile = True
num_threads = 4
max_epochs = 10
else:
print("Running in serial mode since ROOT does not support MT")
outputFile = None
if writeOutputFile:
outputFile =
TFile.Open(
"TMVA_CNN_ClassificationOutput.root",
"RECREATE")
"TMVA_CNN_Classification",
outputFile,
V=False,
ROC=True,
Silent=False,
Color=True,
AnalysisType="Classification",
Transformations=None,
Correlations=False,
)
imgSize = 16 * 16
inputFileName = "images_data_16x16.root"
if inputFile is None:
signalWeight = 1.0
backgroundWeight = 1.0
mycuts = ""
mycutb = ""
nTrainSig = 0.8 * nEventsSig
nTrainBkg = 0.8 * nEventsBkg
mycuts,
mycutb,
nTrain_Signal=nTrainSig,
nTrain_Background=nTrainBkg,
SplitMode="Random",
SplitSeed=100,
NormMode="NumEvents",
V=False,
CalcCorrelations=False,
)
if useTMVABDT:
loader,
"BDT",
V=False,
NTrees=400,
MinNodeSize="2.5%",
MaxDepth=2,
BoostType="AdaBoost",
AdaBoostBeta=0.5,
UseBaggedBoost=True,
BaggedSampleFraction=0.5,
SeparationType="GiniIndex",
nCuts=20,
)
if useTMVADNN:
"DENSE|100|RELU,BNORM,DENSE|100|RELU,BNORM,DENSE|100|RELU,BNORM,DENSE|100|RELU,DENSE|1|LINEAR"
)
"LearningRate=1e-3,Momentum=0.9,Repetitions=1,"
"ConvergenceSteps=5,BatchSize=100,TestRepetitions=1,"
"WeightDecay=1e-4,Regularization=None,"
"Optimizer=ADAM,DropConfig=0.0+0.0+0.0+0."
)
trainingString1 += ",MaxEpochs=" + str(max_epochs)
dnnMethodName = "TMVA_DNN_CPU"
dnnOptions = "CPU"
if hasGPU :
dnnOptions = "GPU"
dnnMethodName = "TMVA_DNN_GPU"
loader,
dnnMethodName,
H=False,
V=True,
ErrorStrategy="CROSSENTROPY",
VarTransform=None,
WeightInitialization="XAVIER",
Layout=layoutString,
TrainingStrategy=trainingString1,
Architecture=dnnOptions
)
if useTMVACNN:
"LearningRate=1e-3,Momentum=0.9,Repetitions=1,"
"ConvergenceSteps=5,BatchSize=100,TestRepetitions=1,"
"WeightDecay=1e-4,Regularization=None,"
"Optimizer=ADAM,DropConfig=0.0+0.0+0.0+0.0"
)
trainingString1 += ",MaxEpochs=" + str(max_epochs)
cnnMethodName = "TMVA_CNN_CPU"
cnnOptions = "CPU"
if hasGPU:
cnnOptions = "GPU"
cnnMethodName = "TMVA_CNN_GPU"
loader,
cnnMethodName,
H=False,
V=True,
ErrorStrategy="CROSSENTROPY",
VarTransform=None,
WeightInitialization="XAVIER",
InputLayout="1|16|16",
Layout="CONV|10|3|3|1|1|1|1|RELU,BNORM,CONV|10|3|3|1|1|1|1|RELU,MAXPOOL|2|2|1|1,RESHAPE|FLAT,DENSE|100|RELU,DENSE|1|LINEAR",
TrainingStrategy=trainingString1,
Architecture=cnnOptions,
)
if usePyTorchCNN:
ROOT.Info(
"TMVA_CNN_Classification",
"Using Convolutional PyTorch Model")
pyTorchFileName += "/tmva/PyTorch_Generate_CNN_Model.py"
ROOT.Info(
"TMVA_CNN_Classification",
"Booking PyTorch CNN model")
loader,
"PyTorch",
H=True,
V=False,
VarTransform=None,
FilenameModel="PyTorchModelCNN.pt",
FilenameTrainedModel="PyTorchTrainedModelCNN.pt",
NumEpochs=max_epochs,
BatchSize=100,
UserCode=str(pyTorchFileName)
)
else:
"TMVA_CNN_Classification",
"PyTorch is not installed or model building file is not existing - skip using PyTorch",
)
if useKerasCNN:
ROOT.Info(
"TMVA_CNN_Classification",
"Building convolutional keras model")
import tensorflow
model.add(Reshape((16, 16, 1), input_shape=(256,)))
model.add(
Conv2D(10, kernel_size=(3, 3), kernel_initializer=
"TruncatedNormal", activation=
"relu", padding=
"same"))
model.add(
Conv2D(10, kernel_size=(3, 3), kernel_initializer=
"TruncatedNormal", activation=
"relu", padding=
"same"))
model.compile(loss=
"binary_crossentropy", optimizer=
Adam(learning_rate=0.001), weighted_metrics=[
"accuracy"])
else:
ROOT.Info(
"TMVA_CNN_Classification",
"Booking convolutional keras model")
loader,
"PyKeras",
H=True,
V=False,
VarTransform=None,
FilenameModel="model_cnn.h5",
FilenameTrainedModel="trained_model_cnn.h5",
NumEpochs=max_epochs,
BatchSize=100,
GpuOptions="allow_growth=True",
)
ROOT::Detail::TRangeCast< T, true > TRangeDynCast
TRangeDynCast is an adapter class that allows the typed iteration through a TCollection.
Option_t Option_t TPoint TPoint const char GetTextMagnitude GetFillStyle GetLineColor GetLineWidth GetMarkerStyle GetTextAlign GetTextColor GetTextSize void char Point_t Rectangle_t WindowAttributes_t Float_t Float_t Float_t Int_t Int_t UInt_t UInt_t Rectangle_t Int_t Int_t Window_t TString Int_t GCValues_t GetPrimarySelectionOwner GetDisplay GetScreen GetColormap GetNativeEvent const char const char dpyName wid window const char font_name cursor keysym reg const char only_if_exist regb h Point_t winding char text const char depth char const char Int_t count const char ColorStruct_t color const char Pixmap_t Pixmap_t PictureAttributes_t attr const char char ret_data h unsigned char height h Atom_t Int_t ULong_t ULong_t unsigned char prop_list Atom_t Atom_t Atom_t Time_t UChar_t len
Option_t Option_t TPoint TPoint const char GetTextMagnitude GetFillStyle GetLineColor GetLineWidth GetMarkerStyle GetTextAlign GetTextColor GetTextSize void char Point_t Rectangle_t WindowAttributes_t Float_t Float_t Float_t Int_t Int_t UInt_t UInt_t Rectangle_t Int_t Int_t Window_t TString Int_t GCValues_t GetPrimarySelectionOwner GetDisplay GetScreen GetColormap GetNativeEvent const char const char dpyName wid window const char font_name cursor keysym reg const char only_if_exist regb h Point_t winding char text const char depth char const char Int_t count const char ColorStruct_t color const char Pixmap_t Pixmap_t PictureAttributes_t attr const char char ret_data h unsigned char height h Atom_t Int_t ULong_t ULong_t unsigned char prop_list Atom_t Atom_t Atom_t Time_t format
A file, usually with extension .root, that stores data and code in the form of serialized objects in ...
This is the main MVA steering class.
- Author
- Harshal Shende
Definition in file TMVA_CNN_Classification.py.