root/html608/TestMinimization_8h_source.html

 // @(#)root/tmva $Id$
 // Author: Simon Pfreundschuh

 /*************************************************************************
  * Copyright (C) 2016, Simon Pfreundschuh
  * All rights reserved.                                                  *
  *                                                                       *
  * For the licensing terms see $ROOTSYS/LICENSE.                         *
  * For the list of contributors see $ROOTSYS/README/CREDITS.             *
  *************************************************************************/

 /////////////////////////////////////////////////////////////////////
 // Test Standard Minimizer                                         //
 //                                                                 //
 // This test trains a linear neural network on a linear function   //
 // F(x) = W * x and computes the relative error between the matrix //
 // W' representing the linear function learned by the net to the   //
 // orignal matrix W.                                               //
 /////////////////////////////////////////////////////////////////////

 #include "TMatrix.h"
 #include "TMVA/DNN/Minimizers.h"
 #include "TMVA/DNN/Net.h"
 #include "Utility.h"

 using namespace TMVA::DNN;

 /** Train a linear neural network on a randomly generated linear mapping
  *  from a 20-dimensional input space to a 1-dimensional output space.
  *  Returns the error of the response of the network to the input containing
  *  only ones to the 1x20 matrix generating the mapping.
  */
 template <typename Architecture>
    auto testMinimization()
    -> typename Architecture::Scalar_t
 {
    using Matrix_t = typename Architecture::Matrix_t;
    using Net_t    = TNet<Architecture>;

    size_t nSamples  = 10000;
    size_t nFeatures = 20;
    size_t batchSize = 256;

    TMatrixT<Double_t> XTrain(nSamples, nFeatures), YTrain(nSamples, 1),
    XTest(batchSize, nFeatures), YTest(batchSize, 1), W(nFeatures, 1);

    randomMatrix(W);
    randomMatrix(XTrain);
    randomMatrix(XTest);
    YTrain.Mult(XTrain, W);
    YTest.Mult(XTest, W);

    Net_t net(batchSize, nFeatures, ELossFunction::kMeanSquaredError);
    net.AddLayer(64, EActivationFunction::kIdentity);
    net.AddLayer(64, EActivationFunction::kIdentity);
    net.AddLayer(64, EActivationFunction::kIdentity);
    net.AddLayer(1, EActivationFunction::kIdentity);
    net.Initialize(EInitialization::kGauss);

    TGradientDescent<Architecture> minimizer(0.0001, 5, 1);
    MatrixInput_t trainingData(XTrain, YTrain);
    MatrixInput_t testData(XTest, YTest);
    minimizer.TrainMomentum(trainingData, nSamples, testData, batchSize, net, 0.8, 1);

    TMatrixT<Double_t> I(nFeatures, nFeatures);
    for (size_t i = 0; i < nFeatures; i++) {
       I(i, i) = 1.0;
    }
    Matrix_t Id(I);
    auto clone = net.CreateClone(nFeatures);
    clone.Forward(Id);
    TMatrixT<Double_t> Y(clone.GetOutput());

    return maximumRelativeError(Y, W);
 }

 /** Similar to testMinimization() as the function above except that
  *  it uses momentum for the training */
 template <typename Architecture>
    auto testMinimizationMomentum()
    -> typename Architecture::Scalar_t
 {
    using Matrix_t = typename Architecture::Matrix_t;
    using Net_t    = TNet<Architecture>;

    size_t nSamples  = 10000;
    size_t nFeatures = 20;
    size_t batchSize = 256;

    TMatrixT<Double_t> XTrain(nSamples, nFeatures), YTrain(nSamples, 1),
    XTest(batchSize, nFeatures), YTest(batchSize, 1), W(nFeatures, 1);

    randomMatrix(W);
    randomMatrix(XTrain);
    randomMatrix(XTest);
    YTrain.Mult(XTrain, W);
    YTest.Mult(XTest, W);

    Net_t net(batchSize, nFeatures, ELossFunction::kMeanSquaredError);
    net.AddLayer(64, EActivationFunction::kIdentity);
    net.AddLayer(64, EActivationFunction::kIdentity);
    net.AddLayer(64, EActivationFunction::kIdentity);
    net.AddLayer(1, EActivationFunction::kIdentity);
    net.Initialize(EInitialization::kGauss);

    TGradientDescent<Architecture> minimizer(0.0001, 5, 5);
    MatrixInput_t trainingData(XTrain, YTrain);
    MatrixInput_t testData(XTest, YTest);
    minimizer.TrainMomentum(trainingData, nSamples, testData, batchSize, net, 0.9, 1);

    TMatrixT<Double_t> I(nFeatures, nFeatures);
    for (size_t i = 0; i < nFeatures; i++) {
       I(i, i) = 1.0;
    }
    Matrix_t Id(I);
    auto clone = net.CreateClone(nFeatures);
    clone.Forward(Id);
    TMatrixT<Double_t> Y(clone.GetOutput());

    return maximumRelativeError(Y, W);
 }
TMVA::DNN::randomMatrix
void randomMatrix(AMatrix &X)
Fill matrix with random, Gaussian-distributed values.
Definition: Utility.h:59

TMVA::DNN::maximumRelativeError
auto maximumRelativeError(const AMatrix &X, const AMatrix &Y) -> decltype(X(0, 0))
Compute the maximum, element-wise relative error of the matrices X and Y normalized by the element of...
Definition: Utility.h:213

TMVA::DNN::TGradientDescent::TrainMomentum
Scalar_t TrainMomentum(const Data_t &TrainingDataIn, size_t nTrainingSamples, const Data_t &TestDataIn, size_t nTestSamples, Net_t &net, Scalar_t momentum, size_t nThreads=1)
Same as Train(...) but uses the given momentum.

TMVA::DNN::TGradientDescent
Definition: Minimizers.h:53

TMVA::DNN::ELossFunction::kMeanSquaredError

TMVA::DNN
Definition: Blas.h:58

TMatrixT< Double_t >

Y
Definition: rotationApplication.cxx:230

TMVA::DNN::TNet
Generic neural network class.
Definition: Net.h:49

TMVA::DNN::EInitialization::kGauss

Minimizers.h

Net.h

testMinimization
auto testMinimization() -> typename Architecture::Scalar_t
Train a linear neural network on a randomly generated linear mapping from a 20-dimensional input spac...
Definition: TestMinimization.h:34

testMinimizationMomentum
auto testMinimizationMomentum() -> typename Architecture::Scalar_t
Similar to testMinimization() as the function above except that it uses momentum for the training...
Definition: TestMinimization.h:80

TMatrix.h

I
#define I(x, y, z)

TMVA::DNN::EActivationFunction::kIdentity

TMVA::DNN::MatrixInput_t
std::pair< const TMatrixT< Double_t > &, const TMatrixT< Double_t > & > MatrixInput_t
Definition: DataLoader.h:34

Utility.h