doc/v616/Cpu_8h_source.html

// @(#)root/tmva/tmva/dnn:$Id$

// Author: Simon Pfreundschuh 05/07/16


/*************************************************************************

 * Copyright (C) 2016, Simon Pfreundschuh                                *

 * All rights reserved.                                                  *

 *                                                                       *

 * For the licensing terms see $ROOTSYS/LICENSE.                         *

 * For the list of contributors see $ROOTSYS/README/CREDITS.             *

 *************************************************************************/


 //////////////////////////////////////////////////////////////////

// Definition of the TCpu architecture, which provides a         //

 // multi-threaded CPU implementation of the low-level interface //

 // networks for Cpus using BLAS and Roots TThreadExecutor            //

 //////////////////////////////////////////////////////////////////


#ifndef TMVA_DNN_ARCHITECTURES_CPU

#define TMVA_DNN_ARCHITECTURES_CPU


#include "TMVA/DNN/Functions.h"

#include "TMVA/DNN/CNN/ConvLayer.h"


#include "Cpu/CpuBuffer.h"

#include "Cpu/CpuMatrix.h"

#include <vector>


class TRandom;


namespace TMVA

{

namespace DNN

{

   //class EActivationFunction;


/** The TCpu architecture class.

 *

 * Low-level interface class for multi-threaded CPU architectures. Contains as

 * public types the declaration of the scalar, matrix and data loader types

 * for this architecture as well as the remaining functions in the low-level

 * interface in the form of static members.

 */

template<typename AReal = Real_t>

class TCpu

{

private:

   static TRandom * fgRandomGen;

public:


   using Scalar_t       = AReal;

   using Matrix_t       = TCpuMatrix<AReal>;

   using HostBuffer_t   = TCpuBuffer<AReal>;

   using DeviceBuffer_t = TCpuBuffer<AReal>;


   //____________________________________________________________________________

   //

   // Propagation

   //____________________________________________________________________________


   /** @name Forward Propagation

    * Low-level functions required for the forward propagation of activations

    * through the network.

    */

   ///@{

   /** Matrix-multiply \p input with the transpose of \pweights and

    *  write the results into \p output. */

   static void MultiplyTranspose(TCpuMatrix<Scalar_t> &output,

                                 const TCpuMatrix<Scalar_t> &input,

                                 const TCpuMatrix<Scalar_t> &weights);

   /** Add the vectors biases row-wise to the matrix output */

   static void AddRowWise(TCpuMatrix<Scalar_t> &output,

                          const TCpuMatrix<Scalar_t> &biases);

   ///@}


   /** @name Backward Propagation

    * Low-level functions required for the forward propagation of activations

    * through the network.

    */

   ///@{

   /** Perform the complete backward propagation step. If the provided

    *  \p activationGradientsBackward matrix is not empty, compute the

    *  gradients of the objective function with respect to the activations

    *  of the previous layer (backward direction).

    *  Also compute the weight and the bias gradients. Modifies the values

    *  in \p df and thus produces only a valid result, if it is applied the

    *  first time after the corresponding forward propagation has been per-

    *  formed. */

   static void Backward(TCpuMatrix<Scalar_t> & activationGradientsBackward,

                        TCpuMatrix<Scalar_t> & weightGradients,

                        TCpuMatrix<Scalar_t> & biasGradients,

                        TCpuMatrix<Scalar_t> & df,

                        const TCpuMatrix<Scalar_t> & activationGradients,

                        const TCpuMatrix<Scalar_t> & weights,

                        const TCpuMatrix<Scalar_t> & activationBackward);

   /** Backward pass for Recurrent Networks */

   static Matrix_t & RecurrentLayerBackward(TCpuMatrix<Scalar_t> & state_gradients_backward, // BxH

                                            TCpuMatrix<Scalar_t> & input_weight_gradients,

                                            TCpuMatrix<Scalar_t> & state_weight_gradients,

                                            TCpuMatrix<Scalar_t> & bias_gradients,

                                            TCpuMatrix<Scalar_t> & df, //DxH

                                            const TCpuMatrix<Scalar_t> & state, // BxH

                                            const TCpuMatrix<Scalar_t> & weights_input, // HxD

                                            const TCpuMatrix<Scalar_t> & weights_state, // HxH

                                            const TCpuMatrix<Scalar_t> & input,  // BxD

                                            TCpuMatrix<Scalar_t> & input_gradient);

   /** Adds a the elements in matrix B scaled by c to the elements in

    *  the matrix A. This is required for the weight update in the gradient

    *  descent step.*/

   static void ScaleAdd(TCpuMatrix<Scalar_t> & A,

                        const TCpuMatrix<Scalar_t> & B,

                        Scalar_t beta = 1.0);


   static void Copy(TCpuMatrix<Scalar_t> & B,

                    const TCpuMatrix<Scalar_t> & A);


   // copy from another type of matrix

   template<typename AMatrix_t>

   static void CopyDiffArch(TCpuMatrix<Scalar_t> & B, const AMatrix_t & A);


   /** Above functions extended to vectors */

   static void ScaleAdd(std::vector<TCpuMatrix<Scalar_t>> & A,

                        const std::vector<TCpuMatrix<Scalar_t>> & B,

                        Scalar_t beta = 1.0);


   static void Copy(std::vector<TCpuMatrix<Scalar_t>> & A,

                    const std::vector<TCpuMatrix<Scalar_t>> & B);


   // copy from another architecture

   template<typename AMatrix_t>

   static void CopyDiffArch(std::vector<TCpuMatrix<Scalar_t>> & A,

                    const std::vector<AMatrix_t> & B);


   ///@}


   //____________________________________________________________________________

   //

   // Activation Functions

   //____________________________________________________________________________


   /** @name Activation Functions

    * For each activation function, the low-level interface contains two routines.

    * One that applies the acitvation function to a matrix and one that evaluate

    * the derivatives of the activation function at the elements of a given matrix

    * and writes the results into the result matrix.

    */

   ///@{

   static void IdentityDerivative(TCpuMatrix<Scalar_t> & B,

                                  const TCpuMatrix<Scalar_t> &A);


   static void Relu(TCpuMatrix<Scalar_t> & B);

   static void ReluDerivative(TCpuMatrix<Scalar_t> & B,

                              const TCpuMatrix<Scalar_t> & A);


   static void Sigmoid(TCpuMatrix<Scalar_t> & B);

   static void SigmoidDerivative(TCpuMatrix<Scalar_t> & B,

                                 const TCpuMatrix<Scalar_t> & A);


   static void Tanh(TCpuMatrix<Scalar_t> & B);

   static void TanhDerivative(TCpuMatrix<Scalar_t> & B,

                              const TCpuMatrix<Scalar_t> & A);


   static void SymmetricRelu(TCpuMatrix<Scalar_t> & B);

   static void SymmetricReluDerivative(TCpuMatrix<Scalar_t> & B,

                                       const TCpuMatrix<Scalar_t> & A);


   static void SoftSign(TCpuMatrix<Scalar_t> & B);

   static void SoftSignDerivative(TCpuMatrix<Scalar_t> & B,

                                  const TCpuMatrix<Scalar_t> & A);


   static void Gauss(TCpuMatrix<Scalar_t> & B);

   static void GaussDerivative(TCpuMatrix<Scalar_t> & B,

                               const TCpuMatrix<Scalar_t> & A);

   ///@}


   //____________________________________________________________________________

   //

   // Loss Functions

   //____________________________________________________________________________


   /** @name Loss Functions

    * Loss functions compute a scalar value given the \p output of the network

    * for a given training input and the expected network prediction \p Y that

    * quantifies the quality of the prediction. For each function also a routing

    * that computes the gradients (suffixed by Gradients) must be provided for

    * the starting of the backpropagation algorithm.

    */

   ///@{


   static Scalar_t MeanSquaredError(const TCpuMatrix<Scalar_t> &Y, const TCpuMatrix<Scalar_t> &output,

                                    const TCpuMatrix<Scalar_t> &weights);

   static void MeanSquaredErrorGradients(TCpuMatrix<Scalar_t> &dY, const TCpuMatrix<Scalar_t> &Y,

                                         const TCpuMatrix<Scalar_t> &output, const TCpuMatrix<Scalar_t> &weights);


   /** Sigmoid transformation is implicitly applied, thus \p output should

    *  hold the linear activations of the last layer in the net. */

   static Scalar_t CrossEntropy(const TCpuMatrix<Scalar_t> &Y, const TCpuMatrix<Scalar_t> &output,

                                const TCpuMatrix<Scalar_t> &weights);


   static void CrossEntropyGradients(TCpuMatrix<Scalar_t> &dY, const TCpuMatrix<Scalar_t> &Y,

                                     const TCpuMatrix<Scalar_t> &output, const TCpuMatrix<Scalar_t> &weights);


   /** Softmax transformation is implicitly applied, thus \p output should

    *  hold the linear activations of the last layer in the net. */

   static Scalar_t SoftmaxCrossEntropy(const TCpuMatrix<Scalar_t> &Y, const TCpuMatrix<Scalar_t> &output,

                                       const TCpuMatrix<Scalar_t> &weights);

   static void SoftmaxCrossEntropyGradients(TCpuMatrix<Scalar_t> &dY, const TCpuMatrix<Scalar_t> &Y,

                                            const TCpuMatrix<Scalar_t> &output, const TCpuMatrix<Scalar_t> &weights);

   ///@}


   //____________________________________________________________________________

   //

   // Output Functions

   //____________________________________________________________________________


   /** @name Output Functions

    * Output functions transform the activations \p output of the

    * output layer in the network to a valid prediction \p YHat for

    * the desired usage of the network, e.g.  the identity function

    * for regression or the sigmoid transformation for two-class

    * classification.

    */

   ///@{

   static void Sigmoid(TCpuMatrix<Scalar_t> &YHat,

                        const TCpuMatrix<Scalar_t> & );

   static void Softmax(TCpuMatrix<Scalar_t> &YHat,

                       const TCpuMatrix<Scalar_t> & );

   ///@}


   //____________________________________________________________________________

   //

   // Regularization

   //____________________________________________________________________________


   /** @name Regularization

    * For each regularization type two functions are required, one named

    * <tt><Type>Regularization</tt> that evaluates the corresponding

    * regularization functional for a given weight matrix and the

    * <tt>Add<Type>RegularizationGradients</tt>, that adds the regularization

    * component in the gradients to the provided matrix.

    */

   ///@{


   static Scalar_t L1Regularization(const TCpuMatrix<Scalar_t> & W);

   static void AddL1RegularizationGradients(TCpuMatrix<Scalar_t> & A,

                                            const TCpuMatrix<Scalar_t> & W,

                                            Scalar_t weightDecay);


   static Scalar_t L2Regularization(const TCpuMatrix<Scalar_t> & W);

   static void AddL2RegularizationGradients(TCpuMatrix<Scalar_t> & A,

                                            const TCpuMatrix<Scalar_t> & W,

                                            Scalar_t weightDecay);

   ///@}


   //____________________________________________________________________________

   //

   // Initialization

   //____________________________________________________________________________


   /** @name Initialization

    * For each initialization method, one function in the low-level interface

    * is provided. The naming scheme is <p>Initialize<Type></p> for a given

    * initialization method Type.

    */

   ///@{


   static void InitializeGauss(TCpuMatrix<Scalar_t> & A);

   static void InitializeUniform(TCpuMatrix<Scalar_t> & A);

   static void InitializeIdentity(TCpuMatrix<Scalar_t> & A);

   static void InitializeZero(TCpuMatrix<Scalar_t> & A);

   static void InitializeGlorotNormal(TCpuMatrix<Scalar_t> & A);

   static void InitializeGlorotUniform(TCpuMatrix<Scalar_t> & A);


   // return static instance of random generator used for initialization

   // if generator does not exist it is created the first time with a random seed (e.g. seed = 0)

   static TRandom & GetRandomGenerator();

   // set random seed for the static geenrator

   // if the static geneerator does not exists it is created

   static void SetRandomSeed(size_t seed);

   ///@}


   //____________________________________________________________________________

   //

   // Dropout

   //____________________________________________________________________________


   /** @name Dropout

    */

   ///@{


   /** Apply dropout with activation probability \p p to the given

    *  matrix \p A and scale the result by reciprocal of \p p. */

   static void Dropout(TCpuMatrix<Scalar_t> & A, Scalar_t p);


   ///@}


   //____________________________________________________________________________

   //

   //  Convolutional Layer Propagation

   //____________________________________________________________________________


   /** @name Forward Propagation in Convolutional Layer

    */

   ///@{


   /** Calculate how many neurons "fit" in the output layer, given the input as well as the layer's hyperparameters. */

   static size_t calculateDimension(size_t imgDim, size_t fltDim, size_t padding, size_t stride);


   /** Transform the matrix B in local view format, suitable for

    *  convolution, and store it in matrix A */

   static void Im2col(TCpuMatrix<AReal> &A,

                      const TCpuMatrix<AReal> &B,

                      size_t imgHeight,

                      size_t imgWidth,

                      size_t fltHeight,

                      size_t fltWidth,

                      size_t strideRows,

                      size_t strideCols,

                      size_t zeroPaddingHeight,

                      size_t zeroPaddingWidth);


   static void Im2colIndices(std::vector<int> &V, const TCpuMatrix<AReal> &B, size_t nLocalViews, size_t imgHeight, size_t imgWidth, size_t fltHeight,

                      size_t fltWidth, size_t strideRows, size_t strideCols, size_t zeroPaddingHeight,

                      size_t zeroPaddingWidth);

   static void Im2colFast(TCpuMatrix<AReal> &A, const TCpuMatrix<AReal> &B, const std::vector<int> & V);


   /** Rotates the matrix \p B, which is representing a weights,

    *  and stores them in the matrix \p A. */

   static void RotateWeights(TCpuMatrix<AReal> &A, const TCpuMatrix<AReal> &B, size_t filterDepth, size_t filterHeight,

                             size_t filterWidth, size_t numFilters);


   /** Add the biases in the Convolutional Layer.  */

   static void AddConvBiases(TCpuMatrix<Scalar_t> &output, const TCpuMatrix<Scalar_t> &biases);

   ///@}


   /** Dummy placeholder - preparation is currently only required for the CUDA architecture. */

   static void PrepareInternals(std::vector<TCpuMatrix<Scalar_t>> &) {}


   /** Forward propagation in the Convolutional layer */

   static void ConvLayerForward(std::vector<TCpuMatrix<Scalar_t>> & output,

                                std::vector<TCpuMatrix<Scalar_t>> & derivatives,

                                const std::vector<TCpuMatrix<Scalar_t>> &input,

                                const TCpuMatrix<Scalar_t> &weights, const TCpuMatrix<Scalar_t> & biases,

                                const DNN::CNN::TConvParams & params, EActivationFunction activFunc,

                                std::vector<TCpuMatrix<Scalar_t>> & /* inputPrime */);


   /** @name Backward Propagation in Convolutional Layer

    */

   ///@{


   /** Perform the complete backward propagation step in a Convolutional Layer.

    *  If the provided \p activationGradientsBackward matrix is not empty, compute the

    *  gradients of the objective function with respect to the activations

    *  of the previous layer (backward direction).

    *  Also compute the weight and the bias gradients. Modifies the values

    *  in \p df and thus produces only a valid result, if it is applied the

    *  first time after the corresponding forward propagation has been per-

    *  formed. */

   static void ConvLayerBackward(std::vector<TCpuMatrix<Scalar_t>> &activationGradientsBackward,

                                 TCpuMatrix<Scalar_t> &weightGradients, TCpuMatrix<Scalar_t> &biasGradients,

                                 std::vector<TCpuMatrix<Scalar_t>> &df,

                                 const std::vector<TCpuMatrix<Scalar_t>> &activationGradients,

                                 const TCpuMatrix<Scalar_t> &weights,

                                 const std::vector<TCpuMatrix<Scalar_t>> &activationBackward, size_t batchSize,

                                 size_t inputHeight, size_t inputWidth, size_t depth, size_t height, size_t width,

                                 size_t filterDepth, size_t filterHeight, size_t filterWidth, size_t nLocalViews);


   /** Utility function for calculating the activation gradients of the layer

    *  before the convolutional layer. */

   static void CalculateConvActivationGradients(std::vector<TCpuMatrix<Scalar_t>> &activationGradientsBackward,

                                                const std::vector<TCpuMatrix<Scalar_t>> &df,

                                                const TCpuMatrix<Scalar_t> &weights, size_t batchSize,

                                                size_t inputHeight, size_t inputWidth, size_t depth, size_t height,

                                                size_t width, size_t filterDepth, size_t filterHeight,

                                                size_t filterWidth);


   /** Utility function for calculating the weight gradients of the convolutional

    * layer. */

   static void CalculateConvWeightGradients(TCpuMatrix<Scalar_t> &weightGradients,

                                            const std::vector<TCpuMatrix<Scalar_t>> &df,

                                            const std::vector<TCpuMatrix<Scalar_t>> &activations_backward,

                                            size_t batchSize, size_t inputHeight, size_t inputWidth, size_t depth,

                                            size_t height, size_t width, size_t filterDepth, size_t filterHeight,

                                            size_t filterWidth, size_t nLocalViews);


   /** Utility function for calculating the bias gradients of the convolutional

    *  layer */

   static void CalculateConvBiasGradients(TCpuMatrix<Scalar_t> &biasGradients, const std::vector<TCpuMatrix<Scalar_t>> &df,

                                          size_t batchSize, size_t depth, size_t nLocalViews);

   ///@}


   //____________________________________________________________________________

   //

   //  Max Pooling Layer Propagation

   //____________________________________________________________________________

   /** @name Forward Propagation in Max Pooling Layer

    */

   ///@{


   /** Downsample the matrix \p C to the matrix \p A, using max

    * operation, such that the winning indices are stored in matrix

    * \p B. */

   static void Downsample(TCpuMatrix<AReal> &A, TCpuMatrix<AReal> &B, const TCpuMatrix<AReal> &C, size_t imgHeight,

                          size_t imgWidth, size_t fltHeight, size_t fltWidth, size_t strideRows, size_t strideCols);


   ///@}


   /** @name Backward Propagation in Max Pooling Layer

    */

   ///@{

   /** Perform the complete backward propagation step in a Pooling Layer. Based on the

    *  winning idices stored in the index matrix, it just forwards the actiovation

    *  gradients to the previous layer. */

   static void MaxPoolLayerBackward(TCpuMatrix<AReal> &activationGradientsBackward,

                                    const TCpuMatrix<AReal> &activationGradients,

                                    const TCpuMatrix<AReal> &indexMatrix,

                                    size_t imgHeight,

                                    size_t imgWidth,

                                    size_t fltHeight,

                                    size_t fltWidth,

                                    size_t strideRows,

                                    size_t strideCols,

                                    size_t nLocalViews);


   ///@}


   //____________________________________________________________________________

   //

   //  Reshape Layer Propagation

   //____________________________________________________________________________

   /** @name Forward and Backward Propagation in Reshape Layer

    */

   ///@{


   /** Transform the matrix \p B to a matrix with different dimensions \p A */

   static void Reshape(TCpuMatrix<AReal> &A, const TCpuMatrix<AReal> &B);


   /** Flattens the tensor \p B, such that each matrix, is stretched in

    *  one row, resulting with a matrix \p A. */

   static void Flatten(TCpuMatrix<AReal> &A, const std::vector<TCpuMatrix<AReal>> &B, size_t size, size_t nRows,

                       size_t nCols);


   /** Transforms each row of \p B to a matrix and stores it in the

    *  tensor \p B. */

   static void Deflatten(std::vector<TCpuMatrix<AReal>> &A, const TCpuMatrix<AReal> &B, size_t index, size_t nRows,

                         size_t nCols);

   /** Rearrage data accoring to time fill B x T x D out with T x B x D matrix in*/

   static void Rearrange(std::vector<TCpuMatrix<AReal>> &out, const std::vector<TCpuMatrix<AReal>> &in);


   ///@}


   //____________________________________________________________________________

   //

   // Additional Arithmetic Functions

   //____________________________________________________________________________


   /** @name Additional Arithmetic Functions

    *

    * Additional arithmetic on CUDA matrices  used to implement the low-level

    * interface.

    */

   ///@{


   /** Standard multiplication of two matrices \p A and \p B with the result being

    *  written into C.

    */

   static void Multiply(TCpuMatrix<Scalar_t> &C,

                        const TCpuMatrix<Scalar_t> &A,

                        const TCpuMatrix<Scalar_t> &B);

   /** Matrix multiplication of two matrices \p A and \p B^T (transposed) with the

    *  result being written into C.

    */

   static void TransposeMultiply(TCpuMatrix<Scalar_t> &output,

                                 const TCpuMatrix<Scalar_t> &input,

                                 const TCpuMatrix<Scalar_t> &Weights,

                                 Scalar_t alpha = 1.0, Scalar_t beta = 0.);

   /** In-place Hadamard (element-wise) product of matrices \p A and \p B

    *  with the result being written into \p A.

    */

   static void Hadamard(TCpuMatrix<Scalar_t> &A,

                        const TCpuMatrix<Scalar_t> &B);


   /** Sum columns of (m x n) matrixx \p A and write the results into the first

    * m elements in \p A.

    */

   static void SumColumns(TCpuMatrix<Scalar_t> &B,

                          const TCpuMatrix<Scalar_t> &A,

                          Scalar_t alpha = 1.0, Scalar_t beta = 0.);


   /** Compute the sum of all elements in \p A */

   static Scalar_t Sum(const TCpuMatrix<Scalar_t> &A);


   /** Check two matrices for equality, taking floating point arithmetic errors into account. */

   static bool AlmostEquals(const TCpuMatrix<Scalar_t> &A, const TCpuMatrix<Scalar_t> &B, double epsilon = 0.1);


   /** Add the constant \p beta to all the elements of matrix \p A and write the

    * result into \p A.

    */

   static void ConstAdd(TCpuMatrix<Scalar_t> &A, Scalar_t beta);


   /** Multiply the constant \p beta to all the elements of matrix \p A and write the

    * result into \p A.

    */

   static void ConstMult(TCpuMatrix<Scalar_t> &A, Scalar_t beta);


   /** Reciprocal each element of the matrix \p A and write the result into

    * \p A

    */

   static void ReciprocalElementWise(TCpuMatrix<Scalar_t> &A);


   /** Square each element of the matrix \p A and write the result into

    * \p A

    */

   static void SquareElementWise(TCpuMatrix<Scalar_t> &A);


   /** Square root each element of the matrix \p A and write the result into

    * \p A

    */

   static void SqrtElementWise(TCpuMatrix<Scalar_t> &A);


     // optimizer functions

   static void AdamUpdate(TCpuMatrix<Scalar_t> & A, const TCpuMatrix<Scalar_t> & M, const TCpuMatrix<Scalar_t> & V, Scalar_t alpha, Scalar_t eps);

   static void AdamUpdateFirstMom(TCpuMatrix<Scalar_t> & A, const TCpuMatrix<Scalar_t> & B, Scalar_t beta);

   static void AdamUpdateSecondMom(TCpuMatrix<Scalar_t> & A, const TCpuMatrix<Scalar_t> & B, Scalar_t beta);


};


//____________________________________________________________________________

template <typename Real_t>

template <typename AMatrix_t>

void TCpu<Real_t>::CopyDiffArch(TCpuMatrix<Real_t> &B,

                        const AMatrix_t &A)

{

   // copy from another architecture using the reference one

   // this is not very efficient since creates temporary objects

   TMatrixT<Real_t> tmp = A;

   Copy(B, TCpuMatrix<Real_t>(tmp) );

}


//____________________________________________________________________________

template <typename Real_t>

template <typename AMatrix_t>

void TCpu<Real_t>::CopyDiffArch(std::vector<TCpuMatrix<Real_t>> &B,

                            const std::vector<AMatrix_t> &A)

{

   for (size_t i = 0; i < B.size(); ++i) {

      CopyDiffArch(B[i], A[i]);

   }

}


} // namespace DNN

} // namespace TMVA


#endif

ConvLayer.h

CpuBuffer.h

CpuMatrix.h

width
include TDocParser_001 C image html pict1_TDocParser_001 png width
Definition: TDocParser.cxx:121

TMVA::DNN::TCpuBuffer
TCpuBuffer.
Definition: CpuBuffer.h:44

TMVA::DNN::TCpuMatrix
The TCpuMatrix class.
Definition: CpuMatrix.h:89

TMVA::DNN::TCpu
The TCpu architecture class.
Definition: Cpu.h:45

TMVA::DNN::TCpu::SymmetricRelu
static void SymmetricRelu(TCpuMatrix< Scalar_t > &B)
Definition: ActivationFunctions.cxx:101

TMVA::DNN::TCpu::fgRandomGen
static TRandom * fgRandomGen
Definition: Cpu.h:47

TMVA::DNN::TCpu::CalculateConvActivationGradients
static void CalculateConvActivationGradients(std::vector< TCpuMatrix< Scalar_t > > &activationGradientsBackward, const std::vector< TCpuMatrix< Scalar_t > > &df, const TCpuMatrix< Scalar_t > &weights, size_t batchSize, size_t inputHeight, size_t inputWidth, size_t depth, size_t height, size_t width, size_t filterDepth, size_t filterHeight, size_t filterWidth)
Utility function for calculating the activation gradients of the layer before the convolutional layer...
Definition: Propagation.cxx:374

TMVA::DNN::TCpu::Im2col
static void Im2col(TCpuMatrix< AReal > &A, const TCpuMatrix< AReal > &B, size_t imgHeight, size_t imgWidth, size_t fltHeight, size_t fltWidth, size_t strideRows, size_t strideCols, size_t zeroPaddingHeight, size_t zeroPaddingWidth)
Transform the matrix B in local view format, suitable for convolution, and store it in matrix A.
Definition: Propagation.cxx:99

TMVA::DNN::TCpu::AddRowWise
static void AddRowWise(TCpuMatrix< Scalar_t > &output, const TCpuMatrix< Scalar_t > &biases)
Add the vectors biases row-wise to the matrix output.
Definition: Propagation.cxx:60

TMVA::DNN::TCpu::Scalar_t
AReal Scalar_t
Definition: Cpu.h:50

TMVA::DNN::TCpu::Hadamard
static void Hadamard(TCpuMatrix< Scalar_t > &A, const TCpuMatrix< Scalar_t > &B)
In-place Hadamard (element-wise) product of matrices A and B with the result being written into A.
Definition: Arithmetic.cxx:91

TMVA::DNN::TCpu::AddL2RegularizationGradients
static void AddL2RegularizationGradients(TCpuMatrix< Scalar_t > &A, const TCpuMatrix< Scalar_t > &W, Scalar_t weightDecay)
Definition: Regularization.cxx:131

TMVA::DNN::TCpu::CrossEntropyGradients
static void CrossEntropyGradients(TCpuMatrix< Scalar_t > &dY, const TCpuMatrix< Scalar_t > &Y, const TCpuMatrix< Scalar_t > &output, const TCpuMatrix< Scalar_t > &weights)
Definition: LossFunctions.cxx:106

TMVA::DNN::TCpu::L2Regularization
static Scalar_t L2Regularization(const TCpuMatrix< Scalar_t > &W)
Definition: Regularization.cxx:97

TMVA::DNN::TCpu::Im2colFast
static void Im2colFast(TCpuMatrix< AReal > &A, const TCpuMatrix< AReal > &B, const std::vector< int > &V)
Definition: Propagation.cxx:202

TMVA::DNN::TCpu::Copy
static void Copy(std::vector< TCpuMatrix< Scalar_t > > &A, const std::vector< TCpuMatrix< Scalar_t > > &B)

TMVA::DNN::TCpu::Copy
static void Copy(TCpuMatrix< Scalar_t > &B, const TCpuMatrix< Scalar_t > &A)

TMVA::DNN::TCpu::SoftmaxCrossEntropy
static Scalar_t SoftmaxCrossEntropy(const TCpuMatrix< Scalar_t > &Y, const TCpuMatrix< Scalar_t > &output, const TCpuMatrix< Scalar_t > &weights)
Softmax transformation is implicitly applied, thus output should hold the linear activations of the l...
Definition: LossFunctions.cxx:130

TMVA::DNN::TCpu::AdamUpdateSecondMom
static void AdamUpdateSecondMom(TCpuMatrix< Scalar_t > &A, const TCpuMatrix< Scalar_t > &B, Scalar_t beta)
Definition: Arithmetic.cxx:286

TMVA::DNN::TCpu::MeanSquaredError
static Scalar_t MeanSquaredError(const TCpuMatrix< Scalar_t > &Y, const TCpuMatrix< Scalar_t > &output, const TCpuMatrix< Scalar_t > &weights)
Definition: LossFunctions.cxx:26

TMVA::DNN::TCpu::Gauss
static void Gauss(TCpuMatrix< Scalar_t > &B)
Definition: ActivationFunctions.cxx:141

TMVA::DNN::TCpu::Dropout
static void Dropout(TCpuMatrix< Scalar_t > &A, Scalar_t p)
Apply dropout with activation probability p to the given matrix A and scale the result by reciprocal ...
Definition: Dropout.cxx:24

TMVA::DNN::TCpu::TransposeMultiply
static void TransposeMultiply(TCpuMatrix< Scalar_t > &output, const TCpuMatrix< Scalar_t > &input, const TCpuMatrix< Scalar_t > &Weights, Scalar_t alpha=1.0, Scalar_t beta=0.)
Matrix multiplication of two matrices A and B^T (transposed) with the result being written into C.
Definition: Arithmetic.cxx:62

TMVA::DNN::TCpu::AdamUpdateFirstMom
static void AdamUpdateFirstMom(TCpuMatrix< Scalar_t > &A, const TCpuMatrix< Scalar_t > &B, Scalar_t beta)
Definition: Arithmetic.cxx:274

TMVA::DNN::TCpu::InitializeUniform
static void InitializeUniform(TCpuMatrix< Scalar_t > &A)
Definition: Initialization.cxx:62

TMVA::DNN::TCpu::ScaleAdd
static void ScaleAdd(std::vector< TCpuMatrix< Scalar_t > > &A, const std::vector< TCpuMatrix< Scalar_t > > &B, Scalar_t beta=1.0)
Above functions extended to vectors.

TMVA::DNN::TCpu::Downsample
static void Downsample(TCpuMatrix< AReal > &A, TCpuMatrix< AReal > &B, const TCpuMatrix< AReal > &C, size_t imgHeight, size_t imgWidth, size_t fltHeight, size_t fltWidth, size_t strideRows, size_t strideCols)
Downsample the matrix C to the matrix A, using max operation, such that the winning indices are store...
Definition: Propagation.cxx:549

TMVA::DNN::TCpu::CalculateConvWeightGradients
static void CalculateConvWeightGradients(TCpuMatrix< Scalar_t > &weightGradients, const std::vector< TCpuMatrix< Scalar_t > > &df, const std::vector< TCpuMatrix< Scalar_t > > &activations_backward, size_t batchSize, size_t inputHeight, size_t inputWidth, size_t depth, size_t height, size_t width, size_t filterDepth, size_t filterHeight, size_t filterWidth, size_t nLocalViews)
Utility function for calculating the weight gradients of the convolutional layer.
Definition: Propagation.cxx:443

TMVA::DNN::TCpu::RecurrentLayerBackward
static Matrix_t & RecurrentLayerBackward(TCpuMatrix< Scalar_t > &state_gradients_backward, TCpuMatrix< Scalar_t > &input_weight_gradients, TCpuMatrix< Scalar_t > &state_weight_gradients, TCpuMatrix< Scalar_t > &bias_gradients, TCpuMatrix< Scalar_t > &df, const TCpuMatrix< Scalar_t > &state, const TCpuMatrix< Scalar_t > &weights_input, const TCpuMatrix< Scalar_t > &weights_state, const TCpuMatrix< Scalar_t > &input, TCpuMatrix< Scalar_t > &input_gradient)
Backward pass for Recurrent Networks.
Definition: RecurrentPropagation.cxx:28

TMVA::DNN::TCpu::SymmetricReluDerivative
static void SymmetricReluDerivative(TCpuMatrix< Scalar_t > &B, const TCpuMatrix< Scalar_t > &A)
Definition: ActivationFunctions.cxx:109

TMVA::DNN::TCpu::Relu
static void Relu(TCpuMatrix< Scalar_t > &B)
Definition: ActivationFunctions.cxx:44

TMVA::DNN::TCpu::InitializeGlorotNormal
static void InitializeGlorotNormal(TCpuMatrix< Scalar_t > &A)
Truncated normal initialization (Glorot, called also Xavier normal) The values are sample with a norm...
Definition: Initialization.cxx:85

TMVA::DNN::TCpu::InitializeIdentity
static void InitializeIdentity(TCpuMatrix< Scalar_t > &A)
Definition: Initialization.cxx:129

TMVA::DNN::TCpu::AdamUpdate
static void AdamUpdate(TCpuMatrix< Scalar_t > &A, const TCpuMatrix< Scalar_t > &M, const TCpuMatrix< Scalar_t > &V, Scalar_t alpha, Scalar_t eps)
Adam updates.
Definition: Arithmetic.cxx:260

TMVA::DNN::TCpu::MaxPoolLayerBackward
static void MaxPoolLayerBackward(TCpuMatrix< AReal > &activationGradientsBackward, const TCpuMatrix< AReal > &activationGradients, const TCpuMatrix< AReal > &indexMatrix, size_t imgHeight, size_t imgWidth, size_t fltHeight, size_t fltWidth, size_t strideRows, size_t strideCols, size_t nLocalViews)
Perform the complete backward propagation step in a Pooling Layer.
Definition: Propagation.cxx:582

TMVA::DNN::TCpu::GetRandomGenerator
static TRandom & GetRandomGenerator()
Definition: Initialization.cxx:35

TMVA::DNN::TCpu::SoftSign
static void SoftSign(TCpuMatrix< Scalar_t > &B)
Definition: ActivationFunctions.cxx:120

TMVA::DNN::TCpu::Flatten
static void Flatten(TCpuMatrix< AReal > &A, const std::vector< TCpuMatrix< AReal > > &B, size_t size, size_t nRows, size_t nCols)
Flattens the tensor B, such that each matrix, is stretched in one row, resulting with a matrix A.
Definition: Propagation.cxx:627

TMVA::DNN::TCpu::ConstAdd
static void ConstAdd(TCpuMatrix< Scalar_t > &A, Scalar_t beta)
Add the constant beta to all the elements of matrix A and write the result into A.
Definition: Arithmetic.cxx:219

TMVA::DNN::TCpu::Reshape
static void Reshape(TCpuMatrix< AReal > &A, const TCpuMatrix< AReal > &B)
Transform the matrix B to a matrix with different dimensions A.
Definition: Propagation.cxx:612

TMVA::DNN::TCpu::SqrtElementWise
static void SqrtElementWise(TCpuMatrix< Scalar_t > &A)
Square root each element of the matrix A and write the result into A.
Definition: Arithmetic.cxx:251

TMVA::DNN::TCpu::ConvLayerForward
static void ConvLayerForward(std::vector< TCpuMatrix< Scalar_t > > &output, std::vector< TCpuMatrix< Scalar_t > > &derivatives, const std::vector< TCpuMatrix< Scalar_t > > &input, const TCpuMatrix< Scalar_t > &weights, const TCpuMatrix< Scalar_t > &biases, const DNN::CNN::TConvParams &params, EActivationFunction activFunc, std::vector< TCpuMatrix< Scalar_t > > &)
Forward propagation in the Convolutional layer.
Definition: Propagation.cxx:294

TMVA::DNN::TCpu::TanhDerivative
static void TanhDerivative(TCpuMatrix< Scalar_t > &B, const TCpuMatrix< Scalar_t > &A)
Definition: ActivationFunctions.cxx:89

TMVA::DNN::TCpu::Multiply
static void Multiply(TCpuMatrix< Scalar_t > &C, const TCpuMatrix< Scalar_t > &A, const TCpuMatrix< Scalar_t > &B)
Standard multiplication of two matrices A and B with the result being written into C.
Definition: Arithmetic.cxx:34

TMVA::DNN::TCpu::SoftSignDerivative
static void SoftSignDerivative(TCpuMatrix< Scalar_t > &B, const TCpuMatrix< Scalar_t > &A)
Definition: ActivationFunctions.cxx:128

TMVA::DNN::TCpu::SetRandomSeed
static void SetRandomSeed(size_t seed)
Definition: Initialization.cxx:29

TMVA::DNN::TCpu::CopyDiffArch
static void CopyDiffArch(TCpuMatrix< Scalar_t > &B, const AMatrix_t &A)

TMVA::DNN::TCpu::Rearrange
static void Rearrange(std::vector< TCpuMatrix< AReal > > &out, const std::vector< TCpuMatrix< AReal > > &in)
Rearrage data accoring to time fill B x T x D out with T x B x D matrix in.
Definition: Propagation.cxx:655

TMVA::DNN::TCpu::RotateWeights
static void RotateWeights(TCpuMatrix< AReal > &A, const TCpuMatrix< AReal > &B, size_t filterDepth, size_t filterHeight, size_t filterWidth, size_t numFilters)
Rotates the matrix B, which is representing a weights, and stores them in the matrix A.
Definition: Propagation.cxx:247

TMVA::DNN::TCpu::L1Regularization
static Scalar_t L1Regularization(const TCpuMatrix< Scalar_t > &W)
Definition: Regularization.cxx:26

TMVA::DNN::TCpu::MultiplyTranspose
static void MultiplyTranspose(TCpuMatrix< Scalar_t > &output, const TCpuMatrix< Scalar_t > &input, const TCpuMatrix< Scalar_t > &weights)
Matrix-multiply input with the transpose of \pweights and write the results into output.
Definition: Propagation.cxx:25

TMVA::DNN::TCpu::AlmostEquals
static bool AlmostEquals(const TCpuMatrix< Scalar_t > &A, const TCpuMatrix< Scalar_t > &B, double epsilon=0.1)
Check two matrices for equality, taking floating point arithmetic errors into account.
Definition: Arithmetic.cxx:133

TMVA::DNN::TCpu::SumColumns
static void SumColumns(TCpuMatrix< Scalar_t > &B, const TCpuMatrix< Scalar_t > &A, Scalar_t alpha=1.0, Scalar_t beta=0.)
Sum columns of (m x n) matrixx A and write the results into the first m elements in A.
Definition: Arithmetic.cxx:151

TMVA::DNN::TCpu::IdentityDerivative
static void IdentityDerivative(TCpuMatrix< Scalar_t > &B, const TCpuMatrix< Scalar_t > &A)
Definition: ActivationFunctions.cxx:35

TMVA::DNN::TCpu::Tanh
static void Tanh(TCpuMatrix< Scalar_t > &B)
Definition: ActivationFunctions.cxx:81

TMVA::DNN::TCpu::SoftmaxCrossEntropyGradients
static void SoftmaxCrossEntropyGradients(TCpuMatrix< Scalar_t > &dY, const TCpuMatrix< Scalar_t > &Y, const TCpuMatrix< Scalar_t > &output, const TCpuMatrix< Scalar_t > &weights)
Definition: LossFunctions.cxx:166

TMVA::DNN::TCpu::Sigmoid
static void Sigmoid(TCpuMatrix< Scalar_t > &B)

TMVA::DNN::TCpu::SigmoidDerivative
static void SigmoidDerivative(TCpuMatrix< Scalar_t > &B, const TCpuMatrix< Scalar_t > &A)
Definition: ActivationFunctions.cxx:69

TMVA::DNN::TCpu::calculateDimension
static size_t calculateDimension(size_t imgDim, size_t fltDim, size_t padding, size_t stride)
Calculate how many neurons "fit" in the output layer, given the input as well as the layer's hyperpar...
Definition: Propagation.cxx:282

TMVA::DNN::TCpu::CalculateConvBiasGradients
static void CalculateConvBiasGradients(TCpuMatrix< Scalar_t > &biasGradients, const std::vector< TCpuMatrix< Scalar_t > > &df, size_t batchSize, size_t depth, size_t nLocalViews)
Utility function for calculating the bias gradients of the convolutional layer.
Definition: Propagation.cxx:532

TMVA::DNN::TCpu::ConvLayerBackward
static void ConvLayerBackward(std::vector< TCpuMatrix< Scalar_t > > &activationGradientsBackward, TCpuMatrix< Scalar_t > &weightGradients, TCpuMatrix< Scalar_t > &biasGradients, std::vector< TCpuMatrix< Scalar_t > > &df, const std::vector< TCpuMatrix< Scalar_t > > &activationGradients, const TCpuMatrix< Scalar_t > &weights, const std::vector< TCpuMatrix< Scalar_t > > &activationBackward, size_t batchSize, size_t inputHeight, size_t inputWidth, size_t depth, size_t height, size_t width, size_t filterDepth, size_t filterHeight, size_t filterWidth, size_t nLocalViews)
Perform the complete backward propagation step in a Convolutional Layer.
Definition: Propagation.cxx:341

TMVA::DNN::TCpu::CopyDiffArch
static void CopyDiffArch(std::vector< TCpuMatrix< Scalar_t > > &A, const std::vector< AMatrix_t > &B)

TMVA::DNN::TCpu::MeanSquaredErrorGradients
static void MeanSquaredErrorGradients(TCpuMatrix< Scalar_t > &dY, const TCpuMatrix< Scalar_t > &Y, const TCpuMatrix< Scalar_t > &output, const TCpuMatrix< Scalar_t > &weights)
Definition: LossFunctions.cxx:53

TMVA::DNN::TCpu::CrossEntropy
static Scalar_t CrossEntropy(const TCpuMatrix< Scalar_t > &Y, const TCpuMatrix< Scalar_t > &output, const TCpuMatrix< Scalar_t > &weights)
Sigmoid transformation is implicitly applied, thus output should hold the linear activations of the l...
Definition: LossFunctions.cxx:76

TMVA::DNN::TCpu::AddL1RegularizationGradients
static void AddL1RegularizationGradients(TCpuMatrix< Scalar_t > &A, const TCpuMatrix< Scalar_t > &W, Scalar_t weightDecay)
Definition: Regularization.cxx:59

TMVA::DNN::TCpu::Backward
static void Backward(TCpuMatrix< Scalar_t > &activationGradientsBackward, TCpuMatrix< Scalar_t > &weightGradients, TCpuMatrix< Scalar_t > &biasGradients, TCpuMatrix< Scalar_t > &df, const TCpuMatrix< Scalar_t > &activationGradients, const TCpuMatrix< Scalar_t > &weights, const TCpuMatrix< Scalar_t > &activationBackward)
Perform the complete backward propagation step.
Definition: Propagation.cxx:79

TMVA::DNN::TCpu::ReciprocalElementWise
static void ReciprocalElementWise(TCpuMatrix< Scalar_t > &A)
Reciprocal each element of the matrix A and write the result into A.
Definition: Arithmetic.cxx:235

TMVA::DNN::TCpu::ScaleAdd
static void ScaleAdd(TCpuMatrix< Scalar_t > &A, const TCpuMatrix< Scalar_t > &B, Scalar_t beta=1.0)
Adds a the elements in matrix B scaled by c to the elements in the matrix A.

TMVA::DNN::TCpu::ConstMult
static void ConstMult(TCpuMatrix< Scalar_t > &A, Scalar_t beta)
Multiply the constant beta to all the elements of matrix A and write the result into A.
Definition: Arithmetic.cxx:227

TMVA::DNN::TCpu::Sum
static Scalar_t Sum(const TCpuMatrix< Scalar_t > &A)
Compute the sum of all elements in A.

TMVA::DNN::TCpu::InitializeZero
static void InitializeZero(TCpuMatrix< Scalar_t > &A)
Definition: Initialization.cxx:148

TMVA::DNN::TCpu::InitializeGauss
static void InitializeGauss(TCpuMatrix< Scalar_t > &A)
Definition: Initialization.cxx:43

TMVA::DNN::TCpu::AddConvBiases
static void AddConvBiases(TCpuMatrix< Scalar_t > &output, const TCpuMatrix< Scalar_t > &biases)
Add the biases in the Convolutional Layer.
Definition: Propagation.cxx:263

TMVA::DNN::TCpu::PrepareInternals
static void PrepareInternals(std::vector< TCpuMatrix< Scalar_t > > &)
Dummy placeholder - preparation is currently only required for the CUDA architecture.
Definition: Cpu.h:337

TMVA::DNN::TCpu::ReluDerivative
static void ReluDerivative(TCpuMatrix< Scalar_t > &B, const TCpuMatrix< Scalar_t > &A)
Definition: ActivationFunctions.cxx:52

TMVA::DNN::TCpu::Sigmoid
static void Sigmoid(TCpuMatrix< Scalar_t > &YHat, const TCpuMatrix< Scalar_t > &)

TMVA::DNN::TCpu::Im2colIndices
static void Im2colIndices(std::vector< int > &V, const TCpuMatrix< AReal > &B, size_t nLocalViews, size_t imgHeight, size_t imgWidth, size_t fltHeight, size_t fltWidth, size_t strideRows, size_t strideCols, size_t zeroPaddingHeight, size_t zeroPaddingWidth)
Definition: Propagation.cxx:150

TMVA::DNN::TCpu::InitializeGlorotUniform
static void InitializeGlorotUniform(TCpuMatrix< Scalar_t > &A)
Sample from a uniform distribution in range [ -lim,+lim] where lim = sqrt(6/N_in+N_out).
Definition: Initialization.cxx:110

TMVA::DNN::TCpu::GaussDerivative
static void GaussDerivative(TCpuMatrix< Scalar_t > &B, const TCpuMatrix< Scalar_t > &A)
Definition: ActivationFunctions.cxx:149

TMVA::DNN::TCpu::Softmax
static void Softmax(TCpuMatrix< Scalar_t > &YHat, const TCpuMatrix< Scalar_t > &)
Definition: OutputFunctions.cxx:33

TMVA::DNN::TCpu::Deflatten
static void Deflatten(std::vector< TCpuMatrix< AReal > > &A, const TCpuMatrix< AReal > &B, size_t index, size_t nRows, size_t nCols)
Transforms each row of B to a matrix and stores it in the tensor B.
Definition: Propagation.cxx:641

TMVA::DNN::TCpu::SquareElementWise
static void SquareElementWise(TCpuMatrix< Scalar_t > &A)
Square each element of the matrix A and write the result into A.
Definition: Arithmetic.cxx:243

TMatrixT
TMatrixT.
Definition: TMatrixT.h:39

TRandom
This is the base class for the ROOT Random number generators.
Definition: TRandom.h:27

ROOT::Math::beta
double beta(double x, double y)
Calculates the beta function.
Definition: SpecFuncMathCore.cxx:111

ClassificationKeras.output
output
Definition: ClassificationKeras.py:16

ROOT::Math::Cephes::B
static double B[]
Definition: SpecFuncCephes.cxx:178

ROOT::Math::Cephes::A
static double A[]
Definition: SpecFuncCephes.cxx:170

ROOT::Math::Cephes::C
static double C[]
Definition: SpecFuncCephes.cxx:187

ROOT::Math::GSLSimAn::Copy
void Copy(void *source, void *dest)
Definition: GSLSimAnnealing.cxx:149

TMVA::DNN::weightDecay
double weightDecay(double error, ItWeight itWeight, ItWeight itWeightEnd, double factorWeightDecay, EnumRegularization eRegularization)
compute the weight decay for regularization (L1 or L2)
Definition: NeuralNet.icc:496

TMVA::DNN::EActivationFunction
EActivationFunction
Enum that represents layer activation functions.
Definition: Functions.h:32

TMVA
Abstract ClassifierFactory template that handles arbitrary types.
Definition: GeneticMinimizer.h:21

TMVA::DNN::CNN::TConvParams
Definition: ConvLayer.h:155

Functions.h

epsilon
REAL epsilon
Definition: triangle.c:617