doc/hackathon/Cuda_2ActivationFunctions_8cu_source.html

// @(#)root/tmva/tmva/dnn:$Id$

// Author: Simon Pfreundschuh 13/07/16


/*************************************************************************

 * Copyright (C) 2016, Simon Pfreundschuh                                *

 * All rights reserved.                                                  *

 *                                                                       *

 * For the licensing terms see $ROOTSYS/LICENSE.                         *

 * For the list of contributors see $ROOTSYS/README/CREDITS.             *

 *************************************************************************/


 //////////////////////////////////////////////////////////////////

 // Implementation of the activation functions for the TCuda      //

 // implementation of the low-level interface.                   //

 //////////////////////////////////////////////////////////////////


#include "TMVA/DNN/Architectures/Cuda.h"

#include "TMVA/DNN/Architectures/Cuda/Device.h"

#include "TMVA/DNN/Functions.h"

#include "Kernels.cuh"


namespace TMVA

{

namespace DNN

{

//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::ActivationFunctionForward(Tensor_t & X, EActivationFunction activFunct,

                                              const ActivationDescriptor_t /* activationDescr */,

                                             const double /* coef */, const AFloat /*alpha */, const AFloat /*beta*/)

{

   // scaling and translation is not yet implemented

   TMVA::DNN::evaluate<TCuda<AFloat>>( X, activFunct);

}


//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::ActivationFunctionBackward(Tensor_t & dX, const Tensor_t & /* Y */,

                                                const Tensor_t & dY, const Tensor_t & X,

                                                EActivationFunction activFunct,

                                                const ActivationDescriptor_t /* activationDescr */,

                                                const AFloat /* alpha */, const AFloat /* beta */)

{

   // scaling and translation not yet implemented

   // output tensor (Y) could also be used to speed up derivative calculation

   // compute dx = f'(x)

   TMVA::DNN::evaluateDerivative<TCuda<AFloat>>(dX, activFunct, X);

    // Compute element-wise product.  dx = f'(x) * dY

   Hadamard(dX, dY);

}


//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::IdentityDerivative(TCudaTensor<AFloat> & B,

                                           const TCudaTensor<AFloat> & A)

{

   dim3 blockDims = TDevice::BlockDims2D();

   dim3 gridDims  = TDevice::GridDims2D(B);

   cudaStream_t s = A.GetComputeStream();

   ::TMVA::DNN::Cuda::IdentityDerivative<<<gridDims, blockDims, 0, s>>>(

       B.GetDataPointer(),

       (int) B.GetNrows(),

       (int) B.GetNcols());

   B.SetComputeStream(s);

}


//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::Relu(TCudaTensor<AFloat> & A)

{

   dim3 blockDims = TDevice::BlockDims2D();

   dim3 gridDims  = TDevice::GridDims2D(A);

   cudaStream_t s = A.GetComputeStream();

   ::TMVA::DNN::Cuda::Relu<<<gridDims, blockDims, 0, s>>>(

       A.GetDataPointer(),

       (int) A.GetNrows(),

       (int) A.GetNcols());

}


//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::ReluDerivative(TCudaTensor<AFloat> & B,

                                       const TCudaTensor<AFloat> & A)

{

    assert(B.GetNrows() == A.GetNrows() && B.GetNcols() == A.GetNcols());

   dim3 blockDims = TDevice::BlockDims2D();

   dim3 gridDims  = TDevice::GridDims2D(B);

   cudaStream_t s = A.GetComputeStream();

   ::TMVA::DNN::Cuda::ReluDerivative<<<gridDims, blockDims, 0, s>>>(

       B.GetDataPointer(),

       A.GetDataPointer(),

       (int) A.GetNrows(),

       (int) A.GetNcols());

   B.SetComputeStream(s);

}


//______________________________________________________________________________

template<typename AFloat>

void TCuda<AFloat>::Sigmoid(TCudaTensor<AFloat> & A)

{

   dim3 blockDims = TDevice::BlockDims2D();

   dim3 gridDims  = TDevice::GridDims2D(A);

   cudaStream_t s = A.GetComputeStream();

   ::TMVA::DNN::Cuda::Sigmoid<<<gridDims, blockDims, 0, s>>>(

       A.GetDataPointer(),

       (int) A.GetNrows(),

       (int) A.GetNcols());

}


//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::SigmoidDerivative(TCudaTensor<AFloat> & B,

                                          const TCudaTensor<AFloat> & A)

{

    assert(B.GetNrows() == A.GetNrows() && B.GetNcols() == A.GetNcols());

   dim3 blockDims = TDevice::BlockDims2D();

   dim3 gridDims  = TDevice::GridDims2D(B);

   cudaStream_t s = A.GetComputeStream();

   ::TMVA::DNN::Cuda::SigmoidDerivative<<<gridDims, blockDims, 0, s>>>(

       B.GetDataPointer(),

       A.GetDataPointer(),

       (int) A.GetNrows(),

       (int) A.GetNcols());

   B.SetComputeStream(s);

}


//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::Tanh(TCudaTensor<AFloat> & A)

{

   dim3 blockDims = TDevice::BlockDims2D();

   dim3 gridDims  = TDevice::GridDims2D(A);

   cudaStream_t s = A.GetComputeStream();

   ::TMVA::DNN::Cuda::Tanh<<<gridDims, blockDims, 0, s>>>(

       A.GetDataPointer(),

       (int) A.GetNrows(),

       (int) A.GetNcols());

}


//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::TanhDerivative(TCudaTensor<AFloat> & B,

                                       const TCudaTensor<AFloat> & A)

{

    assert(B.GetNrows() == A.GetNrows() && B.GetNcols() == A.GetNcols());

   dim3 blockDims = TDevice::BlockDims2D();

   dim3 gridDims  = TDevice::GridDims2D(B);

   cudaStream_t s = A.GetComputeStream();

   ::TMVA::DNN::Cuda::TanhDerivative<<<gridDims, blockDims, 0, s>>>(

       B.GetDataPointer(),

       A.GetDataPointer(),

       (int) A.GetNrows(),

       (int) A.GetNcols());

   B.SetComputeStream(s);

}


//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::SymmetricRelu(TCudaTensor<AFloat> & A)

{

   dim3 blockDims = TDevice::BlockDims2D();

   dim3 gridDims  = TDevice::GridDims2D(A);

   cudaStream_t s = A.GetComputeStream();

   ::TMVA::DNN::Cuda::SymmetricRelu<<<gridDims, blockDims, 0, s>>>(

       A.GetDataPointer(),

       (int) A.GetNrows(),

       (int) A.GetNcols());

}


//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::SymmetricReluDerivative(TCudaTensor<AFloat> & B,

                                                const TCudaTensor<AFloat> & A)

{

    assert(B.GetNrows() == A.GetNrows() && B.GetNcols() == A.GetNcols());

   dim3 blockDims = TDevice::BlockDims2D();

   dim3 gridDims  = TDevice::GridDims2D(B);

   cudaStream_t s = A.GetComputeStream();

   ::TMVA::DNN::Cuda::SymmetricReluDerivative<<<gridDims, blockDims, 0, s>>>(

       B.GetDataPointer(),

       A.GetDataPointer(),

       (int) A.GetNrows(),

       (int) A.GetNcols());

   B.SetComputeStream(s);

}


//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::SoftSign(TCudaTensor<AFloat> & A)

{

   dim3 blockDims = TDevice::BlockDims2D();

   dim3 gridDims  = TDevice::GridDims2D(A);

   cudaStream_t s = A.GetComputeStream();

   ::TMVA::DNN::Cuda::SoftSign<<<gridDims, blockDims, 0, s>>>(

       A.GetDataPointer(),

       (int) A.GetNrows(),

       (int) A.GetNcols());

}


//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::SoftSignDerivative(TCudaTensor<AFloat> & B,

                                           const TCudaTensor<AFloat> & A)

{

    assert(B.GetNrows() == A.GetNrows() && B.GetNcols() == A.GetNcols());

   dim3 blockDims = TDevice::BlockDims2D();

   dim3 gridDims  = TDevice::GridDims2D(B);

   cudaStream_t s = A.GetComputeStream();

   ::TMVA::DNN::Cuda::SoftSignDerivative<<<gridDims, blockDims, 0, s>>>(

       B.GetDataPointer(),

       A.GetDataPointer(),

       (int) A.GetNrows(),

       (int) A.GetNcols());

   B.SetComputeStream(s);

}


//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::Gauss(TCudaTensor<AFloat> & A)

{

   dim3 blockDims = TDevice::BlockDims2D();

   dim3 gridDims  = TDevice::GridDims2D(A);

   cudaStream_t s = A.GetComputeStream();

   ::TMVA::DNN::Cuda::Gauss<<<gridDims, blockDims, 0, s>>>(

       A.GetDataPointer(),

       (int) A.GetNrows(),

       (int) A.GetNcols());

}


//______________________________________________________________________________

template<typename AFloat>


void TCuda<AFloat>::GaussDerivative(TCudaTensor<AFloat> & B,

                                    const TCudaTensor<AFloat> & A)

{

    assert(B.GetNrows() == A.GetNrows() && B.GetNcols() == A.GetNcols());

   dim3 blockDims = TDevice::BlockDims2D();

   dim3 gridDims  = TDevice::GridDims2D(B);

   cudaStream_t s = A.GetComputeStream();

   ::TMVA::DNN::Cuda::GaussDerivative<<<gridDims, blockDims, 0, s>>>(

       B.GetDataPointer(),

       A.GetDataPointer(),

       (int) A.GetNrows(),

       (int) A.GetNcols());

   B.SetComputeStream(s);

}


} // namespace DNN

} // namespace TMVA

Cuda.h

Device.h

Kernels.cuh

X
#define X(type, name)

TMVA::DNN::TCudaTensor
TCudaTensor Class.
Definition CudaTensor.h:84

TMVA::DNN::TCudaTensor::GetNrows
size_t GetNrows() const
Definition CudaTensor.h:299

TMVA::DNN::TCudaTensor::GetComputeStream
cudaStream_t GetComputeStream() const
Definition CudaTensor.h:213

TMVA::DNN::TCudaTensor::GetNcols
size_t GetNcols() const
Definition CudaTensor.h:300

TMVA::DNN::TCudaTensor::GetDataPointer
const AFloat * GetDataPointer() const
Definition CudaTensor.h:194

TMVA::DNN::TCudaTensor::SetComputeStream
void SetComputeStream(cudaStream_t stream)
Definition CudaTensor.h:216

TMVA::DNN::TCuda::SoftSignDerivative
static void SoftSignDerivative(Tensor_t &B, const Tensor_t &A)
Definition ActivationFunctions.cu:201

TMVA::DNN::TCuda::SymmetricReluDerivative
static void SymmetricReluDerivative(Tensor_t &B, const Tensor_t &A)
Definition ActivationFunctions.cu:171

TMVA::DNN::TCuda::IdentityDerivative
static void IdentityDerivative(Tensor_t &B, const Tensor_t &A)
Definition ActivationFunctions.cu:53

TMVA::DNN::TCuda::ActivationFunctionForward
static void ActivationFunctionForward(Tensor_t &X, EActivationFunction activFunct, const ActivationDescriptor_t activationDescr, const double coef=0.0, const AFloat alpha=1, const AFloat beta=0)
Definition ActivationFunctions.cu:28

TMVA::DNN::TCuda::SoftSign
static void SoftSign(Tensor_t &B)
Definition ActivationFunctions.cu:188

TMVA::DNN::TCuda::Gauss
static void Gauss(Tensor_t &B)
Definition ActivationFunctions.cu:218

TMVA::DNN::TCuda::Sigmoid
static void Sigmoid(Tensor_t &B)

TMVA::DNN::TCuda::Tanh
static void Tanh(Tensor_t &B)
Definition ActivationFunctions.cu:128

TMVA::DNN::TCuda::ActivationFunctionBackward
static void ActivationFunctionBackward(Tensor_t &dX, const Tensor_t &Y, const Tensor_t &dY, const Tensor_t &X, EActivationFunction activFunct, const ActivationDescriptor_t activationDescr, const AFloat alpha=1, const AFloat beta=0)
Computes the gradient of the activation function.
Definition ActivationFunctions.cu:37

TMVA::DNN::TCuda::ActivationDescriptor_t
CudaActivationDescriptor ActivationDescriptor_t
Definition Cuda.h:78

TMVA::DNN::TCuda::Tensor_t
TCudaTensor< AFloat > Tensor_t
Definition Cuda.h:74

TMVA::DNN::TCuda::AFloat
AReal AFloat
Definition Cuda.h:70

TMVA::DNN::TCuda::ReluDerivative
static void ReluDerivative(Tensor_t &B, const Tensor_t &A)
Definition ActivationFunctions.cu:81

TMVA::DNN::TCuda::Hadamard
static void Hadamard(Tensor_t &A, const Tensor_t &B)
In-place Hadamard (element-wise) product of matrices A and B with the result being written into A.

TMVA::DNN::TCuda::GaussDerivative
static void GaussDerivative(Tensor_t &B, const Tensor_t &A)
Definition ActivationFunctions.cu:231

TMVA::DNN::TCuda::Relu
static void Relu(Tensor_t &B)
Definition ActivationFunctions.cu:68

TMVA::DNN::TCuda::SymmetricRelu
static void SymmetricRelu(Tensor_t &B)
Definition ActivationFunctions.cu:158

TMVA::DNN::TCuda::SigmoidDerivative
static void SigmoidDerivative(Tensor_t &B, const Tensor_t &A)
Definition ActivationFunctions.cu:111

TMVA::DNN::TCuda::TanhDerivative
static void TanhDerivative(Tensor_t &B, const Tensor_t &A)
Definition ActivationFunctions.cu:141

TMVA::DNN::TDevice::BlockDims2D
static dim3 BlockDims2D()
Definition Device.h:55

TMVA::DNN::TDevice::GridDims2D
static dim3 GridDims2D(int nrows, int ncols)
Definition Device.h:74

TMVA::DNN::Cuda::SymmetricRelu
__global__ void SymmetricRelu(AFloat *A, int m, int n)
Definition Kernels.cuh:590

TMVA::DNN::Cuda::Sigmoid
__global__ void Sigmoid(AFloat *A, int m, int n)
Definition Kernels.cuh:493

TMVA::DNN::Cuda::SigmoidDerivative
__global__ void SigmoidDerivative(AFloat *B, const AFloat *A, int m, int n)
Definition Kernels.cuh:524

TMVA::DNN::Cuda::IdentityDerivative
__global__ void IdentityDerivative(AFloat *A, int m, int n)
Definition Kernels.cuh:450

TMVA::DNN::Cuda::Relu
__global__ void Relu(AFloat *A, int m, int n)
Definition Kernels.cuh:463

TMVA::DNN::Cuda::ReluDerivative
__global__ void ReluDerivative(AFloat *B, const AFloat *A, int m, int n)
Definition Kernels.cuh:478

TMVA::DNN::Cuda::GaussDerivative
__global__ void GaussDerivative(AFloat *B, const AFloat *A, int m, int n)
Definition Kernels.cuh:665

TMVA::DNN::Cuda::Tanh
__global__ void Tanh(AFloat *A, int m, int n)
Definition Kernels.cuh:559

TMVA::DNN::Cuda::TanhDerivative
__global__ void TanhDerivative(AFloat *B, const AFloat *A, int m, int n)
Definition Kernels.cuh:574

TMVA::DNN::Cuda::Gauss
__global__ void Gauss(AFloat *A, int m, int n)
Definition Kernels.cuh:650

TMVA::DNN::Cuda::SymmetricReluDerivative
__global__ void SymmetricReluDerivative(AFloat *B, const AFloat *A, int m, int n)
Definition Kernels.cuh:604

TMVA::DNN::Cuda::SoftSignDerivative
__global__ void SoftSignDerivative(AFloat *B, const AFloat *A, int m, int n)
Definition Kernels.cuh:634

TMVA::DNN::Cuda::SoftSign
__global__ void SoftSign(AFloat *A, int m, int n)
Definition Kernels.cuh:619

TMVA::DNN
Definition Adadelta.h:36

TMVA::DNN::evaluate
void evaluate(typename Architecture_t::Tensor_t &A, EActivationFunction f)
Apply the given activation function to each value in the given tensor A.
Definition Functions.h:98

TMVA::DNN::EActivationFunction
EActivationFunction
Enum that represents layer activation functions.
Definition Functions.h:32

TMVA::DNN::evaluateDerivative
void evaluateDerivative(typename Architecture_t::Tensor_t &B, EActivationFunction f, const typename Architecture_t::Tensor_t &A)
Compute the first partial derivative of the activation function for the values given in tensor A and ...
Definition Functions.h:125

TMVA
create variable transformations
Definition GeneticMinimizer.h:22

Functions.h