Simple CIFAR-10 Image Classifier

This example has interesting aspects to look at:

Its source code is very small.
Layers are added sequentially.
Training parameters are defined before calling the fit method.

This is how a sequential array of layers is added:

    NN := TNNet.Create();
    NN.AddLayer([
      TNNetInput.Create(32, 32, 3),
      TNNetConvolutionLinear.Create({Features=}64, {FeatureSize=}5, {Padding=}2, {Stride=}1, {SuppressBias=}1),
      TNNetMaxPool.Create(4),
      TNNetMovingStdNormalization.Create(),
      TNNetConvolutionReLU.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetConvolutionReLU.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetConvolutionReLU.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetConvolutionReLU.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetDropout.Create(0.5),
      TNNetMaxPool.Create(2),
      TNNetFullConnectLinear.Create(10),
      TNNetSoftMax.Create()
    ]);

Later on, this is how the training/fitting is called:

    NeuralFit := TNeuralImageFit.Create;
    NeuralFit.FileNameBase := 'SimpleImageClassifier';
    NeuralFit.InitialLearningRate := 0.001;
    NeuralFit.LearningRateDecay := 0.01;
    NeuralFit.StaircaseEpochs := 10;
    NeuralFit.Inertia := 0.9;
    NeuralFit.L2Decay := 0;
    NeuralFit.Fit(NN, ImgTrainingVolumes, ImgValidationVolumes, ImgTestVolumes, {NumClasses=}10, {batchsize=}64, {epochs=}50);

Beyond ReLU Activation Function

The paper Searching for Activation Functions describes the search for a better activation function than ReLU. In their work, the authors found Swish to be the best replacement for ReLU. The downside of Swish is: it requires a lot of computation to calculate it. Later, the paper Searching for MobileNetV3 introduces the Hard Swish activation function. The Hard Swish gives similar results to Swish with a lot less computation.

The same neural network shown above could be implemented with Swish as

    NN.AddLayer([
      TNNetInput.Create(32, 32, 3),
      TNNetConvolutionLinear.Create({Features=}64, {FeatureSize=}5, {Padding=}2, {Stride=}1, {SuppressBias=}1),
      TNNetMaxPool.Create(4),
      TNNetMovingStdNormalization.Create(),
      TNNetConvolutionLinear.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetSwish.Create(),
      TNNetConvolutionLinear.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetSwish.Create(),
      TNNetConvolutionLinear.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetSwish.Create(),
      TNNetConvolutionLinear.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetSwish.Create(),
      TNNetDropout.Create(0.5),
      TNNetMaxPool.Create(2),
      TNNetFullConnectLinear.Create(10),
      TNNetSoftMax.Create()
    ]);

or as

    NN.AddLayer([
      TNNetInput.Create(32, 32, 3),
      TNNetConvolutionLinear.Create({Features=}64, {FeatureSize=}5, {Padding=}2, {Stride=}1, {SuppressBias=}1),
      TNNetMaxPool.Create(4),
      TNNetMovingStdNormalization.Create(),
      TNNetConvolutionSwish.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetConvolutionSwish.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetConvolutionSwish.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetConvolutionSwish.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetDropout.Create(0.5),
      TNNetMaxPool.Create(2),
      TNNetFullConnectLinear.Create(10),
      TNNetSoftMax.Create()
    ]);

The Hard Swish variant is implemented with:

    NN.AddLayer([
      TNNetInput.Create(32, 32, 3),
      TNNetConvolutionLinear.Create({Features=}64, {FeatureSize=}5, {Padding=}2, {Stride=}1, {SuppressBias=}1),
      TNNetMaxPool.Create(4),
      TNNetMovingStdNormalization.Create(),
      TNNetConvolutionHardSwish.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetConvolutionHardSwish.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetConvolutionHardSwish.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetConvolutionHardSwish.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
      TNNetDropout.Create(0.5),
      TNNetMaxPool.Create(2),
      TNNetFullConnectLinear.Create(10),
      TNNetSoftMax.Create()
    ]);

These are the CIFAR-10 classification accuracies with ReLU, Swish and HardSwish activation functions:

Activation Function (source)	Test Classification Accuracy (%)
ReLU	85.53%
Swish	86.55%
Hard Swish	86.82%

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

SimpleImageClassifier

SimpleImageClassifier

README.md

Simple CIFAR-10 Image Classifier

Beyond ReLU Activation Function

Name		Name	Last commit message	Last commit date
parent directory ..
results		results
README.md		README.md
SimpleImageClassifier.lpi		SimpleImageClassifier.lpi
SimpleImageClassifier.lpr		SimpleImageClassifier.lpr
SimpleImageClassifierCPU.ipynb		SimpleImageClassifierCPU.ipynb
SimpleImageClassifierCPUResize48.ipynb		SimpleImageClassifierCPUResize48.ipynb
SimpleImageClassifierGroupedConv.lpi		SimpleImageClassifierGroupedConv.lpi
SimpleImageClassifierGroupedConv.lpr		SimpleImageClassifierGroupedConv.lpr
SimpleImageClassifierHardSwish.lpi		SimpleImageClassifierHardSwish.lpi
SimpleImageClassifierHardSwish.lpr		SimpleImageClassifierHardSwish.lpr
SimpleImageClassifierPaddingCropping.lpi		SimpleImageClassifierPaddingCropping.lpi
SimpleImageClassifierPaddingCropping.lpr		SimpleImageClassifierPaddingCropping.lpr
SimpleImageClassifierPaddingCroppingSwish.lpi		SimpleImageClassifierPaddingCroppingSwish.lpi
SimpleImageClassifierPaddingCroppingSwish.lpr		SimpleImageClassifierPaddingCroppingSwish.lpr
SimpleImageClassifierReLU6.lpi		SimpleImageClassifierReLU6.lpi
SimpleImageClassifierReLU6.lpr		SimpleImageClassifierReLU6.lpr
SimpleImageClassifierResize48.lpi		SimpleImageClassifierResize48.lpi
SimpleImageClassifierResize48.lpr		SimpleImageClassifierResize48.lpr
SimpleImageClassifierResize64.lpi		SimpleImageClassifierResize64.lpi
SimpleImageClassifierResize64.lpr		SimpleImageClassifierResize64.lpr
SimpleImageClassifierSharedWeights.lpi		SimpleImageClassifierSharedWeights.lpi
SimpleImageClassifierSharedWeights.lpr		SimpleImageClassifierSharedWeights.lpr
SimpleImageClassifierSwish.lpi		SimpleImageClassifierSwish.lpi
SimpleImageClassifierSwish.lpr		SimpleImageClassifierSwish.lpr

Files

SimpleImageClassifier

Directory actions

More options

Directory actions

More options

Latest commit

History

SimpleImageClassifier

Folders and files

parent directory

README.md

Simple CIFAR-10 Image Classifier

Beyond ReLU Activation Function