CppNet

CppNet is a high-performance C++17 deep learning library for building and training neural networks from scratch.
Built on Eigen for fast tensor operations, OpenMP for CPU parallelism, and CUDA for GPU acceleration.

Features

High Performance — Vectorized tensor operations via Eigen, multi-threaded with OpenMP, optional CUDA GPU kernels.
Rich Layer Library — Linear, Conv2D, MaxPool2D, RNN, LSTM, GRU, Multi-Head Attention, Dropout, BatchNorm, Embedding, Residual, GlobalPool, Flatten.
Multiple Backends — Per-layer compute backend selection: "cpu-eigen" (Eigen contractions), "cpu" (OpenMP loops), "gpu" (CUDA kernels).
Modular Architecture — Clean separation of layers, activations, losses, optimizers, metrics, regularizations, and utilities.
Training Utilities — DataLoader with batching & shuffling, learning rate schedulers, early stopping callbacks, gradient clipping, model serialization.
Visualization — Built-in TrainingLogger for tracking metrics and exporting training history to CSV.
Extensible — Abstract base classes for layers, losses, and optimizers make it straightforward to add custom components.
Single-Header Access — #include <CppNet/CppNet.hpp> brings in the entire library.

Installation

Prerequisites

Dependency	Version	Required
C++ compiler (GCC, Clang, MSVC)	C++17 support	Yes
CMake	≥ 3.18	Yes
Eigen3	≥ 3.3	Yes
OpenMP	any	Optional (CPU parallelism)
CUDA Toolkit	any	Optional (GPU acceleration)

Build from Source

git clone https://github.com/LoqmanSamani/CppNet.git
cd CppNet
mkdir build && cd build
cmake .. -DCMAKE_BUILD_TYPE=Release
make -j$(nproc)

Install System-Wide

sudo make install

This installs headers to /usr/local/include/CppNet/ and the static library to /usr/local/lib/.

Use in Your CMake Project

find_package(CppNet REQUIRED)
target_link_libraries(your_target PRIVATE CppNet::CppNet)

Quick Start

A minimal binary classification example:

#include <CppNet/CppNet.hpp>
#include <iostream>

int main() {
    // Define layers
    CppNet::Layers::Linear layer1(30, 64, "fc1", true, true, "cpu-eigen", "xavier");
    CppNet::Layers::Linear layer2(64, 1,  "fc2", true, true, "cpu-eigen", "xavier");
    CppNet::Activations::ReLU relu("cpu-eigen");
    CppNet::Activations::Sigmoid sigmoid;

    // Loss & optimizer
    CppNet::Losses::BinaryCrossEntropy loss_fn("mean");
    CppNet::Optimizers::Adam optimizer;
    float lr = 0.001;

    // Training loop
    for (int epoch = 0; epoch < 100; ++epoch) {
        auto h = relu.forward(layer1.forward(X_train));
        auto pred = sigmoid.forward(layer2.forward(h));

        float loss = loss_fn.forward(pred, Y_train);
        auto grad = loss_fn.backward(pred, Y_train);

        grad = layer2.backward(sigmoid.backward(grad));
        layer1.backward(relu.backward(grad));

        layer2.step(optimizer, lr);
        layer1.step(optimizer, lr);

        std::cout << "Epoch " << epoch << " — Loss: " << loss << std::endl;
    }
    return 0;
}

API Overview

Layers

All layers inherit from CppNet::Layers::Layer and implement forward(), backward(), step(), freeze(), unfreeze(), and print_layer_info().

Layer	Description	Key Parameters
`Linear`	Fully connected layer	`in_size`, `out_size`, `bias`, `device`, `weight_init`
`Conv2D`	2D convolution	`in_channels`, `out_channels`, `kernel_size`, `stride`, `padding`
`MaxPool2D`	2D max pooling	`kernel_size`, `stride`
`Flatten`	Reshape to 2D	—
`RNN`	Vanilla recurrent layer	`input_size`, `hidden_size`
`LSTM`	Long Short-Term Memory	`input_size`, `hidden_size`
`GRU`	Gated Recurrent Unit	`input_size`, `hidden_size`
`MultiHeadAttention`	Scaled dot-product multi-head attention	`embed_dim`, `num_heads`
`Dropout`	Dropout regularization	`drop_rate`
`BatchNorm`	Batch normalization	`num_features`
`Embedding`	Embedding lookup table	`vocab_size`, `embed_dim`
`Residual`	Residual (skip) connection wrapper	—
`GlobalPool`	Global average/max pooling	—

Activations

Activation	Function
`ReLU`	$\max(0, x)$
`LeakyReLU`	$\max(\alpha x, x)$
`Sigmoid`	$\sigma(x) = \frac{1}{1 + e^{-x}}$
`Tanh`	$\tanh(x)$
`Softmax`	$\frac{e^{x_i}}{\sum_j e^{x_j}}$

All activations support both 2D (MatrixXd) and 4D (Tensor<double,4>) inputs.

Losses

Loss	Typical Use
`MSE`	Regression
`MAE`	Regression
`Huber`	Robust regression
`BinaryCrossEntropy`	Binary classification
`CategoricalCrossEntropy`	Multi-class classification
`SoftmaxCrossEntropy`	Multi-class (fused softmax + CE)

All support configurable reduction modes ("mean", "sum").

Optimizers

Optimizer	Description
`SGD`	Stochastic Gradient Descent
`Adam`	Adaptive Moment Estimation (default: $\beta_1=0.9$, $\beta_2=0.999$, $\epsilon=10^{-8}$)
`Adagrad`	Adaptive gradient accumulation
`Momentum`	SGD with momentum
`RMSProp`	Root Mean Square Propagation

Metrics

CppNet::Metrics::accuracy(predictions, targets);
CppNet::Metrics::binary_accuracy(predictions, targets, 0.5);
CppNet::Metrics::precision(predictions, targets, 0.5);
CppNet::Metrics::recall(predictions, targets, 0.5);
CppNet::Metrics::f1_score(predictions, targets, 0.5);

Regularizations

CppNet::Regularizations::l1_penalty(weights, lambda);
CppNet::Regularizations::l2_penalty(weights, lambda);
CppNet::Regularizations::elastic_net_penalty(weights, lambda, l1_ratio);
// Corresponding gradient functions: l1_gradient, l2_gradient, elastic_net_gradient

Utilities

Utility	Description
DataLoader	Batched iteration with shuffling. Supports range-based `for` loops.
Weight Init	Xavier (uniform/normal), He (uniform/normal), constant, custom.
Gradient Clipping	`clip_by_value()` and `clip_by_norm()`.
Serialization	`save_model()` / `load_model()` for full model persistence; tensor-level binary I/O.
LR Schedulers	`StepLR`, `ExponentialLR`, `CosineAnnealingLR`.
Callbacks	`EarlyStopping` with configurable patience, delta, and mode.
Elapsed Time	Training duration measurement.

DataLoader example:

CppNet::Utils::DataLoader loader(X, Y, /*batch_size=*/32, /*shuffle=*/true);
for (auto& [x_batch, y_batch] : loader) {
    // forward / backward / step
}
loader.reset(); // re-shuffle for next epoch

Learning rate scheduler example:

CppNet::Schedulers::CosineAnnealingLR scheduler(/*initial_lr=*/0.01, /*T_max=*/100);
for (int epoch = 0; epoch < 100; ++epoch) {
    float lr = scheduler.step();
    // ... train with lr
}

Visualization

CppNet::Visualizations::TrainingLogger logger;
// Inside training loop:
logger.log("train_loss", loss);
logger.log("val_accuracy", val_acc);
logger.next_epoch();
// After training:
logger.print_epoch_summary();
logger.export_csv("training_history.csv");

Examples

The examples/ directory contains complete, self-contained deep learning programs that train on synthetic data — no downloads required. Each example generates its own dataset, trains a model, and reports final metrics.

Example	Architecture	Dataset	Result
`mlp_classification.cpp`	Linear→ReLU→Linear→ReLU→Linear	3-class spiral (600 samples, 2D)	~71% accuracy
`cnn_image_classification.cpp`	Conv2D→ReLU→MaxPool2D→Flatten→Linear	8×8 stripe images (400 samples)	100% accuracy
`rnn_sequence_prediction.cpp`	LSTM(1,16)→Linear(16,1)	Sine-wave sequences (400 samples)	MSE ≈ 0.00001
`transformer_classifier.cpp`	Embedding→Self-Attention+skip→ReLU→Linear	Token sequences (400 samples)	100% accuracy
`resnet_classifier.cpp`	Linear→ReLU→ResBlock(32)→Linear→Sigmoid	Concentric circles (600 samples)	~99% accuracy

Build and run:

cd build
cmake .. -DCMAKE_BUILD_TYPE=Release -DBUILD_EXAMPLES=ON
make -j$(nproc)
./examples/mlp_classification
./examples/cnn_image_classification
./examples/rnn_sequence_prediction
./examples/transformer_classifier
./examples/resnet_classifier

Each example demonstrates key patterns:

MLP: Multi-class classification with softmax, manual forward/backward loop
CNN: Image feature extraction, Conv2D + pooling pipeline
RNN/LSTM: Time-series regression, sequence processing with hidden states
Transformer: Token embedding + self-attention, skip connections, mean-pooling
ResNet: Residual (skip) connections, gradient clipping, He initialization

GPU Acceleration

CppNet automatically detects CUDA at build time. When available, layers can target the GPU backend:

CppNet::Layers::Linear layer(784, 256, "fc1", true, true, "gpu", "xavier");

Available CUDA kernels:

Matrix multiplication (matmul, matmul_grad_input, matmul_grad_weight)
Bias operations (add_bias, bias_grad)
Elementwise operations
ReLU forward & backward
SGD update step

To force a CPU-only build even when CUDA is present:

cmake .. -DCUDAToolkit_ROOT=/nonexistent

Benchmarks

Measured on the included examples (single machine):

Task	Threads	Time	Speedup
Linear (breast cancer, 1000 epochs)	1	53.9 s	1.00x
Linear (breast cancer, 1000 epochs)	8	19.2 s	2.81x
CNN (synthetic 64x64, 15 epochs)	1	42.9 s	1.00x
CNN (synthetic 64x64, 15 epochs)	8	15.0 s	2.87x

Testing

CppNet uses CTest with 40 unit tests covering every module:

cd build
cmake .. -DBUILD_TESTS=ON
make -j$(nproc)
ctest --output-on-failure

Category	Tests
Layers (13)	Linear, Conv2D, Flatten, MaxPool2D, RNN, Attention, BatchNorm, Dropout, Embedding, GlobalPool, GRU, LSTM, Residual
Activations (5)	ReLU, Sigmoid, Softmax, Tanh, LeakyReLU
Losses (6)	BinaryCrossEntropy, CategoricalCrossEntropy, MSE, MAE, Huber, SoftmaxCrossEntropy
Optimizers (5)	SGD, Adam, Momentum, Adagrad, RMSProp
Utilities (7)	Metrics, Regularizations, Callbacks, DataLoader, ElapsedTime, GradientClip, Init
Other (4)	Schedulers, Utils, Models, Visualizations

Each test validates forward pass, backward pass (gradient shapes & values), and parameter updates where applicable.

Project Structure

CppNet/
├── CMakeLists.txt              # Top-level build configuration
├── cmake/                      # CMake package config templates
├── include/CppNet/             # Public headers
│   ├── CppNet.hpp              # Single-include entry point
│   ├── activations/            # ReLU, Sigmoid, Softmax, Tanh, LeakyReLU
│   ├── layers/                 # Linear, Conv2D, RNN, LSTM, GRU, Attention, ...
│   ├── losses/                 # MSE, MAE, Huber, BCE, CCE, SoftmaxCE
│   ├── optimizers/             # SGD, Adam, Adagrad, Momentum, RMSProp
│   ├── models/                 # SequentialModel
│   ├── metrics/                # Accuracy, Precision, Recall, F1
│   ├── regularizations/        # L1, L2, Elastic Net
│   ├── kernels/gpu/            # CUDA kernels
│   ├── utils/                  # DataLoader, Init, Schedulers, Serialization, ...
│   └── visualizations/         # TrainingLogger
├── src/CppNet/                 # Implementation files (.cpp / .cu)
├── tests/                      # 40 CTest unit tests (layers, activations, losses, ...)
├── examples/                   # 5 deep learning examples (MLP, CNN, RNN, Transformer, ResNet)
└── docs/                       # Additional documentation

Roadmap

Contributing

Contributions are welcome! To get started:

Fork the repository and create a feature branch.
Follow the existing coding style — headers in include/CppNet/, implementations in src/CppNet/.
Add tests for new functionality in tests/.
Make sure all tests pass: cd build && ctest --output-on-failure.
Open a pull request with a clear description of your changes.

License

CppNet is released under the MIT License.

Name		Name	Last commit message	Last commit date
Latest commit History 98 Commits
.idea		.idea
cmake		cmake
docs		docs
examples		examples
imgs		imgs
include/CppNet		include/CppNet
src/CppNet		src/CppNet
tests		tests
.gitignore		.gitignore
CMakeLists.txt		CMakeLists.txt
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CppNet

Table of Contents

Features

Installation

Prerequisites

Build from Source

Install System-Wide

Use in Your CMake Project

Quick Start

API Overview

Layers

Activations

Losses

Optimizers

Metrics

Regularizations

Utilities

Visualization

Examples

GPU Acceleration

Benchmarks

Testing

Project Structure

Roadmap

Contributing

License

About

Uh oh!

Releases

Packages

Languages

License

LoqmanSamani/CppNet

Folders and files

Latest commit

History

Repository files navigation

CppNet

Table of Contents

Features

Installation

Prerequisites

Build from Source

Install System-Wide

Use in Your CMake Project

Quick Start

API Overview

Layers

Activations

Losses

Optimizers

Metrics

Regularizations

Utilities

Visualization

Examples

GPU Acceleration

Benchmarks

Testing

Project Structure

Roadmap

Contributing

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages