adamw

Star

Here are 29 public repositories matching this topic...

OverLordGoldDragon / keras-adamw

Star

Keras/TF implementation of AdamW, SGDW, NadamW, Warm Restarts, and Learning Rate multipliers

tensorflow keras sgd adamw adamwr nadam optimizers learning-rate-multipliers warm-restarts

Updated Jan 6, 2022
Python

mpyrozhok / adamwr

Star

Implements https://arxiv.org/abs/1711.05101 AdamW optimizer, cosine learning rate scheduler and "Cyclical Learning Rates for Training Neural Networks" https://arxiv.org/abs/1506.01186 for PyTorch framework

scheduler clr optimizer pytorch restarts triangular adamw cosine-annealing cyclical-learning-rate adamw-optimizer

Updated Jul 14, 2019
Python

GLambard / AdamW_Keras

Star

AdamW optimizer for Keras

tensorflow keras optimizer adam adamw

Updated Aug 9, 2019
Python

plugyawn / Megaprop

Star

Newton-Muon + Preconditioned Optimizers for MoE Training at scale, with out-of-the-box support for MuP and FSDP support for Muon, built on top of Megatron-LM and TransformerEngine.

Updated Jun 17, 2026

JRC1995 / DemonRangerOptimizer

Star

Quasi Hyperbolic Rectified DEMON Adam/Amsgrad with AdaMod, Gradient Centralization, Lookahead, iterative averaging and decorrelated Weight Decay

Updated Sep 23, 2020
Python

lonePatient / NovoGrad-pytorch

Star

pytorch implement of NovoGrad Optimizer

optimizer pytorch alexnet cifar10 adam adamw novograd

Updated Mar 8, 2022
Python

nachiket273 / lookahead_pytorch

Sponsor

Star

Pytorch implementation of lookahead optimizer(https://arxiv.org/pdf/1907.08610.pdf) and RAdam(https://arxiv.org/pdf/1908.03265.pdf)

python deep-learning neural-network optimizer pytorch lookahead adamw radam lookahead-optim lookahead-pytorch

Updated Jun 25, 2022
Jupyter Notebook

OptimalFoundation / nadir

Star

Nadir: Cutting-edge PyTorch optimizers for simplicity & composability! 🔥🚀💻

machine-learning optimization pytorch lion adam-optimizer adamax sgd-optimizer amsgrad adamw radam adamp adabelief

Updated Jun 15, 2024
Python

OptimalFoundation / awesome-optimizers

Star

Literature survey of convex optimizers and optimisation methods for deep-learning; made especially for optimisation researchers with ❤️

awesome eve awesome-list optimization-algorithms adam shampoo adamw radam adamp

Updated Mar 9, 2023

Yagami123 / Caffe-AdamW-AdamWR

Star

Implementation of AdamW and AdamWR Algorithms in caffe.

caffe solver adamw adamwr

Updated Jul 20, 2018
C++

tnurbek / loft

Star

[ICLR 2026] LoFT: Low-Rank Adaptation That Behaves Like Full Fine-Tuning

fft lora fine-tuning peft adamw fine-tuning-llm parameter-efficient-fine-tuning full-fine-tuning

Updated Feb 28, 2026
Python

whispering3 / SCAO

Sponsor

Star

SCAO is a sparse, second-order PyTorch optimizer designed as a high-throughput, drop-in replacement for AdamW.

machine-learning deep-learning optimization cuda pytorch neural-networks shampoo adamw llm

Updated May 22, 2026
Python

sunderflowres-stack / gyro_optimizer

Star

GYRO is an optimizer for deep neural networks that augments Adam with a geometric rotation step applied to the gradient before momentum buffers are updated.

deep-learning optimizer pytorch gradient-descent optimization-algorithms adam adam-optimizer adamw adamw-optimizer

Updated May 4, 2026
Python

FFMG / neural-network

Star

Lightweight, zero-dependency C++ Feedforward & Recurrent Neural Network library with native Python bindings (via pybind11).

Updated Jun 30, 2026
C++

pablo-reyes8 / implementing-gpt

Star

Clean-room GPT-2/GPT-3 implementation: tokenizers, architecture blocks, training loop with AdamW + cosine decay, CLI scripts, inference tools, and pytest suite. Covers OpenWebText-10k & WikiText-103 workflows. Designed as an academic reference for understanding and scaling decoder-only transformers

nlp transformers pytorch gpu-acceleration language-model adamw gpt2 gpt3 cosine-decay decoder-only educational-implementation

Updated Feb 18, 2026
Python

GuyKabiri / Plant-Pathology-Competition

Star

Kaggle's plant disease image classification competition. Finetuning pre-trained CNN models, loss functions, and optimizers in order to achieve better results.

machine-learning computer-vision deep-learning scheduler cnn plant-pathology resnext adamw efficientnet asymmetric-loss

Updated Aug 4, 2021
HTML

StarlangSoftware / ComputationalGraph

Star

Computational Graph Library for Neural Network Training

Updated Jun 20, 2026
Java

NJUxlj / adam-optimizer-pytorch

Star

reproduce Adam, AdamW, Adafactor optimizors with pytorch, and introduce popular optimizers in the training of the LLMs.

deep-learning adam adamw llm adafactor

Updated Mar 24, 2025
Python

nfocardoso / thermopt

Star

Drop-in PyTorch optimizer that beats AdamW with lower variance

machine-learning deep-learning optimizer pytorch thermodynamics adamw

Updated Feb 11, 2026
Python

hinata-koizumi / fashion-mnist-mlp

Star

11th place solution for the U-Tokyo Deep Learning Course MLP Competition (Top 0.8%). High-performance MLP implemented from scratch in NumPy, featuring AdamW, EMA, SWA, and MC Dropout.

deep-learning mlp from-scratch fashion-mnist adamw monte-carlo-dropout implementation-from-scratch competition-solutions numpy-only

Updated Nov 9, 2025
Python

Improve this page

Add a description, image, and links to the adamw topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the adamw topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

adamw

Here are 29 public repositories matching this topic...

OverLordGoldDragon / keras-adamw

mpyrozhok / adamwr

GLambard / AdamW_Keras

plugyawn / Megaprop

JRC1995 / DemonRangerOptimizer

lonePatient / NovoGrad-pytorch

nachiket273 / lookahead_pytorch

OptimalFoundation / nadir

OptimalFoundation / awesome-optimizers

Yagami123 / Caffe-AdamW-AdamWR

tnurbek / loft

whispering3 / SCAO

sunderflowres-stack / gyro_optimizer

FFMG / neural-network

pablo-reyes8 / implementing-gpt

GuyKabiri / Plant-Pathology-Competition

StarlangSoftware / ComputationalGraph

NJUxlj / adam-optimizer-pytorch

nfocardoso / thermopt

hinata-koizumi / fashion-mnist-mlp

Improve this page

Add this topic to your repo