Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

63,165

Full-text search

Active filters: reinforcement-learning

ivanchangoluisa/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 16, 2022

ivanchangoluisa/q-Taxi-v3

Reinforcement Learning • Updated Nov 16, 2022

ernestumorga/ppo-seals-MountainCar-v0

Reinforcement Learning • Updated Nov 16, 2022 • 6

songs/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 17, 2022

tsuneji/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Nov 17, 2022 • 4

sjainlucky/RL-first

Reinforcement Learning • Updated Nov 17, 2022 • 2

tinkerist/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 17, 2022 • 2

Harrier/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 17, 2022

Harrier/q-Taxi-v3

Reinforcement Learning • Updated Nov 17, 2022

damilare-akin/a2c-HalfCheetahBulletEnv-v0

Reinforcement Learning • Updated Nov 17, 2022 • 3

Bacquerie/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 17, 2022 • 2

cleanrl/CartPole-v1-dqn-seed1

Reinforcement Learning • Updated Dec 15, 2022

cleanrl/CartPole-v1-dqn-seed2

Reinforcement Learning • Updated Nov 17, 2022

cleanrl/CartPole-v1-dqn_jax-seed1

Reinforcement Learning • Updated Dec 15, 2022

sayby/home-made-ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 9, 2023 • 4

bguan/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Nov 18, 2022 • 3

bguan/a2c-HalfCheetahBulletEnv-v0

Reinforcement Learning • Updated Nov 18, 2022 • 3

LidoHon/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 18, 2022 • 3 • 1

OSalem99/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Nov 18, 2022 • 4

LidoHon/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 19, 2022

Harrier/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Nov 19, 2022 • 8

yizhangliu/ppo-LunarLander-v2

Reinforcement Learning • Updated Jan 10, 2023 • 2 • 1

Harrier/Reinforce-CartPole-0

Reinforcement Learning • Updated Nov 20, 2022

Harrier/Reinforce-Pixelcopter-0

Reinforcement Learning • Updated Nov 20, 2022

xaeroq/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 20, 2022

xaeroq/q-Taxi-v3

Reinforcement Learning • Updated Nov 20, 2022

bsmith0430/ppo-LunarLander-v2

Reinforcement Learning • Updated Dec 22, 2022 • 3

Harrier/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Nov 21, 2022 • 3

TUMxudashuai/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 22, 2022 • 4

BeeBeaver/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 22, 2022