jannerm

Michael Janner jannerm

Achievements

diffuser diffuser Public

Code for the paper "Planning with Diffusion for Flexible Behavior Synthesis"

Python 911 145
trajectory-transformer trajectory-transformer Public

Code for the paper "Offline Reinforcement Learning as One Big Sequence Modeling Problem"

Python 466 65
gamma-models gamma-models Public

Code for the paper "Gamma-Models: Generative Temporal Difference Learning for Infinite-Horizon Prediction"

Python 43 8
mbpo mbpo Public

Code for the paper "When to Trust Your Model: Model-Based Policy Optimization"

Python 477 83
ddpo ddpo Public

Code for the paper "Training Diffusion Models with Reinforcement Learning"

Python 367 26
berkeleydeeprlcourse/homework_fall2020 berkeleydeeprlcourse/homework_fall2020 Public

Assignments for Berkeley CS 285: Deep Reinforcement Learning (Fall 2020)

Jupyter Notebook 250 246