Sample-Based Learning and Search with Permanent and Transient Memories

Published on 2008-08-123518 Views

David Silver

We present a reinforcement learning architecture, Dyna-2, that encompasses both sample-based learning and sample-based search, and that generalises across states during both learning and search. We ap

Sample-Based Learning and Search with Permanent and Transient Memories

David Silver

Reinforcement Learning

Presentation