Paper tables with annotated results for A constrained optimization perspective on actor critic algorithms and application to network routing

Paper

A constrained optimization perspective on actor critic algorithms and application to network routing

We propose a novel actor-critic algorithm with guaranteed convergence to an optimal policy for a discounted reward Markov decision process. The actor incorporates a descent direction that is motivated by the solution of a certain non-linear optimization problem. We also discuss an extension to incorporate function approximation and demonstrate the practicality of our algorithms on a network routing application.

PDF Paper record

Results in Papers With Code

(↓ scroll down to see all results)

A constrained optimization perspective on actor critic algorithms and application to network routing

Reader Guidelines

Editor Guidelines