Tabular and Deep Learning of Whittle Index - Université de Pau et des Pays de l'Adour Accéder directement au contenu
Poster De Conférence Année : 2022

Tabular and Deep Learning of Whittle Index

Résumé

- Whittle index policy is an asymptotically optimal heuristic for solving Restless Multi-Armed Bandit Problems (RMBAP). - We propose two algorithms, QWI and QWINN, for the computation of such indices. - Both employ a two timescale system for the computation of the indices and the Q-values of each state/action.
Fichier principal
Vignette du fichier
poster.pdf (2.63 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03810695 , version 1 (11-10-2022)

Identifiants

  • HAL Id : hal-03810695 , version 1

Citer

Francisco Robledo, Urtzi Ayesta, Konstantin Avrachenkov, Vivek S Borkar. Tabular and Deep Learning of Whittle Index. EWRL 2022 - 15th European Workshop on Reinforcement Learning, Sep 2022, Milan, Italy. ⟨hal-03810695⟩
53 Consultations
43 Téléchargements

Partager

Gmail Facebook X LinkedIn More