Bando per assegno di ricerca
Titolo del progetto di ricerca in italiano | Algoritmi di Reinforcement Learning per sistemi robotici |
---|---|
Titolo del progetto di ricerca in inglese | Reinforcement Learning algorithms for robotics systems |
Settore Concorsuale | 09 - Ingegneria industriale e dell'informazione |
S.S.D | - |
Descrizione sintetica in italiano | sviluppo di algoritmi di Reinforcement Learning per sistemi robotici, ponendo l’attenzione sul concetto di data-efficiency, ovvero sul numero di dati necessario per convergere ad una buona soluzione. In particolare, siamo interessati a migliorare l'algoritmo PILCO, in cui l'evoluzione del sistema è modellata utilizzando Gaussian regression, e la policy di controllo è ottimizzata mediante discesa del gradiente. Per ricavare un'approssimazione del gradiente della policy, in PILCO è necessario utilizzare Radial Basis Functions kernels, limitando notevolmente le opzioni di modellizzazione, oltre che le prestazioni in termini di data-efficiency. In questo progetto, miriamo a derivare una nuova architettura di apprendimento, in cui l'uso del Radial Basis Functions kernel non è necessario. In particolare, l’obiettivo è derivare un nuovo data-driven kernel per modellare l'evoluzione dei sistemi fisici, ponendo l’attenzione alle prestazioni in termini di data-efficiency. |
Descrizione sintetica in inglese | The goal of this project consists in developing data-efficient Reinforcement Learning algorithms for robotics systems. In particular, we are interested in improving the PILCO algorithm, where the system evolution is modeled relying on Gaussian regression, and the policy is optimized by gradient descent. To derive an approximation of the policy gradient in closed form, in PILCO the use of Radial Basis functions kernel is mandatory, limiting considerably the modeling options, and possibly resulting in considerable data inefficiency. In this project, we aim at deriving a new learning framework, where the use of Radial Basis Functions kernel is not mandatory. Moreover, we plan to derive a new data-driven kernel for modeling the evolution of physical systems, focusing on data-efficiency. |
Data del bando | 21/10/2019 |
Paesi in cui può essere condotta la ricerca |
OTHER |
Paesi di residenza dei candidati |
EUROPE |
Nazionalità dei candidati |
EUROPE |
Sito web del bando | http://www.dei.unipd.it/bandi |
Destinatari dell'assegno di ricerca (of target group) |
Early stage researcher or 0-4 yrs (Post graduate) |
---|
Nome dell'Ente finanziatore | Dipartimento di Ingegneria dell'Informazione-Università degli Studi di Padova |
---|---|
Tipologia dell'Ente | Public research |
Paese dell'Ente | Honduras |
Città | Padova |
Sito web | http://www.dei.unipd.it |
carlirug@dei.unipd.it |
L'assegno finanziato/cofinanziato attraverso un EU Research Framework Programme? | No |
---|
Data di scadenza del bando | 07/11/2019 - alle ore 00:00 |
---|---|
Come candidarsi | Other |