Bando per assegno di ricerca
Titolo del progetto di ricerca in italiano | Controllo di alto livello usando apprendimento con ricompensa basato su reti convoluzionali |
---|---|
Titolo del progetto di ricerca in inglese | Discrete high level control with deep reinforcement learning |
Campo principale della ricerca | Computer science |
Sottocampo della ricerca | Informatics |
Settore Concorsuale | 09 - Ingegneria industriale e dell'informazione |
S.S.D | ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI |
Descrizione sintetica in italiano | Il progetto dovrà affrontare un nuovo problema di apprendimento con ricompensa basato su architetture deep, che affronta il monitoraggio dell'esecuzione di alcune attività di un robot umanoide. Il robot dovrebbe imparare ad eseguire un compito dopo aver appreso le abilità utili che risolvono la sequenziazione di attività secondarie. In questo problema, consideriamo due tipi di generalizzazioni: come decomporre un task nei suoi sottopiani e opportunamente ricombinarle per raggiungere un obiettivo e come adattare l'attività appresa a nuovi compiti. L' obiettivo viene interpretato dal robot tramite un modulo di riconoscimento delle attività di un tecnico che il robot dovrebbe aiutare. Quest'ultimo problema incoraggia l'apprendimento delle corrispondenze tra sotto-task simili sfruttando le analogie. |
Descrizione sintetica in inglese | The project shall face a new Reinforcement learning problem addressing the execution monitoring of some humanoid robot task activities. The robot should learn to execute a task after learning useful skills that solve subtasks. In this problem, we consider two types of generalizations: how to decompose a task into its subplan and combine them in order to achieve a goal which should be understood from an activity recognition module and how to adapt learned task to new tasks. This last problem encourages learning correspondences between similar subtasks by making analogies. For generalization over sequential subplans the project will be able to exploit a hierarchical architecture where the execution monitor learns to use the acquired skills for executing the subplans. The project shall propose a new representation of the tasks based on mental map and a method of data acquisition based on omnicameras. |
Data del bando | 08/03/2018 |
Numero di assegnazioni per anno | 1 |
Stanziamento annuale (indicativo) | 22000 |
Periodicità | 12 mesi |
E' richiesta mobilità internazionale? | yes |
Paesi in cui può essere condotta la ricerca |
Italy |
Paesi di residenza dei candidati |
EUROPE |
Nazionalità dei candidati |
EUROPE |
Sito web del bando | http://www.dis.uniroma1.it/ |
Destinatari dell'assegno di ricerca (of target group) |
Early stage researcher or 0-4 yrs (Post graduate) |
---|---|
Il contratto prevede la copertura delle prestazioni sociali? | no |
Importo annuale | 22000 |
Valuta | Euro |
Comprende lo stipendio dell'assegnista | yes |
Comprende vitto e spese di viaggio | no |
Comprende il costo della ricerca | no |
Nome dell'Ente finanziatore | UNIVERSITA' DI ROMA LA SAPIENZA |
---|---|
Tipologia dell'Ente | Public research |
Paese dell'Ente | Italy |
Città | ROMA |
Codice postale | 00185 |
Indirizzo | VIA ARIOSTO, 25 |
Sito web | http://www.dis.uniroma1.it/ |
pecdis@cert.uniroma1.it | |
Telefono | 0677274137 |
L'assegno finanziato/cofinanziato attraverso un EU Research Framework Programme? | No |
---|
Data di scadenza del bando | 07/04/2018 |
---|---|
Come candidarsi | pecdis@cert.uniroma1.it |