Guiding AI attention for driving and creative generation

La intel·ligència artificial (IA) ha accelerat l'avenç de nombrosos camps, especialment on les dades i els recursos computacionals són fàcilment accessibles. Aquesta tesi explora dos d'aquests dominis: la conducció autònoma i les arts visuals, centrant-se en millorar l'eficiència, la...

Full description

Bibliographic Details
Author: Porres Bustamante, Diego Adolfo
Format: doctoral thesis
Publication Date:2024
Country:España
Institution:Universitat Autònoma de Barcelona
Repository:Dipòsit Digital de Documents de la UAB
Language:English
OAI Identifier:oai:ddd.uab.cat:305930
Online Access:https://ddd.uab.cat/record/305930
Access Level:Embargoed access
Keyword:Conducció autònoma
Autonomous driving
Conducción autónoma
Tecnologies
Description
Summary:La intel·ligència artificial (IA) ha accelerat l'avenç de nombrosos camps, especialment on les dades i els recursos computacionals són fàcilment accessibles. Aquesta tesi explora dos d'aquests dominis: la conducció autònoma i les arts visuals, centrant-se en millorar l'eficiència, la interpretabilitat i el potencial creatiu a través d'aplicacions innovadores de mecanismes d'atenció i percepció visual. A l'àmbit de la conducció autònoma, abordem el desafiament d'entrenar models d'una manera més eficient respecte a la utilització de dades d'entrenament, evitant alhora una sobrecàrrega computacional durant la pròpia conducció autònoma. Presentem una nova funció de cost basada en el concepte d'atenció guiada per a models profunds tipus extrem a extrem, millorant significativament l'eficiència i la interpretabilitat durant l'ús. Aquest enfocament elimina la necessitat de xarxes d'emmascarament dedicades, cosa que redueix els requisits computacionals sense perjudicar el rendiment. A més, investiguem l'estabilitat en la conducció de models d'extrem a extrem, proposant una nova funció de cost que separa l'atenció en objectes dinàmics i regles de trànsit, millorant la transparència dels processos de presa de decisions i aplanant el camí per a la integració de dades basades en la mirada humana. Alhora, abordem els desafiaments que planteja la IA generativa en les arts visuals. Tot i la immensa quantitat de dades i de requisits computacionals per entrenar models generatius per crear imatges mai abans vistes, observem una preocupant manca de dades d'entrenament noves, cosa que podria portar a conseqüències catastròfiques. La nostra feina se centra a explotar els models existents de manera més eficaç mitjançant el desenvolupament de nous mètodes d'interacció i la reutilització dels components del model per a tasques que van més enllà de l'entrenament original. Presentem noves tècniques per millorar les capacitats creatives dels models generatius, proposem mètodes per avaluar el seu impacte en la comunitat artística i explorem interfícies innovadores per a la col·laboració entre humans i IA en la creació d'art. Mitjançant experiments extensos i anàlisis crítiques, demostrem que els nostres enfocaments fan avançar l'estat de l'art en els seus camps respectius i revelen sinergies inesperades entre els sistemes autònoms i les aplicacions creatives d'IA. Aquesta tesi contribueix al desenvolupament de sistemes de conducció autònoma més interpretables i eficients, alhora que amplia els límits de la creació d'art assistida per IA de formes que respecten i milloren la creativitat humana.