Guiding AI attention for driving and creative generation
La intel·ligència artificial (IA) ha accelerat l'avenç de nombrosos camps, especialment on les dades i els recursos computacionals són fàcilment accessibles. Aquesta tesi explora dos d'aquests dominis: la conducció autònoma i les arts visuals, centrant-se en millorar l'eficiència, la...
| Author: | |
|---|---|
| Format: | doctoral thesis |
| Publication Date: | 2024 |
| Country: | España |
| Institution: | Universitat Autònoma de Barcelona |
| Repository: | Dipòsit Digital de Documents de la UAB |
| Language: | English |
| OAI Identifier: | oai:ddd.uab.cat:305930 |
| Online Access: | https://ddd.uab.cat/record/305930 |
| Access Level: | Embargoed access |
| Keyword: | Conducció autònoma Autonomous driving Conducción autónoma Tecnologies |
| Summary: | La intel·ligència artificial (IA) ha accelerat l'avenç de nombrosos camps, especialment on les dades i els recursos computacionals són fàcilment accessibles. Aquesta tesi explora dos d'aquests dominis: la conducció autònoma i les arts visuals, centrant-se en millorar l'eficiència, la interpretabilitat i el potencial creatiu a través d'aplicacions innovadores de mecanismes d'atenció i percepció visual. A l'àmbit de la conducció autònoma, abordem el desafiament d'entrenar models d'una manera més eficient respecte a la utilització de dades d'entrenament, evitant alhora una sobrecàrrega computacional durant la pròpia conducció autònoma. Presentem una nova funció de cost basada en el concepte d'atenció guiada per a models profunds tipus extrem a extrem, millorant significativament l'eficiència i la interpretabilitat durant l'ús. Aquest enfocament elimina la necessitat de xarxes d'emmascarament dedicades, cosa que redueix els requisits computacionals sense perjudicar el rendiment. A més, investiguem l'estabilitat en la conducció de models d'extrem a extrem, proposant una nova funció de cost que separa l'atenció en objectes dinàmics i regles de trànsit, millorant la transparència dels processos de presa de decisions i aplanant el camí per a la integració de dades basades en la mirada humana. Alhora, abordem els desafiaments que planteja la IA generativa en les arts visuals. Tot i la immensa quantitat de dades i de requisits computacionals per entrenar models generatius per crear imatges mai abans vistes, observem una preocupant manca de dades d'entrenament noves, cosa que podria portar a conseqüències catastròfiques. La nostra feina se centra a explotar els models existents de manera més eficaç mitjançant el desenvolupament de nous mètodes d'interacció i la reutilització dels components del model per a tasques que van més enllà de l'entrenament original. Presentem noves tècniques per millorar les capacitats creatives dels models generatius, proposem mètodes per avaluar el seu impacte en la comunitat artística i explorem interfícies innovadores per a la col·laboració entre humans i IA en la creació d'art. Mitjançant experiments extensos i anàlisis crítiques, demostrem que els nostres enfocaments fan avançar l'estat de l'art en els seus camps respectius i revelen sinergies inesperades entre els sistemes autònoms i les aplicacions creatives d'IA. Aquesta tesi contribueix al desenvolupament de sistemes de conducció autònoma més interpretables i eficients, alhora que amplia els límits de la creació d'art assistida per IA de formes que respecten i milloren la creativitat humana. |
|---|