Presentació Projecte d'Impacte "Assistència intel·ligent a la descripció contextualitzada de fotos per notícies"

El projecte, liderat per Eurecat en col·laboració amb 3Cat, s’ha embarcat de nou en la fabricació de noves eines cap als assistents periodístics, en aquest cas per la descripció de fotos, explorant les capacitats sense precedents dels models de llenguatge multimodals actuals.

La descripció de fotos en mitjans de comunicació sovint és una tasca rutinària, lluny d’activitats intel·lectuals necessàries en la redacció d’una notícia. Els peus de foto solen atendre criteris editorials, mentre que la descripció de fotografies requereix una descripció en termes purament visuals. Aquestes descripcions, incloses en camps no visibles dels formats digitals, tal com les pàgines web, també anomenats “texts alternatius”, sovint no són presents a causa de diferents factors en fluxos de treball actuals. Això fa que persones amb limitacions d’accessibilitat no es puguin informar de la mateixa manera.

El desenvolupament de noves eines basades en models multimodals d’intel·ligència artificial generativa, optimitzades per a la descripció de fotografies amb finalitats informatives, poden constituir un assistent periodístic que impacti positivament en la qualitat de la informació, tant en la creació de peus de foto, com en descripcions visuals amb finalitat d’accessibilitat.

En aquesta sessió, el CIDAI, en col·laboració amb 3Cat presentarà els resultats i coneixements adquirits durant l’execució d’un dels Projectes d’Alt Impacte on s’han fet servir eines d’IA generativa multimodals.

Programa

09:15h Registre

Presenta l’esdeveniment: Sr. Marco Orellana, gerent del CIDAI.

10:00 h Benvinguda.

Sr. Joan Mas i Albaigès, director del CIDAI i director Científic Digital d’Eurecat.
Sra. Rosa Romà Monfà , presidenta de la Corporació Catalana de Mitjans Audiovisuals- 3Cat
Sra. Maria Galindo, secretària de Polítiques Digitals de la Generalitat de Catalunya

10:15h Projecte d’Impacte Assistència intel·ligent a la descripció contextualitzada de fotos per notícies
10:15h- Sr. Medir Plandolit, cap Digital Informatius 3Cat
La societat necessita una informació de qualitat per garantir una democràcia plena, però avui hi ha una desafecció creixent: dos de cada tres catalans no estan satisfets amb el sistema democràtic. Els hàbits de consum han canviat, amb les xarxes socials com a principal font informativa. Això dificulta identificar informació fiable i afebleix la connexió amb els mitjans tradicionals. En aquest context, la IA ha de ser una eina al servei del periodisme, alliberant els professionals de tasques repetitives per centrar-se en accions de més valor.

10:30h- Sr. Rafael Redondo, cap Línia d’Imatge Unitat de Tecnologies Multimèdia d’Eurecat
Els models multimodals (LVM) poden gestionar tasques de processament tant d’imatges com de llenguatge integrant tant dades visuals com textuals. Així, poden crear descripcions o resums coherents a partir de diferents tipus d’entrades. Aquests models multimodals, mitjançant instruccions (prompts) i cadenes de raonament (Chain of Thought), com preguntes específiques o el context més ampli d’un article de notícies, poden guiar el procés de subtitulat i descripció d’imatges de manera més efectiva cap al desenvolupament de nous assistents periodístics.

11.00h | Avaluació del projecte – Assistència intel·ligent a la descripció contextualitzada de fotos per notícies
– Sr. Rafa Bermúdez, recerca i serveis transversals 3Cat
L’avaluació d’eines basades en intel·ligència artificial, especialment per la seva naturalesa estocàstica, és especialment complexa. Cal definir procediments rigorosos que redueixin les distraccions que podrien condicionar els resultats, però al mateix temps és fonamental evitar introduir biaixos. Per això, es combinen metodologies com proves dirigides, entrevistes personals, i l’anàlisi i visualització dels resultats, que permeten destil·lar la informació més rellevant per valorar l’efectivitat i utilitat de les eines.
Mitjançant aquestes tècniques, s’han pogut identificar els aspectes més interessants de la proposta, així com traçar les línies d’evolució més prometedores per continuar desenvolupant aquesta eina.

11:30h Cloenda
11:35h Cafè Networking
12:00h Fi de l’acte

Lloc

AUDITORI 3Cat
Carrer de la TV3, s/n
08970 Sant Joan Despí (Barcelona)

Com arribar a l’auditori?

-En transport públic:
Autobusos (L21, L46, X30, 78, 157), tren (R4), metro (L5), o tramvia (T3)

-En cotxe particular:
Pots aparcar al carrer davant de les instal·lacions de TV3 o bé al pàrquing de l’Hospital Moissès Broggi (pàrquing de pagament)