Aliada per al futur del català en l’era digital
Projectes pioners com Aina impulsen la presència del català en les noves tecnologies
La IA és una eina per a la preservació i promoció de llengües minoritzades del món
El català, tot i ser una llengua oficial amb milions de parlants a l’Estat espanyol i milers al francès, s’enfronta a desafiaments significatius en l’àmbit tecnològic. La intel·ligència artificial emergeix com una aliada potencial per garantir la supervivència i el creixement del català en l’era digital. El projecte Aina, impulsat per la Generalitat de Catalunya amb la col·laboració del Barcelona Supercomputing Center (BSC), s’ha convertit en un dels pilars fonamentals en la lluita per la preservació lingüística. L’ara nou conseller de Política Lingüística del govern, Francesc Xavier Vila, creu que “Aina és molt més que un projecte tecnològic; és una aposta estratègica per garantir que el català tingui lloc en el futur digital”.
Aina té com a objectiu crear un gran corpus lingüístic en català i desenvolupar models de llenguatge que permetin la creació d’assistents virtuals, traductors automàtics i altres aplicacions en català. El projecte compta amb un pressupost de 13,5 milions i la participació de més de 1.000 voluntaris que han aportat les seves veus per entrenar els models d’IA.
Josep Maria Martorell, director associat del BSC, destaca la importància d’aquest projecte: “Amb Aina estem construint les bases perquè el català pugui ser utilitzat en qualsevol aplicació d’IA en el futur. Això és essencial per a la supervivència de la llengua en l’entorn digital.”
Paral·lelament, el govern espanyol va anunciar en l’últim Mobile World Congress un projecte per desenvolupar un ChatGPT multilingüe que inclogui les llengües cooficials de l’Estat. Aquesta iniciativa, amb un pressupost de 100 milions d’euros, busca garantir que llengües com el català, el gallec i el basc tinguin presència en les tecnologies d’IA més avançades.
Carme Torras, investigadora en IA de l’Institut de Robòtica i Informàtica Industrial (CSIC-UPC), subratlla la importància d’aquestes iniciatives: “Si no aconseguim que el català sigui present en les tecnologies d’IA, correm el risc que la llengua quedi relegada en molts àmbits de la vida quotidiana en les properes dècades.”
L’experiència d’altres llengües minoritzades arreu del món demostra el potencial de la IA com a eina de preservació lingüística. A Gal·les, per exemple, el projecte Common Voice de Mozilla ha aconseguit crear un corpus de veu en gal·lès que ha permès desenvolupar assistents virtuals i sistemes de reconeixement de veu en aquesta llengua. Gareth Morlais, assessor digital del govern gal·lès, afirma: “La IA ens ha permès fer un salt qualitatiu en la presència del gal·lès en l’entorn digital.”
A Nova Zelanda, la llengua maori s’ha beneficiat de projectes d’IA per a la traducció automàtica i la creació de continguts. Te Taka Keegan, professor de la Universitat de Waikato, explica: “La IA ens està ajudant a revitalitzar el maori i a fer-lo accessible a les noves generacions a través de les tecnologies que utilitzen diàriament.”
Tornant al cas del català, un dels reptes pendents és aconseguir el seu reconeixement com a llengua d’ús oficial al Parlament i les institucions europees. Paradoxalment, el cost de la traducció simultània i dels documents oficials a Brussel·les i Estrasburg, usat com a excusa per anar posposant el reconeixement del català a Europa, on és una llengua més parlada que la d’alguns estats, contrasta amb les facilitats que la IA incorpora al món de la traducció de textos, àudios i vídeos en qualsevol idioma, inclòs el català. Algunes de les moltes eines d’IA que anem esbossant en aquestes pàgines ja permeten l’ús del català amb normalitat.
La Generalitat de Catalunya, a través de Política Lingüística, ha posat en marxa diverses iniciatives per promoure l’ús del català en l’entorn digital. Entre elles destaca el programa Tecnologies de la llengua, que ofereix subvencions per al desenvolupament d’eines lingüístiques en català basades en IA.
Ester Franquesa, exdirectora general de Política Lingüística, insisteix en la importància d’aquestes accions: “No es tracta només de preservar la llengua, sinó de garantir que el català sigui una llengua de progrés, capaç d’adaptar-se als canvis tecnològics i socials.”
Antoni Oliver, professor en l’àmbit de lingüística computacional a la Universitat Oberta de Catalunya, adverteix: “Si no aconseguim que el català estigui present en les tecnologies d’IA, correm el risc que la llengua perdi progressivament àmbits d’ús en les properes dècades.”
El camí cap a la plena integració del català en les tecnologies d’IA no està exempt de dificultats. Un dels principals reptes és la manca de dades lingüístiques en català en comparació amb llengües més parlades com l’anglès o el castellà. Per abordar-ho, el projecte Aina ha llançat una crida a la participació ciutadana per recollir més dades lingüístiques.
Maria Antònia Martí, catedràtica del Departament de Filologia Catalana i Lingüística General de la Universitat de Barcelona, explica: “Necessitem la col·laboració de tota la comunitat lingüística catalana per crear corpus lingüístics prou amplis i diversos per entrenar models d’IA robustos.”
Un altre desafiament és la necessitat de formar professionals especialitzats en IA i lingüística catalana. Diverses universitats catalanes han començat a oferir programes de formació específics en aquesta àrea. La Universitat Politècnica de Catalunya (UPC), per exemple, ha llançat un màster en IA i processament del llenguatge natural centrat en el català i llengües minoritzades.
Lluís Padró, investigador en processament del llenguatge natural a la UPC, destaca: “És fonamental formar una nova generació d’experts que puguin desenvolupar i aplicar tecnologies d’IA adaptades a les necessitats específiques del català.”
La col·laboració entre el sector públic, l’acadèmia i les empreses tecnològiques és determinant per a l’èxit d’aquestes iniciatives. També d’entitats com Softcatalà, la Fundació puntCAT i Aliança per la Presència Digital del Català. Empreses com Google i Amazon han començat a incorporar el català en alguns dels seus productes intel·ligents, però encara queda molt camí per recórrer.
FlowGPT: comunitat per a l’intercanvi de ‘prompts’
FlowGPT és una comunitat en línia dedicada a l’intercanvi de prompts i casos d’ús d’IA. Permet als usuaris compartir, descobrir i aprendre de les experiències dels altres, enriquint així l’ús de la IA en diferents àmbits. Ideal per al desenvolupament de projectes, formació i educació, creació de continguts, investigació i altres àrees beneficiades per l’ús de models d’IA, FlowGPT ofereix una plataforma on els usuaris poden publicar els seus propis prompts, compartir els resultats i col·laborar amb altres membres de la comunitat. Proporciona recursos educatius i guies per millorar l’efectivitat dels models d’IA.
PromptBase: inspira’t i fes contingut de qualitat
PromptBase és una plataforma que ofereix una àmplia varietat d’instruccions (prompts) optimitzades per a diferents aplicacions d’IA. Ideal per a usuaris que necessiten inspiració o directrius específiques per generar continguts de qualitat utilitzant IA. Amb PromptBase, es poden crear textos creatius, generar contingut per a màrqueting, desenvolupar projectes educatius i molt més. Els usuaris poden cercar i descarregar prompts dissenyats per experts que maximitzen els resultats dels models d’IA. L’eina categoritza els prompts per tipus d’ús i aplicació, facilitant la recerca i selecció dels més adequats.
Diccionari
Xarxes generatives
Les xarxes generatives són un tipus de models d’aprenentatge automàtic capaços de generar noves dades similars a les dades d’entrenament. Les GAN (Generative Adversarial Networks) són un exemple popular, on un generador crea dades falses i un discriminador intenta distingir-les de les dades reals. Aquest procés competitiu millora la qualitat de les dades generades.
Intel·ligència artificial explicable (XAI)
La IA explicable (XAI) busca fer els models d’IA més transparents i comprensibles per als humans. Proporciona explicacions sobre com es prenen les decisions, ajudant a augmentar la confiança i la responsabilitat en sistemes d’IA. Això és especialment important en àrees crítiques com la salut, les finances i la justícia, on les decisions d’IA poden tenir un gran impacte.
You Only Look Once (YOLO)
You Only Look Once és un algorisme de visió per computador per a la detecció d’objectes en imatges i vídeos en temps real. A diferència d’altres mètodes que analitzen la imatge en múltiples passos, YOLO processa la imatge sencera d’una sola vegada, permetent una detecció ràpida i precisa. És àmpliament utilitzat en aplicacions de seguretat, vigilància i conducció autònoma.
Rendiment
Es refereix a l’eficàcia d’un model per fer prediccions o classificacions correctes. Es mesura mitjançant mètriques com ara l’exactitud, la precisió, el record i la F1 (mesura de precisió). Un bon rendiment indica que el model generalitza bé a dades noves i és capaç de fer prediccions fiables.