Ciència

Aliada per al futur del català en l’era digital

Projectes pioners com Aina impulsen la presència del català en les noves tecnologies

La IA és una eina per a la preservació i promoció de llengües minoritzades del món

La IA pot ser l’impuls que necessita el català per sobreviure en l’era dels assistents virtuals

El català, tot i ser una llen­gua ofi­cial amb mili­ons de par­lants a l’Estat espa­nyol i milers al francès, s’enfronta a des­a­fi­a­ments sig­ni­fi­ca­tius en l’àmbit tec­nològic. La intel·ligència arti­fi­cial emer­geix com una ali­ada poten­cial per garan­tir la super­vivència i el crei­xe­ment del català en l’era digi­tal. El pro­jecte Aina, impul­sat per la Gene­ra­li­tat de Cata­lu­nya amb la col·labo­ració del Bar­ce­lona Super­com­pu­ting Cen­ter (BSC), s’ha con­ver­tit en un dels pilars fona­men­tals en la lluita per la pre­ser­vació lingüística. L’ara nou con­se­ller de Política Lingüística del govern, Fran­cesc Xavier Vila, creu que “Aina és molt més que un pro­jecte tec­nològic; és una aposta estratègica per garan­tir que el català tin­gui lloc en el futur digi­tal”.

Aina té com a objec­tiu crear un gran cor­pus lingüístic en català i desen­vo­lu­par models de llen­guatge que per­me­tin la cre­ació d’assis­tents vir­tu­als, tra­duc­tors automàtics i altres apli­ca­ci­ons en català. El pro­jecte compta amb un pres­su­post de 13,5 mili­ons i la par­ti­ci­pació de més de 1.000 volun­ta­ris que han apor­tat les seves veus per entre­nar els models d’IA.

Josep Maria Mar­to­rell, direc­tor asso­ciat del BSC, des­taca la importància d’aquest pro­jecte: “Amb Aina estem cons­truint les bases perquè el català pugui ser uti­lit­zat en qual­se­vol apli­cació d’IA en el futur. Això és essen­cial per a la super­vivència de la llen­gua en l’entorn digi­tal.”

Paral·lela­ment, el govern espa­nyol va anun­ciar en l’últim Mobile World Con­gress un pro­jecte per desen­vo­lu­par un ChatGPT mul­ti­lingüe que inclo­gui les llengües coo­fi­ci­als de l’Estat. Aquesta ini­ci­a­tiva, amb un pres­su­post de 100 mili­ons d’euros, busca garan­tir que llengües com el català, el gallec i el basc tin­guin presència en les tec­no­lo­gies d’IA més avançades.

Carme Tor­ras, inves­ti­ga­dora en IA de l’Ins­ti­tut de Robòtica i Informàtica Indus­trial (CSIC-UPC), subrat­lla la importància d’aques­tes ini­ci­a­ti­ves: “Si no acon­se­guim que el català sigui pre­sent en les tec­no­lo­gies d’IA, cor­rem el risc que la llen­gua quedi rele­gada en molts àmbits de la vida quo­ti­di­ana en les pro­pe­res dècades.”

L’experiència d’altres llengües mino­rit­za­des arreu del món demos­tra el poten­cial de la IA com a eina de pre­ser­vació lingüística. A Gal·les, per exem­ple, el pro­jecte Com­mon Voice de Mozi­lla ha acon­se­guit crear un cor­pus de veu en gal·lès que ha permès desen­vo­lu­par assis­tents vir­tu­als i sis­te­mes de reco­nei­xe­ment de veu en aquesta llen­gua. Gareth Mor­lais, asses­sor digi­tal del govern gal·lès, afirma: “La IA ens ha permès fer un salt qua­li­ta­tiu en la presència del gal·lès en l’entorn digi­tal.”

A Nova Zelanda, la llen­gua maori s’ha bene­fi­ciat de pro­jec­tes d’IA per a la tra­ducció automàtica i la cre­ació de con­tin­guts. Te Taka Kee­gan, pro­fes­sor de la Uni­ver­si­tat de Waikato, explica: “La IA ens està aju­dant a revi­ta­lit­zar el maori i a fer-lo acces­si­ble a les noves gene­ra­ci­ons a través de les tec­no­lo­gies que uti­lit­zen diària­ment.”

Tor­nant al cas del català, un dels rep­tes pen­dents és acon­se­guir el seu reco­nei­xe­ment com a llen­gua d’ús ofi­cial al Par­la­ment i les ins­ti­tu­ci­ons euro­pees. Para­do­xal­ment, el cost de la tra­ducció simultània i dels docu­ments ofi­ci­als a Brus­sel·les i Estras­burg, usat com a excusa per anar pos­po­sant el reco­nei­xe­ment del català a Europa, on és una llen­gua més par­lada que la d’alguns estats, con­trasta amb les faci­li­tats que la IA incor­pora al món de la tra­ducció de tex­tos, àudios i vídeos en qual­se­vol idi­oma, inclòs el català. Algu­nes de les mol­tes eines d’IA que anem esbos­sant en aques­tes pàgines ja per­me­ten l’ús del català amb nor­ma­li­tat.

La Gene­ra­li­tat de Cata­lu­nya, a través de Política Lingüística, ha posat en marxa diver­ses ini­ci­a­ti­ves per pro­moure l’ús del català en l’entorn digi­tal. Entre elles des­taca el pro­grama Tec­no­lo­gies de la llen­gua, que ofe­reix sub­ven­ci­ons per al desen­vo­lu­pa­ment d’eines lingüísti­ques en català basa­des en IA.

Ester Fran­quesa, exdi­rec­tora gene­ral de Política Lingüística, insis­teix en la importància d’aques­tes acci­ons: “No es tracta només de pre­ser­var la llen­gua, sinó de garan­tir que el català sigui una llen­gua de progrés, capaç d’adap­tar-se als can­vis tec­nològics i soci­als.”

Antoni Oli­ver, pro­fes­sor en l’àmbit de lingüística com­pu­ta­ci­o­nal a la Uni­ver­si­tat Oberta de Cata­lu­nya, adver­teix: “Si no acon­se­guim que el català esti­gui pre­sent en les tec­no­lo­gies d’IA, cor­rem el risc que la llen­gua perdi pro­gres­si­va­ment àmbits d’ús en les pro­pe­res dècades.”

El camí cap a la plena inte­gració del català en les tec­no­lo­gies d’IA no està exempt de difi­cul­tats. Un dels prin­ci­pals rep­tes és la manca de dades lingüísti­ques en català en com­pa­ració amb llengües més par­la­des com l’anglès o el cas­tellà. Per abor­dar-ho, el pro­jecte Aina ha llançat una crida a la par­ti­ci­pació ciu­ta­dana per reco­llir més dades lingüísti­ques.

Maria Antònia Martí, catedràtica del Depar­ta­ment de Filo­lo­gia Cata­lana i Lingüística Gene­ral de la Uni­ver­si­tat de Bar­ce­lona, explica: “Neces­si­tem la col·labo­ració de tota la comu­ni­tat lingüística cata­lana per crear cor­pus lingüístics prou amplis i diver­sos per entre­nar models d’IA robus­tos.”

Un altre des­a­fi­a­ment és la neces­si­tat de for­mar pro­fes­si­o­nals espe­ci­a­lit­zats en IA i lingüística cata­lana. Diver­ses uni­ver­si­tats cata­la­nes han començat a ofe­rir pro­gra­mes de for­mació específics en aquesta àrea. La Uni­ver­si­tat Politècnica de Cata­lu­nya (UPC), per exem­ple, ha llançat un màster en IA i pro­ces­sa­ment del llen­guatge natu­ral cen­trat en el català i llengües mino­rit­za­des.

Lluís Padró, inves­ti­ga­dor en pro­ces­sa­ment del llen­guatge natu­ral a la UPC, des­taca: “És fona­men­tal for­mar una nova gene­ració d’experts que puguin desen­vo­lu­par i apli­car tec­no­lo­gies d’IA adap­ta­des a les neces­si­tats específiques del català.”

La col·labo­ració entre el sec­tor públic, l’acadèmia i les empre­ses tec­nològiques és deter­mi­nant per a l’èxit d’aques­tes ini­ci­a­ti­ves. També d’enti­tats com Soft­ca­talà, la Fun­dació punt­CAT i Aliança per la Presència Digi­tal del Català. Empre­ses com Goo­gle i Ama­zon han començat a incor­po­rar el català en alguns dels seus pro­duc­tes intel·ligents, però encara queda molt camí per recórrer.

FlowGPT: comunitat per a l’intercanvi de ‘prompts’

FlowGPT és una comunitat en línia dedicada a l’intercanvi de prompts i casos d’ús d’IA. Permet als usuaris compartir, descobrir i aprendre de les experiències dels altres, enriquint així l’ús de la IA en diferents àmbits. Ideal per al desenvolupament de projectes, formació i educació, creació de continguts, investigació i altres àrees beneficiades per l’ús de models d’IA, FlowGPT ofereix una plataforma on els usuaris poden publicar els seus propis prompts, compartir els resultats i col·laborar amb altres membres de la comunitat. Proporciona recursos educatius i guies per millorar l’efectivitat dels models d’IA.

PromptBase: inspira’t i fes contingut de qualitat

PromptBase és una plataforma que ofereix una àmplia varietat d’instruccions (prompts) optimitzades per a diferents aplicacions d’IA. Ideal per a usuaris que necessiten inspiració o directrius específiques per generar continguts de qualitat utilitzant IA. Amb PromptBase, es poden crear textos creatius, generar contingut per a màrqueting, desenvolupar projectes educatius i molt més. Els usuaris poden cercar i descarregar prompts dissenyats per experts que maximitzen els resultats dels models d’IA. L’eina categoritza els prompts per tipus d’ús i aplicació, facilitant la recerca i selecció dels més adequats.

Diccionari

Xarxes generatives

Les xarxes generatives són un tipus de models d’aprenentatge automàtic capaços de generar noves dades similars a les dades d’entrenament. Les GAN (Generative Adversarial Networks) són un exemple popular, on un generador crea dades falses i un discriminador intenta distingir-les de les dades reals. Aquest procés competitiu millora la qualitat de les dades generades.

Intel·ligència artificial explicable (XAI)

La IA explicable (XAI) busca fer els models d’IA més transparents i comprensibles per als humans. Proporciona explicacions sobre com es prenen les decisions, ajudant a augmentar la confiança i la responsabilitat en sistemes d’IA. Això és especialment important en àrees crítiques com la salut, les finances i la justícia, on les decisions d’IA poden tenir un gran impacte.

You Only Look Once (YOLO)

You Only Look Once és un algorisme de visió per computador per a la detecció d’objectes en imatges i vídeos en temps real. A diferència d’altres mètodes que analitzen la imatge en múltiples passos, YOLO processa la imatge sencera d’una sola vegada, permetent una detecció ràpida i precisa. És àmpliament utilitzat en aplicacions de seguretat, vigilància i conducció autònoma.

Rendiment

Es refereix a l’eficàcia d’un model per fer prediccions o classificacions correctes. Es mesura mitjançant mètriques com ara l’exactitud, la precisió, el record i la F1 (mesura de precisió). Un bon rendiment indica que el model generalitza bé a dades noves i és capaç de fer prediccions fiables.



Identificar-me. Si ja sou usuari verificat, us heu d'identificar. Vull ser usuari verificat. Per escriure un comentari cal ser usuari verificat.
Nota: Per aportar comentaris al web és indispensable ser usuari verificat i acceptar les Normes de Participació.
[X]

Aquest és el primer article gratuït d'aquest mes

Ja ets subscriptor?

Fes-te subscriptor per només 48€ per un any (4 €/mes)

Compra un passi per només 1€ al dia