Ciència

La IA accelera amb avenços en pocs dies

La captura facial de Runway i la veu de ChatGPT ens apropen a noves formes de creació

Claude 3.5 i ElevenLabs canvien l’experiència creativa i milloren la productivitat

Els seguidors del músic Timbaland poden fer ‘remixs’ del seu senzill amb Suno AI generativa

“Ima­gina que un nen de sis anys pugui fer una pel·lícula que sem­bli de Hollywood”, va piu­lar Bryan McA­nulty, entu­si­as­mat amb el que havia vist de Runway Act-One. Aquesta eina d’intel·ligència arti­fi­cial ha cau­sat sor­presa, espe­ci­al­ment entre cre­a­dors visu­als i audi­o­vi­su­als. Act-One de Runway per­met cap­tu­rar movi­ments faci­als amb una pre­cisió que fins ara només estava a l’abast de grans estu­dis cine­ma­togràfics, cosa que la con­ver­teix en una referència per a la indústria. Però aquest ha estat només un dels molts avenços que han sac­se­jat el món de la IA els últims dies.

La set­mana pas­sada, una autèntica allau de nove­tats va sor­pren­dre el sec­tor tec­nològic. Entre elles, l’arri­bada de noves fun­ci­o­na­li­tats a ChatGPT, com la veu per­so­na­lit­zada a Europa, o el llançament d’eines com Voice Design d’Ele­ven­Labs i Claude 3.5 d’Anth­ro­pic, que pro­me­ten trans­for­mar la pro­duc­ti­vi­tat i la manera com interac­tuem amb els nos­tres dis­po­si­tius. És evi­dent que la com­petència entre empre­ses és cada vegada més ferotge, i totes bus­quen inno­var a un ritme ver­ti­ginós.

Runway ha estat al cap­da­vant d’aquesta onada d’inno­vació amb el llançament d’Act-One, una eina que cap­tura les expres­si­ons faci­als amb un nivell de detall i rea­lisme impres­si­o­nant. Aquesta nova fun­ci­o­na­li­tat per­met als usu­a­ris cap­tu­rar els ges­tos del ros­tre i apli­car-los a ani­ma­ci­ons en temps real, sense neces­si­tat d’equi­pa­ment espe­ci­a­lit­zat. Les reac­ci­ons no s’han fet espe­rar. “Dis­ney està aca­bada, tret que com­pri una com­pa­nyia com aquesta”, va comen­tar Mike Does Finance a X, i va posar en relleu com Act-One podria rede­fi­nir els estàndards de la cre­ació audi­o­vi­sual. Aquesta eina posa el poder de la cap­tura de movi­ment a l’abast de petits cre­a­dors i ofe­reix una eina asse­qui­ble per a pro­jec­tes de tota mena, des d’ani­ma­ci­ons pro­fes­si­o­nals fins a vídeos ama­teurs.

Voice Design d’Ele­ven­Labs. Dins del sec­tor de l’àudio, Ele­ven­Labs ha des­ta­cat amb Voice Design, que per­met crear veus per­so­na­lit­za­des sim­ple­ment escri­vint un text. Aquest avenç no només sim­pli­fica la cre­ació de veus per a pro­jec­tes audi­o­vi­su­als, sinó que també obre la porta a noves for­mes de per­so­na­lit­zació de con­tin­guts. “És el nivell següent”, va escriure Alex Patrascu, elo­gi­ant la faci­li­tat d’ús i el poten­cial de Voice Design per crear veus adap­ta­des a les neces­si­tats específiques de cada pro­jecte. La pos­si­bi­li­tat de crear veus amb accents par­ti­cu­lars o sense l’accent de l’actor ori­gi­nal és només una de les opci­ons que ofe­reix. Ele­ven­Labs, intro­duint la pos­si­bi­li­tat d’adap­tar el to, la velo­ci­tat i altres aspec­tes de la veu, faci­lita un con­trol total sobre l’àudio gene­rat. Serà una eina clau per a cre­a­dors de pòdcasts, dobla­dors i altres pro­fes­si­o­nals del sec­tor audi­o­vi­sual.

Claude 3.5 Son­net. Men­tre que Runway i Ele­ven­Labs inno­ven en el camp visual i sonor, Claude 3.5 Son­net d’Anth­ro­pic repre­senta un salt impor­tant en la interacció amb dis­po­si­tius digi­tals. Aquesta IA avançada pot con­tro­lar un ordi­na­dor de manera autònoma, cosa que per­met exe­cu­tar tas­ques com­ple­xes a par­tir d’ins­truc­ci­ons sen­zi­lles. El que fa que Claude 3.5 sigui espe­cial és la seva capa­ci­tat per com­pren­dre i adap­tar-se a les neces­si­tats de l’usu­ari. Ja no es tracta només de donar ordres sen­zi­lles a un assis­tent digi­tal, sinó de tenir una IA que con­troli apli­ca­ci­ons i ges­ti­o­nar múlti­ples tas­ques de manera efi­ci­ent. Des de l’envi­a­ment de cor­reus fins a la gestió de docu­ments, Claude 3.5 es defi­neix com una eina indis­pen­sa­ble per a la pro­duc­ti­vi­tat diària.

ChatGPT amb veu. Ara els usu­a­ris poden man­te­nir con­ver­ses ver­bals amb el bot de con­versa d’Ope­nAI, cosa que trans­forma com­ple­ta­ment l’experiència d’interac­tuar amb la IA. Aquesta funció, dis­po­ni­ble en múlti­ples llengües, inclo­ent-hi el català i dife­rents vari­e­tats dia­lec­tals, obre noves opor­tu­ni­tats a usu­a­ris de tot el món. La veu de ChatGPT ofe­reix diver­ses opci­ons de per­so­na­lit­zació, amb tons mas­cu­lins i feme­nins que fan que la con­versa sigui més natu­ral i fluida. Amb aquesta fun­ci­o­na­li­tat, Ope­nAI ha fet un pas impor­tant cap a la “huma­nit­zació” de les interac­ci­ons amb assis­tents digi­tals.

Suno i Tim­ba­land. El món de la música també ha expe­ri­men­tat una revo­lució els últims dies amb la col·labo­ració entre Suno i Tim­ba­land. Aquesta aliança ha permès als segui­dors de l’artista fer remixs del seu nou sen­zill uti­lit­zant IA gene­ra­tiva, la qual cosa marca una nova manera de par­ti­ci­par en el procés cre­a­tiu. Suno ha creat una pla­ta­forma perquè els segui­dors puguin per­so­na­lit­zar la música i par­ti­ci­par acti­va­ment en la cre­ació d’obra musi­cal. Això repre­senta un canvi radi­cal en la indústria, on els artis­tes poden col·labo­rar amb els seus segui­dors d’una manera que abans era impen­sa­ble.

Gemini Live i Note­book LM. Goo­gle no es queda enrere amb les seves inno­va­ci­ons. Note­book LM per­met ara gene­rar pòdcasts i resums d’àudio en espa­nyol a par­tir de tex­tos, cosa que faci­lita enor­me­ment el procés de cre­ació de con­tin­guts per a pro­fes­si­o­nals. Aquesta fun­ci­o­na­li­tat, que alguns usu­a­ris estan acon­se­guint que res­pon­gui en català amb un accent millo­ra­ble, suposa un gran avenç en la manera com es poden con­su­mir i com­par­tir con­tin­guts edu­ca­tius o pro­fes­si­o­nals.

Copi­lot a What­sApp. A més, l’arri­bada de Gemini Live amplia les capa­ci­tats d’IA en la gestió de con­ver­ses i con­tin­guts inte­grant-se en pla­ta­for­mes com What­sApp per millo­rar l’experiència diària d’usu­a­ris arreu del món. La IA de Micro­soft Copi­lot també s’inte­gra a What­sApp. Afe­geix a través d’aquest enllaç Copi­lot al mòbil com a con­tacte el número de telèfon +1 877-224-1042. A con­ti­nu­ació ja podràs enviar-li un mis­satge, que pot ser “Hola, Copi­lot”. A con­ti­nu­ació rebràs un breu mis­satge amb els ter­mes d’ús, la política de pri­va­ci­tat i un arti­cle de pre­gun­tes freqüents.

Els avenços en IA d’aquesta set­mana han dei­xat clar que la tec­no­lo­gia no té intenció de fre­nar. Cada set­mana porta noves eines per millo­rar la pro­duc­ti­vi­tat, cre­a­ti­vi­tat i acces­si­bi­li­tat, i fer que les pos­si­bi­li­tats per a cre­a­dors, pro­fes­si­o­nals i usu­a­ris quo­ti­di­ans siguin pràcti­ca­ment infi­ni­tes.

Breus

Professionals de la comunicació local debaten l’impacte de la IA

Les II Jornades de la Comunicació Local, organitzades per la Diputació de Barcelona, han reunit més de 200 professionals per debatre sobre la integració de la IA en l’àmbit municipal. Experts com Pere Vila, de RTVE, Cristina Aced i Enrique San Juan han analitzat com la IA pot millorar la feina dels mitjans i gabinets locals, sempre amb un enfocament ètic.

Protesta massiva d’artistes contra l’ús no autoritzat de les seves obres

Més de 20.000 figures del món de l’art, com Thom Yorke de Radiohead i Julianne Moore, han signat una carta oberta denunciant l’ús no autoritzat de les seves obres per al desenvolupament d’IA com ChatGPT. La carta reclama que aquesta pràctica és una amenaça per als creadors i insta a regular aquest ús.

Apple redueix la producció de Vision Pro per centrar-se en un model més econòmic

Apple ha decidit reduir la producció de les seves ulleres Vision Pro, valorades en 3.500 dòlars, i concentrar-se en un model més assequible. Aquest canvi estratègic respon a la voluntat de la companyia d’arribar a un mercat més ampli amb un producte de realitat augmentada més accessible econòmicament.

OpenAI fitxa Scott Schools com a nou cap de compliment legal

OpenAI ha anunciat la incorporació de Scott Schools com a cap de compliment, un expert amb àmplia experiència en el Departament de Justícia dels Estats Units i en el sector privat. Schools arriba en un moment clau per a la companyia, que afronta desafiaments legals i regulacions globals, després de dimissions col·lectives a la cúpula.



Identificar-me. Si ja sou usuari verificat, us heu d'identificar. Vull ser usuari verificat. Per escriure un comentari cal ser usuari verificat.
Nota: Per aportar comentaris al web és indispensable ser usuari verificat i acceptar les Normes de Participació.