Ciència

Els assistents virtuals es posen les piles

Alexa, Siri i Assistant es reinventen per no quedar enrere i competir amb ChatGPT

Les noves versions prometen converses més naturals i funcions avançades aquest any

Els assistents virtuals van revolucionar la manera d’interactuar amb la tecnologia fa una dècada, però ara afronten un nou repte: continuar sent rellevants en l’era de la intel·ligència artificial (IA) generativa. Alexa d’Amazon, Siri d’Apple i l’Assistant de Google, els tres principals assistents del mercat, estan experimentant una gran transformació per adaptar-se a les noves expectatives dels usuaris, marcades per l’aparició de bots de conversa (chatbots) com ChatGPT.

Quan Amazon va llançar Alexa, fa nou anys, la seva capacitat per descodificar ordres de veu i realitzar tasques senzilles semblava gairebé màgica. Avui, però, el llistó de les habilitats impressionants dels models de llenguatge s’ha elevat considerablement. Per això, Amazon està renovant el seu assistent de veu aprofitant la tecnologia que hi ha darrere de la nova onada de programes capaços de mantenir converses realistes.

La nova versió d’Alexa promet respostes a preguntes molt més complexes i converses més fluides i obertes. Els usuaris ja no hauran de dir “Alexa...” constantment, ja que l’assistent detectarà quan s’espera que continuï la conversa. A més, modularà la seva pròpia veu per establir una interacció més natural, fins i tot mostrant empatia segons el context.

Rohit Prasad, líder del desenvolupament d’IA a Amazon, destaca que aquesta millora ha requerit una gran feina d’enginyeria per evitar els problemes típics dels grans models de llenguatge, com inventar-se fets o dir coses sense sentit. L’objectiu és que l’assistent sigui més versàtil i accessible, capaç de fer centenars de noves accions en aplicacions d’Amazon i tercers.

Per la seva banda, Apple també s’ha vist obligada a replantejar Siri davant l’avenç de la competència. La companyia de Cupertino ha anunciat una important actualització del seu assistent virtual, que integrarà capacitats d’intel·ligència artificial per millorar significativament la seva comprensió del llenguatge i oferir respostes més precises i eficaces.

Tot i que inicialment es preveia que la nova versió de Siri debutaria juntament amb l’actualització d’Apple Intelligence el segon semestre d’aquest any, ara s’espera que les noves funcions estiguin disponibles a partir del segon trimestre del 2025. El retard és degut a la complexitat de les millores i la necessitat de garantir un rendiment òptim.

Entre les novetats més destacades, Siri tindrà un control més precís sobre les accions dins de les aplicacions d’Apple. Per exemple, els usuaris podran demanar a l’assistent que editi una foto i l’enviï a una amistat. A més, podrà entendre millor el context basat en el que l’usuari està veient a la pantalla, per facilitar interaccions més intel·ligents i contextuals.

La integració amb ChatGPT, desenvolupada per OpenAI, és una altra de les característiques esperades que podria arribar a finals del 2024, abans del llançament complet de les altres funcionalitats. Aquestes millores no només faran de Siri una eina més versàtil, sinó també més potent per executar tasques que abans no eren possibles.

Google, per la seva banda, també està immersa en una accelerada competència per desenvolupar tecnologia d’IA. A l’abril, la companyia va fusionar DeepMind, un laboratori de recerca adquirit a Londres, amb Brain, un equip d’IA fundat a Silicon Valley. L’objectiu és impulsar la seva investigació en aquest camp i mantenir-se al capdavant de la cursa per la IA.

Un entrenador personal

El projecte més ambiciós de Google en aquest àmbit és convertir la IA generativa en una mena d’entrenador personal per a la vida. Google DeepMind ha estat treballant en eines per realitzar almenys 21 tipus diferents de tasques personals i professionals, incloent consells de vida, idees, instruccions de planificació i tutoria.

Aquestes noves capacitats podrien transformar l’Assistant de Google en un assistent molt més complet i sofisticat. Per exemple, podria ajudar els usuaris a crear pressupostos financers, plans de menjars i entrenaments, o fins i tot oferir consells sobre com afrontar situacions personals complexes.

No obstant, això també planteja reptes ètics i de seguretat. Els experts en seguretat de la IA de Google adverteixen sobre els perills que la gent es vinculi emocionalment als bots de conversa i sobre possibles impactes negatius en la salut i el benestar dels usuaris si segueixen cegament els consells de la IA.

La cursa per millorar els assistents virtuals no es limita als tres gegants tecnològics. Samsung, per exemple, ha anunciat recentment els seus plans per llançar una versió actualitzada de Bixby, el seu assistent de veu, amb IA aquest any. Segons Tae Moon Roh, president de la divisió de mòbils de l’empresa, la nova versió de Bixby estarà basada en els propis models de llenguatge de Samsung.

Aquesta renovació dels assistents virtuals amb IA generativa marca un punt d’inflexió en la seva evolució. Els nous assistents prometen ser capaços de mantenir converses més naturals i complexes, entendre millor el context i realitzar tasques més sofisticades. Això podria transformar radicalment la manera com interactuem amb la tecnologia en el nostre dia a dia a casa, la feina o el mòbil.

No obstant això, aquesta evolució també planteja importants desafiaments. Les empreses hauran de trobar l’equilibri adequat entre oferir assistents més intel·ligents i evitar els riscos associats a una dependència excessiva de la IA. També hauran d’abordar qüestions ètiques i de privacitat, ja que aquests assistents més avançats tindran accés a una quantitat encara més gran de dades personals.

Per tant, la irrupció de ChatGPT i altres models de llenguatge avançats ha obligat els gegants tecnològics a replantejar-se els seus assistents virtuals. Alexa, Siri i Assistant estan experimentant una profunda transformació que podria redefinir el paper d’aquests assistents en les nostres vides. El futur dels assistents virtuals sembla prometre una interacció més natural i intel·ligent amb la tecnologia, però també ens obligarà a reflexionar sobre els límits i les implicacions d’aquesta relació cada vegada més estreta amb la intel·ligència artificial.

Hume: El bot de conversa que reconeix emocions

Hume AI és una eina que destaca per la seva capacitat per identificar l’estat d’ànim dels usuaris a través de converses verbals. Aquesta tecnologia empàtica pot detectar i reaccionar a les emocions, i millorar la interacció entre humans i màquines. Permet entendre i emular tons de veu i èmfasi en les paraules.

Tome: L’aliat per a presentacions corporatives

Tome és una aplicació que utilitza IA per generar presentacions empresarials clares i efectives. Amb un disseny sobri i funcional, permet crear plantilles personalitzades i estructurar continguts fàcilment. La plataforma ofereix opcions de pagament per generar contingut de manera il·limitada.

Journo: El copilot per als periodistes

Fundada a Màlaga, Journo és una eina pensada per a periodistes que converteix àudios de declaracions en articles escrits. Mitjançant la transcripció i l’assignació d’intencions al text, aquesta aplicació simplifica la redacció de notícies i permet als professionals centrar-se en tasques de major valor afegit.

Descript: Edició de vídeo a través de text

Descript és un editor de vídeo innovador que permet editar clips de vídeo modificant el text transcrit del contingut. Amb funcions com la generació d’àudio a partir de text i la possibilitat d’exportar projectes a altres aplicacions, fa que l’edició de vídeo sigui accessible i eficient per a tothom.

Diccionari

Al·lucinar

En el context de la intel·ligència artificial, “al·lucinar” es refereix a la situació en què un model d’IA, com una xarxa neuronal, produeix resultats inesperats o errors aparentment absurds. Això pot ocórrer quan el model interpreta dades de manera incorrecta i genera sortides que no tenen sentit en el context donat.

Assistent virtual

Un assistent virtual és un programa informàtic dissenyat per ajudar els usuaris en tasques diverses mitjançant interaccions de veu o text. Exemples populars serien Alexa d’Amazon, Siri d’Apple i Google Assistant. Aquests assistents poden gestionar calendaris, respondre preguntes i controlar dispositius domòtics.

Bot de conversa

Un bot de conversa o chatbot és un programa d’IA que simula una conversa amb usuaris humans, normalment a través de missatges de text. Aquests bots s’utilitzen en atenció al client, suport tècnic i altres aplicacions on es necessita una comunicació ràpida i automatitzada. Poden ser senzills, basats en regles, o més complexos, utilitzant aprenentatge automàtic.

Clusterització

La clusterització (clustering) és una tècnica de l’aprenentatge automàtic utilitzada per agrupar dades similars en clústers o grups. Això permet identificar patrons i estructures en dades sense etiquetar. Algoritmes com K-means i Dbscan són exemples de mètodes de clusterització, útils en àrees com l’anàlisi de mercat i la segmentació de clients.



Identificar-me. Si ja sou usuari verificat, us heu d'identificar. Vull ser usuari verificat. Per escriure un comentari cal ser usuari verificat.
Nota: Per aportar comentaris al web és indispensable ser usuari verificat i acceptar les Normes de Participació.
[X]

Aquest és el primer article gratuït d'aquest mes

Ja ets subscriptor?

Fes-te subscriptor per només 48€ per un any (4 €/mes)

Compra un passi per només 1€ al dia