La IA accelera i OpenAI, Google, Meta i la Xina presenten novetats
ChatGPT ara genera imatges realistes i Google estrena la recerca amb IA a l’Estat espanyol
Meta llança el seu assistent a WhatsApp i la nova IA xinesa Manus planta cara a OpenAI
El ritme d’innovació en intel·ligència artificial no s’atura. Aquesta setmana cinc grans notícies han tornat a agitar el sector i han mostrat que la batalla per dominar el futur digital s’intensifica. OpenAI, Google, Meta i la start-up xinesa Monica han anunciat avenços significatius en imatge, veu, cerca, interfícies conversacionals i models de raonament. L’acceleració tecnològica és evident.
OpenAI ha incorporat aquest dimarts una de les funcions més esperades dins del seu producte estel·lar: la generació d’imatges realistes amb GPT-4o directament a ChatGPT. Fins ara, aquesta funció depenia de DALL·E, però ara s’ha integrat dins l’experiència conversacional, millorant-ne la coherència i la precisió. Les imatges hiperrealistes competeixen directament amb Grok 3 d’Elon Musk.
Aquest nou sistema de ChatGPT pot representar fins a 20 objectes diferents amb una relació correcta entre colors, formes i atributs. També millora notablement la capacitat de generar text dins les imatges, una assignatura pendent per als generadors visuals fins ara. Els usuaris poden afinar les imatges mitjançant diverses iteracions conversacionals, i l’enfocament autoregressiu (generar la imatge pas a pas) ofereix un resultat més detallat i controlat. OpenAI sosté que totes les imatges inclouen metadades C2PA per garantir-ne la traçabilitat i evitar l’ús indegut. Està disponible per a usuaris de ChatGPT Plus, Pro i Team, i de manera limitada per a gratuïts.
Google: nova recerca amb IA i Gemini 2.5
El gegant de Mountain View acaba de llançar a l’Estat espanyol les anomenades “vistes amb IA” dins del seu motor de cerca. Aquesta nova funció, ja operativa als Estats Units i en estat de la Unió Europea com l’espanyol, ofereix un resum generat amb IA a la part superior dels resultats de cerca quan es formula una pregunta complexa. Les respostes sintetitzen a partir de fonts fiables i cada fragment inclou un enllaç a la web d’origen.
Aquesta nova experiència es desplega de manera progressiva i només per a usuaris majors de 18 anys amb sessió iniciada. Encara que alguns editors web han expressat preocupació pel descens de visibilitat, Google defensa que millora la qualitat del trànsit i facilita l’accés a informació rellevant.
En paral·lel, Google també ha presentat els últims dies Gemini 2.5 Pro, la seva IA més avançada fins ara. Aquest model, que ja està disponible per als subscriptors de Gemini Advanced, supera amb claredat GPT-4.5 i o3-mini en diverses proves de benchmark, com ara el Humanity’s Last Exam i tests de matemàtiques i ciències.
Gemini 2.5 Pro pot gestionar textos de fins a un milió de tokens (unes 750.000 paraules), i està dissenyat per a tasques multimodals com l’anàlisi de dades, la comprensió de codis i la resolució de problemes complexos amb imatges, àudio i vídeos. Google preveu ampliar el context fins a dos milions de tokens aviat.
Meta: l’assistent d’IA ja parla en espanyol
Meta també s’ha afegit a les novetats d’aquesta setmana amb el llançament de Meta AI a Espanya. Després d’un llarg retard per motius de regulació, l’assistent d’IA de la companyia de Mark Zuckerberg ja està disponible a WhatsApp, Messenger, Instagram i Facebook.
Aquest assistent, identificable per un cercle blau dins les aplicacions, permet fer consultes, obtenir informació del web i generar contingut sense sortir de les apps. Entre les seves funcionalitats hi ha la possibilitat d’interaccionar en grups de WhatsApp amb @MetaAI i accedir a respostes contextualitzades, suggeriments de contingut o tendències personalitzades.
Meta AI està disponible en sis idiomes europeus (encara no el català) i més de 60 països, i ha estat utilitzat per més de 700 milions de persones des del seu llançament als EUA. Meta preveu incorporar noves funcions creatives i millores de personalització en els pròxims mesos.
Manus: la IA xinesa que fa ombra a OpenAI
Des de la Xina arriba una altra sorpresa que ha sacsejat la comunitat tecnològica. La start-up Monica ha presentat Manus, un agent d’intel·ligència artificial general que promet executar tasques complexes de manera autònoma i amb una eficiència que, segons les seves proves internes, supera Deep Research d’OpenAI.
Manus és capaç de programar, analitzar finances, planificar viatges i, fins i tot, fer compres immobiliàries sense supervisió humana. Els seus creadors asseguren que “pensa i actua”, i que connecta idees amb accions. L’agent s’ha convertit en un fenomen viral a la Xina, tot i que només està disponible amb invitació. S’han arribat a vendre codis d’accés per més de 12.000 euros.
Tot i això, Manus també ha aixecat dubtes. Diversos experts assenyalen que encara comet errors en processos llargs i complexos, i hi ha preocupació per la seva manca de transparència i la possible col·laboració amb les autoritats xineses per a la recollida de dades.
Malgrat les crítiques, Manus simbolitza una nova generació d’agents d’IA que busquen la veritable autonomia. El seu creixement recorda al de DeepSeek de fa alguns mesos, i ha posat en alerta OpenAI i altres grans actors occidentals.
En menys d’una setmana, cinc grans avenços han redefinit el panorama de la intel·ligència artificial. Des de les imatges realistes generades per GPT-4o fins a les cerques intel·ligents de Google, passant per l’assistent de Meta i l’agent autònom xinès Manus, tot indica que el 2025 estarà marcat per l’acceleració, la convergència de formats i la lluita per oferir més per menys. L’usuari hi surt guanyant. La IA ja no és una promesa futura. És una realitat en plena expansió, i les eines que avui es llancen al mercat poden canviar radicalment com treballem, aprenem, ens comuniquem i consumim contingut. La revolució s’escriu en temps real.
Roblox crea objectes 3D amb IA i text
Roblox acaba de llançar Cube 3D , un model de codi obert que genera objectes 3D a partir de descripcions de text. Inspirat en els models de llenguatge, pot crear figures detallades en minuts. És un pas per fer més fàcil i ràpida la creació dins la plataforma i afavorir la creativitat dels usuaris.
Snapchat aposta per la IA i la realitat augmentada
Snapchat ha estrenat nous filtres de vídeo amb IA per als subscriptors del seu servei prèmium. Lents com Guineu i Flors de Primavera combinen realitat augmentada i generació d’imatge en temps real. L’objectiu és diferenciar-se d’Instagram i TikTok amb experiències creatives i immersives.
Podcastle: síntesi de veu assequible per a creadors
Podcastle presenta Asyncflow v1.0, un model de veu per convertir text en àudio amb més de 450 veus disponibles i un preu molt competitiu. Tot i que destaca en anglès, té dificultats amb altres idiomes com el castellà. L’API oberta i les eines integrades per a pòdcast i vídeo el fan atractiu.
Endless, la IA per fer-ho tot des d’un sol lloc
Endless és una plataforma tot-en-un que reuneix eines d’IA per transcriure àudio, generar text, crear imatges, traduir idiomes i més. Té una interfície intuïtiva, molt personalitzable i amb preu assequible. No és ideal per automatitzacions avançades, però simplifica molt la feina creativa.
Actualitat
Samsung i Google planten cara a les Ray-Ban de Meta
Les dues companyies treballen en unes ulleres amb Android XR per competir amb les Ray-Ban Meta. El model, batejat com a Haean, inclourà càmeres, sensors i integració amb Gemini Live. Es podrien presentar al Google I/O i farien servir el sistema de realitat augmentada Android XR.
Google compra Wiz per 32.000 milions per ser líder d’IA al núvol
Google ha adquirit la start-up de ciberseguretat Wiz per 32.000 milions de dòlars, la seva operació més gran fins ara. L’objectiu és reforçar Google Cloud i competir amb Amazon i Microsoft en el sector de serveis al núvol, clau per mantenir el lideratge en intel·ligència artificial.
Brussel·les avança contra Google i Apple malgrat Trump
La Comissió Europea investiga Apple i Google per possibles incompliments de la llei de mercats digitals. Brussel·les defensa l’aplicació de les normes malgrat les pressions de l’administració Trump, que acusa la UE d’extorsionar empreses tecnològiques nord-americanes.
Hollywood s’alça contra la IA i defensa els drets d’autor
Més de 400 artistes com Paul McCartney i Cate Blanchett denuncien els intents d’OpenAI i Google de canviar la llei per entrenar IA amb obres protegides. Alerten que això posa en perill milions de llocs de feina i exigeixen compensacions justes i respecte per als creadors.