Ciència

La IA ja permet fer un pòdcast sense parlar

Notebook LM de Google crea pòdcasts conversacionals a partir de textos i documents

La IA democratitza la producció de pòdcasts i revoluciona el món de l’àudio

El món de l’àudio està experimentant una autèntica revolució gràcies a la intel·ligència artificial (IA), que ha entrat de ple en la creació i producció de pòdcasts. Aquesta tecnologia, que ja ha transformat sectors com la creació de text, imatges i vídeos, ara es posa al servei de la creació automàtica de contingut sonor. Una de les eines que ha cridat més l’atenció recentment és de Google, que permet generar converses entre dues persones a partir d’un document o enganxant-hi text i convertir-ho en un pòdcast de qualitat. Actualment només està disponible en anglès, però les possibilitats d’expansió a altres idiomes són immenses.

Notebook LM no és només una eina per organitzar informació o generar resums escrits, sinó que porta la IA un pas més enllà, creant àudio conversacional a partir de les fonts que l’usuari carrega. Això significa que només pujant un document, un article o fins i tot una presentació de Google Slides l’eina pot generar un debat entre dues veus virtuals molt realistes, que discuteixen els punts més importants, fan connexions entre temes i ofereixen una visió coherent del contingut. La funcionalitat, anomenada Audio Overview, és part del pla de Google per potenciar l’ús de la IA en projectes creatius.

Notebook LM, que es va llançar com una eina de presa de notes avançada el 2023, s’ha anat expandint en funcionalitats gràcies a les capacitats multimodals de Gemini 1.5, el model de llenguatge que la impulsa. Aquest octubre, Google ha afegit la capacitat de crear pòdcasts automàtics a partir de qualsevol font d’informació que l’usuari carregui. Amb només un clic, els usuaris poden generar una conversa detallada entre dues veus d’IA que desglossen, analitzen i conversen sobre el tema de manera natural. La tecnologia s’utilitza tant per a resums curts com per a discussions més extenses i l’usuari pot descarregar l’àudio o compartir-lo directament.

Aquest avanç no només facilita la creació de contingut d’àudio, sinó que obre la porta a noves formes d’aprenentatge i entreteniment. Imagina poder carregar un text acadèmic complex o un informe de treball i, al cap de pocs minuts, tenir un pòdcast que n’extreu els punts clau i el presenta de manera accessible i entretinguda. Això és el que ofereix Notebook LM, i el fet que les converses d’IA incloguin elements com pauses naturals, “ums” i “ohs”, li dona un aire sorprenentment humà.

Tot i que aquesta funcionalitat encara té certes limitacions –com la disponibilitat només en anglès o possibles inexactituds en la interpretació de fonts molt complexes–, Google treballa per polir aquests aspectes i expandir l’ús de Notebook LM a més idiomes. És només qüestió de temps que el català formi part de les opcions disponibles, democratitzant encara més l’accés a aquesta eina.

Altres eines pràctiques d’IA

Notebook LM és una de les moltes eines per crear pòdcasts i àudios en general. A continuació, us presentem algunes de les més destacades:

Descript: És una de les més completes per editar àudio i vídebook. Utilitza IA per generar transcripcions automàtiques de pòdcasts, permet l’edició del contingut a través del text, és a dir, si s’elimina una paraula en la transcripció, també desapareix de l’àudio, i inclou funcions de síntesi de veu. Ofereix la possibilitat de crear un pòdcast de principi a fi, des de l’enregistrament fins a la publicació.

Podcastle: aquest programari facilita la gravació, edició i millora del so dels pòdcasts, utilitzant tecnologies basades en IA. Pot convertir articles escrits en episodis d’àudio, generant veus naturals a partir de text. A més, permet gravar converses en remot amb qualitat professional i aplicar efectes de millora automàtics, com la reducció de soroll de fons.

Sonix: és una eina de transcripció basada en IA que converteix enregistraments d’àudio en text en més de trenta idiomes. Ideal per a podcasters que volen oferir transcripcions als seus oients o per editar el contingut d’una manera ràpida i precisa. També ofereix traduccions automàtiques i sincronització de text amb l’àudio fet que facilita la creació de subtítols.

Anchor by Spotify: aquesta plataforma gratuïta de creació de pòdcasts ha integrat recentment funcions d’IA per facilitar la creació d’episodis. Amb una interfície senzilla, permet gravar, editar i distribuir el seu pòdcast a múltiples plataformes, tot en un sol lloc. La IA pot suggerir millores en l’àudio i optimitzar-ne la qualitat.

Auphonic: centrada en l’optimització automàtica del so, ajusta els nivells d’àudio, redueix el soroll de fons i millora la qualitat global de les gravacions. Aquesta eina és ideal per a podcasters que no tenen un equip de so professional i necessiten assegurar-se que el contingut se sent amb so professional.

Speechify: una eina de lectura automàtica que utilitza IA per transformar text en veu amb una qualitat sorprenentment humana. Ideal per a creadors que volen generar ràpidament àudio a partir d’articles o documents. Tot i que no és específic per a pòdcasts, pot ser una eina útil per convertir contingut escrit en àudio.

Nova era per a l’àudio

Aquestes eines no només faciliten la creació de pòdcasts, sinó que també obren noves possibilitats per a la ràdio, l’educació i altres sectors basats en l’àudio. Amb la capacitat de generar transcripcions, millorar l’àudio o fins i tot traduir contingut a altres idiomes, les solucions d’IA estan fent que la producció d’àudio sigui més accessible i àmplia que mai.

El cas de Notebook LM de Google és només la punta de l’iceberg. Aquest model no només simplifica la generació de contingut d’àudio, sinó que ho fa d’una manera sorprenentment interactiva. Amb una qualitat de veu natural i la capacitat de generar converses entre dues veus d’IA que semblen humanes, aquesta eina obre els ulls perquè allò que fins ara semblava reservat a uns privilegiats estigui a l’abast de qualsevol usuari. La integració amb altres productes de Google, com YouTube i Google Docs, fa que aquesta eina sigui cada vegada més versàtil.

Breus

Adobe llança un generador de vídeos amb IA

Adobe ha presentat una nova eina dins Firefly: un generador de vídeos basat en IA. Actualment en fase beta i disponible gratuïtament, permet crear vídeos de cinc segons amb instruccions textuals o imatges. Tot i que els resultats no són sempre perfectes, la seva qualitat és sorprenent i divertida de provar.

Apple vol fer unes ulleres tipus Ray-Ban amb IA

Apple vol competir amb les Ray-Ban de Meta llançant unes ulleres intel·ligents pròpies per al 2027. Aquestes podrien tenir un preu d’entre 300 i 600 euros i permetrien interactuar amb l’iPhone i gravar vídeo. Mentrestant, la companyia continuarà desenvolupant una versió més barata de les ulleres Vision Pro.

Científics xinesos desenvolupen un robot controlat per cervell artificial

Investigadors de la Xina han creat un robot controlat per un “minicervell” amb cèl·lules humanes. Aquest avenç permet al robot realitzar tasques complexes com seguir objectes i esquivar obstacles. La tecnologia utilitza un dispositiu anomenat brain-on-chip. Obre nous camins per a la robòtica i la IA.

La IA supera els humans dirigint una empresa en un experiment

Un experiment de la Universitat de Cambridge ha posat a prova una IA com a directora executiva d’una empresa. Els resultats van mostrar que l’algorisme superava els humans en la presa de decisions empresarials, però va fallar quan es va enfrontar a una simulació de pandèmia i va col·lapsar davant el caos del mercat.



Identificar-me. Si ja sou usuari verificat, us heu d'identificar. Vull ser usuari verificat. Per escriure un comentari cal ser usuari verificat.
Nota: Per aportar comentaris al web és indispensable ser usuari verificat i acceptar les Normes de Participació.
[X]

Aquest és el primer article gratuït d'aquest mes

Ja ets subscriptor?

Fes-te subscriptor per només 48€ per un any (4 €/mes)

Compra un passi per només 1€ al dia