Fils per randaDescobreix com l'IA està revolucionant el món del podcasting i els mitjans sonors!

per David Poblador i Garcia
Imatge destacada per a La veu i l'algoritme: el futur del podcast i els mitjans sonors

La veu i l'algoritme: el futur del podcast i els mitjans sonors

Fa unes setmanes vaig tenir el privilegi de participar a les jornades de l'Espai Sonor Català a la Roca Umbert de Granollers. Un lloc que, més enllà del seu valor com a espai cultural, té una connexió molt personal amb la meva família: fou a la fàbrica dels Roca Umbert de Sant Feliu de Codines on la meva àvia va treballar i la meva mare i les meves tietes es van criar quan arribaren a Catalunya fa uns 70 anys.

Podeu veure la xerrada sencera en aquest vídeo:

La veu i l'algoritme: el futur del podcast i els mitjans sonors

En aquest article resumeixo els punts clau de la intervenció.

L'acceleració de l'acceleració

Si m'haguéssiu preguntat fa cinc anys on seria l'àudio avui, probablement hauria errat de mig a mig. El ritme del canvi és tan exagerat que ja no parlem només de velocitat: parlem d'acceleració de l'acceleració. La tercera derivada del progrés tecnològic.

El 2025 ja tenim prop de cinc milions de podcasts al món, amb uns 584 milions d'oïdors mensuals. Són dades impressionants, però molt allunyades encara d'altres formats com el vídeo. I precisament això és una oportunitat: l'àudio és un territori obert on encara queda molt per construir.

L'evolució de la síntesi de veu

Per il·lustrar aquesta acceleració, a la xerrada vaig fer servir exemples de síntesi de veu en català. Fa tres anys, les veus sintètiques eren clarament artificials: metàl·liques, incapaces d'interpretar acrònims, lluny de qualsevol entonació humana. Fa un any, ja hi havia ritme i naturalitat. Avui, amb eines a l'abast de tothom i a costos ridículs, podem generar veus que, si no estàs atent, perfectament podrien ser d'una persona real.

El salt entre cada generació és cada cop més substancial. No només anem més ràpid: accelerem cada cop més ràpid que abans.

La bombolla de la IA

Sí, la bombolla existeix i és enorme. El primer trimestre del 2025, una sola operació —els 40.000 milions de dòlars d'OpenAI— va capgirar tota la corba global de capital risc. Set de les nou rondes més grans del 2024 van ser d'empreses d'IA.

Però, a diferència d'altres bombolles que només deixen cendres, aquesta deixarà un llegat immens: eines, models i tecnologia que continuaran funcionant encara que els gegants d'avui desapareguin. Molta de la ciència que fa possibles aquests avenços és oberta, lliure i accessible.

L'Uncanny Valley de la veu

Aquest progrés tan ràpid ens ha portat a un fenomen curiós. Abans detectàvem la màquina perquè sonava malament. Ara passa exactament al revés: detectem la màquina perquè sona massa perfectament. No hi ha cap "eh?", cap vacil·lació, cap segon de "espera, que busco la paraula".

Hem passat de desconfiar perquè era massa dolent a desconfiar perquè és massa bo. I això ens revela una cosa molt humana: no confiem tant en la perfecció com en la naturalitat.

No és la fi de cap ofici: és la mutació natural

La impremta no va matar l'escriptura. Internet no va eliminar la comunicació presencial. El Photoshop no va matar el disseny. Cada tecnologia que arriba elimina una part de la feina —normalment la més rutinària— i en fa créixer una altra —normalment la que genera més valor.

Amb l'àudio i la IA passa exactament el mateix. No estem davant de la mort de cap professió: estem davant d'una mutació natural. El que ens toca és ampliar la caixa d'eines.

La IA és com les peces de Lego més avançades. No et fan la feina. Però et permeten fer coses que abans eren inabastables.

Equips petits, impacte gegant

Una de les conseqüències més fascinants d'aquesta nova caixa d'eines és que cada cop equips més petits poden fer coses més grans. Instagram tenia 13 persones quan el va comprar Facebook. WhatsApp, amb un parell de desenes d'enginyers, gestionava milers de milions de missatges. Quan vaig arribar a Spotify el 2011, un equip de només 6 persones gestionava més de 10.000 servidors.

Per a un país petit com el nostre, és una oportunitat monumental. Joves de Girona, de Lleida, de Barcelona, del Vallès, amb aquestes eines poden fer coses que la nostra generació ni hauria imaginat.

És el moment de l'àudio

En un món saturat de vídeo, l'àudio continua sent un territori obert. Un espai on una bona idea, una bona veu i una bona història poden sobresortir amb molta més facilitat. Quanta gent té una història potent per explicar però és massa tímida per posar-se davant d'una càmera? L'àudio els obre la porta.

L'oportunitat per al català

Fins fa poc, fer contingut en català volia dir parlar només als qui entenen català. Però avui està passant una cosa completament nova. El mateix contingut pot sortir demà en anglès, francès, portuguès o japonès... i el millor: mantenint la veu, el to i el ritme del creador original.

És un d'aquells moments en la història on el català pot ser no només una llengua de consum intern, sinó una llengua d'exportació de relat. I funciona en ambdues direccions: els catalanoparlants podrem accedir a continguts de nínxol enterrats en altres idiomes i sentir-los en català, amb naturalitat.

Una crida a la inversió pública

Ara que cada setmana llegim titulars sobre inversions en IA, sisplau: que aquests diners no acabin, un cop més, allà on sempre. Si destinem els recursos públics a reforçar les corporacions gegants que ja controlen la infraestructura digital global, haurem perdut una oportunitat irrepetible.

Aquests recursos han d'arribar a qui pot transformar de veritat el nostre ecosistema: creadors locals, estudis petits, enginyers d'aquí, projectes en català, joves que estan començant.

El paper dels mitjans tradicionals

Als professionals dels mitjans tradicionals: no és un missatge de por ni d'amenaça. És tot el contrari. Sou vosaltres qui podeu liderar aquesta nova etapa. El que fa memorables els programes, les cròniques i els podcasts no és la tecnologia: és el criteri, és la mirada, és el contingut, és la veu professional. La tecnologia només amplia les possibilitats —si decidiu aprofitar-les.

Conclusió

La IA és només el maletí de peces de Lego. Però qui decideix què val la pena explicar, qui marca el to i la mirada, qui construeix les històries i hi posa ànima... som nosaltres.

Si fem les coses bé, aquesta acceleració que sembla imposada des de fora la podem convertir en una oportunitat històrica. Una oportunitat per construir —des d'aquí, amb talent d'aquí— el futur dels mitjans sonors en català. Un futur més obert, més potent i, sobretot, més nostre.

Tags

  • Podcasting
  • Intel·ligència Artificial
  • Mitjans Sonors
  • Tecnologia
  • Llengua Catalana