Google sfida Hollywood. Con Veo 3.1, chiunque può fare video professionali


Il colosso di Mountain View integra il suo modello generativo più avanzato in Google Vids: avatar parlanti in italiano, musica originale, export diretto su YouTube. La produzione video non sarà più la stessa.

Mountain View, California. Nel silenzio dei server farm della Silicon Valley, qualcosa ha cambiato la regola del gioco. Google ha annunciato l'integrazione di Veo 3.1 - la versione più sofisticata del suo modello di generazione video - direttamente dentro Google Vids, la piattaforma di creazione video del pacchetto Workspace. Il messaggio è chiaro: fare un video professionale non richiede più una troupe, un budget o anni di esperienza in post-produzione.

La mossa arriva in un momento di accelerazione senza precedenti nella corsa all'intelligenza artificiale applicata ai contenuti. Mentre OpenAI spinge Sora e Meta rilascia i suoi modelli video, Google sceglie una strada diversa: non la piattaforma separata, non lo strumento per addetti ai lavori, ma l'integrazione diretta negli strumenti che milioni di aziende usano già ogni giorno.

L'italiano che muove le labbra

La novità che ha fatto alzare più di un sopracciglio tra gli esperti è il supporto nativo alla lingua italiana per la generazione di avatar parlanti. Non si tratta di doppiaggio automatico, non si tratta di sottotitoli generati. Il modello produce avatar che articolano ogni sillaba con una sincronizzazione labiale che, nelle demo mostrate da Google, è difficilmente distinguibile dal reale.

Per le aziende italiane - e per i creator che producono contenuti in lingua - si apre uno scenario inedito: materiale formativo, video corporate, tutorial di prodotto generati in pochi minuti, con un presentatore virtuale che parla come un madrelingua. Senza casting, senza studio di registrazione, senza post-produzione.

Una colonna sonora che nasce col video

Ma la musica - nel senso letterale del termine - è l'altra sorpresa. Veo 3.1 non si limita a sovrapporre un brano preselezionato al girato generato: compone una colonna sonora originale che segue la struttura del video, con un'intro riconoscibile, uno sviluppo coerente con il ritmo delle immagini e una conclusione che chiude senza stridere. Questa integrazione audio-visiva è il segnale più chiaro di quanto il modello si sia evoluto rispetto alla versione precedente.

Chi ci guadagna e chi trema

Le agenzie di comunicazione, i piccoli studi di produzione e i freelance specializzati in video aziendali si trovano di fronte a una domanda scomoda: cosa succede quando il loro cliente può produrre da solo, in un'ora, quello che fino a ieri richiedeva settimane e migliaia di euro? Non è fantascienza. È la stessa domanda che il settore della grafica si è già posto con Midjourney, e quella che i copywriter si sono posti con ChatGPT. Ora tocca al video.

D'altra parte, chi produce contenuti in quantità industriale - piattaforme di e-learning, reti retail, catene alberghiere, istituzioni pubbliche - vede in Veo 3.1 una risposta concreta a un problema reale: scalare la produzione senza scalare i costi.

La posta in gioco per Google

Per Google, l'integrazione di Veo 3.1 in Workspace non è solo un aggiornamento di prodotto: è una dichiarazione di posizionamento. In un mercato dove Microsoft preme con Copilot e OpenAI cerca di entrare nelle aziende con ChatGPT Enterprise, differenziarsi sul terreno della creazione video è una mossa che potrebbe rivelarsi decisiva.

Il futuro del lavoro creativo si scrive adesso, un fotogramma alla volta. E Google, per ora, ha la penna in mano.

Nuova Vecchia

نموذج الاتصال