Nvidia hæver barren for AI-baseret tekst-til-video

Nvidias nye tekst-til-video teknologi vil blæse dig omkuld, hvis du er storbruger af GIF'er - den viser også fremtiden for video baseret på tekstbidder.

Kunstig intelligens i dag er nærmest blevet meget mainstream takket være AI-assistenter som ChatGPT og værktøjer som Midjourney.

Nu er Nvidia også i gang med noget, som kan ende med at tage vores GIF-oplevelse til et helt nyt niveau.

Se også: Spot AI-snyd med nyt værktøj

Genererer videoer ved lav kraft

Virksomhedens Toronto AI Lab har udviklet det, de kalder “Latent Diffusion Models”. De er i stand til at generere videoer uden behov for store mængder computerkraft. Disse modeller kan betragtes som en type AI, der er bygget oven på tekst-til-billedgeneratorer.

Teknologien er i stand til at frembringe brugbare resultater ud fra simple opfordringer som “en stormtrooper, der støvsuger på stranden” eller “en bamse, der spiller elektrisk guitar, high definition, 4K”.

Viser fremtiden for tekst-til-video

Mens tekst-til-video teknologi som Nvidias demoer er mest velegnet til at skabe miniaturebilleder og GIF’er, tyder de hurtige fremskridt, der er set i Nvidias AI-generation til længere scener, på, at vi ikke behøver at vente længe på længere tekst-til-video-klip.

Nvidia er heller ikke det eneste firma, der fremviser tekst-til-video generatorer. Google Phenaki har allerede haft sin debut og afsløret potentialet for 20-sekunders klip baseret på længere tekstinput samt et to-minutters klip.

Mens fuld tekst-til-video generering stadig har lidt vej til at være helt vellykket, tyder de seneste fremskridt på, at forbedringer, der gør teknologien egnet til længere videoer, er lige rundt om hjørnet.