hsvision


Premium (Pro), Regensburg

Subway Station.

Da ich aus gesundheitlichen Gründen immer noch ganz wenig fotografiere,
verbringe ich viel Zeit mit meinen KI-Projekten.
Heute zeige ich ein paar KI-Videosequenzen, die bis vor kurzem mit der KI kaum realisierbar waren.
Das hat sich jedoch vor ein paar Tagen erheblich geändert, als Google das neue VEO-3 präsentierte - die generative KI für Videos hat ein neues unvorstellbares Level erreicht.
Hier sind meine ersten Erfahrungen mit der neuen Generation.

Die Aufgabe:
Erstelle ein paar Fotos einer Frau, die in einer U-Bahn-Station steht, die mit einer Hasselblad X2D 80mm-Objektiv bei f/4 aufgenommen wurden.
Aus diesen Fotos sollen kurze (10 Sekunden lange) Video-Sequenzen generiert werden, die unterschiedliche Perspektiven, Lichtreflexionen, Spiegelungen und eine cinematische Kameraführung realistisch darstellen.

Hier ist das Ergebnis (in 720p Auflösung, weil die 4K Datei für den Server zu groß ist):

https://www.picdrop.com/hsvision/MZkug3Kcko?file=ef6617265f9ec473cfe3e791f7fec86b

VEO-3 kann den Kontext sehr viel besser verarbeiten und jetzt Videos mit Ton erstellen, sogar Dialoge zwischen Personen sind möglich.
Allerdings sind die Pakete ziemlich teuer - Pro Abonnement: 899,9 $ im Jahr.

Commentaire 112