Neue Speech-to-Video-KI von Alibaba macht Porträts lebendig
Alibaba hat mit Wan2.2-S2V (Speech-to-Video) ein neues Open-Source-Modell vorgestellt. Die KI verwandelt einfache Porträtfotos in lebensechte Avatare, die sprechen, singen oder performen können – und erweitert damit die Wan2.2-Reihe zur Videogenerierung um eine weitere Schlüsseltechnologie.
Bereits aus einem einzigen Bild und einem Audioclip erzeugt das Modell hochwertige Animationen in verschiedenen Formaten – vom klassischen Porträt über Halbporträt bis hin zur