Microsoft deepfake: Zadostujeta ena fotografija in zvočni posnetek |
Monitor
|
petek, 19. april 2024 ob 19:00 |
Microsoft Research Asia je predstavil generativni model VASA-1, ki je izurjen za ustvarjanje video posnetkov ljudi in njihovega glasu. Pokazali so, da je za uporabo dovolj imeti eno dobro fotografijo, pa lahko na zvočni posnetek pripnemo karkoli. Rezultat je videoposnetek, na katerem oseba govori sinhronizirano z zvočnim posnetkom.
|