Ko GPT-4 Vision sreča ElevenLabs, dobimo umetnega Davida Attenborougha |
Slo-Tech
|
Avtor Matej Huš
|
nedelja, 19. november 2023 ob 20:11 |
Tehnologija obstaja že nekaj časa, a šele ko združimo njene različne pojavne oblike, postane zares jasno, česa je sposobna. Charlie Holtz je na X-u pokazal, kako je združil GPT-4 Vision, ki ustvari besedilni opis vizualnih podob, in tehnologija za kloniranje glasu ElevenLabs. Spisal je skripto, ki vsakih pet sekund zajame posnetek z njegove kamere, ga prek API posreduje GPT-4 Vision, nato pa besed...
|