×
Imagen de Veracruz 
FacebookTwitterYoutube
Diario del Istmo
Suscribete a nuestros boletines
Lo mas viral

VASA-1: La innovadora IA de Microsoft que anima fotos con voz realista

Microsoft Research desarrolló VASA-1, una avanzada herramienta de IA que genera videos hiperrealistas a partir de fotografías y audio
| 2024-04-21 | Jesús Valderrábano
VASA-1: La innovadora IA de Microsoft que anima fotos con voz realista
Demostración de VASA-1 de Microsoft Research: Mostrando la capacidad de la IA para crear expresiones faciales y movimientos de cabeza convincentes
Imagen de VeracruzImagen de Veracruz

La capacidad de la inteligencia artificial para sorprender parece no tener fin, y Microsoft Research acaba de subir la apuesta.

Esta división de investigación del gigante tecnológico ha desarrollado una herramienta de IA generativa, conocida como VASA-1, que crea videos hiperrealistas de "rostros parlantes" a partir de una simple foto y una pista de audio.

¿Qué hace a VASA-1 tan especial?

VASA-1 (Visual Affective Skills Animator) es capaz de tomar una fotografía estática de una persona y hacer que "hable", sincronizando de manera convincente los movimientos de sus labios con cualquier archivo de audio.

Esta tecnología capta un amplio rango de matices faciales y movimientos naturales de la cabeza, lo que contribuye a la autenticidad y vivacidad del video generado.

El VASA-1 en acción

Para evitar problemas de privacidad, Microsoft utilizó rostros generados por inteligencia artificial a través de redes neuronales como DALL-E 3 y StyleGAN2 en sus demostraciones.

Entre las muestras mostradas, se incluyen avatares que cantan y hablan en perfecta sincronización con pistas de audio, capaces de expresar diferentes emociones y dirigir su mirada.

Incluso, en una prueba audaz, los creadores animaron la icónica imagen de la 'Mona Lisa' de Leonardo da Vinci para que interpretara un rap, mostrando la versatilidad y alcance de VASA-1.

Peligros potenciales y medidas de precaución

Aunque la tecnología detrás de VASA-1 es impresionante, también acarrea riesgos significativos.

Microsoft es plenamente consciente del potencial de abuso de esta tecnología, especialmente en la creación de 'deepfakes' que podrían ser utilizados para fraudes o desinformación.

Por ello, VASA-1 se encuentra en una etapa de desarrollo cerrado y no está disponible para el público general.

La compañía destaca que, aunque la tecnología es avanzada y supera a otros sistemas de animación de voz en términos de realismo y expresividad, todavía está lejos de ser perfecta y su liberación podría tener consecuencias serias si se utiliza inapropiadamente.

Este avance en IA de Microsoft Research plantea tanto posibilidades emocionantes como dilemas éticos, subrayando la dualidad de la tecnología moderna: un potencial inmenso para el bien y, a la vez, para el mal.

  • Lo último
  • Lo más leído
Diario del Istmo
Diario del Istmo

SÍGUENOS EN REDES

 

Nosotros | Publicidad | Suscripciones | Contacto | Aviso de Privacidad

 

 

Reservados todos los derechos 2024