El “retrato parlante” transforma las fotos en cabezas parlantes realistas extrañas

D-ID, una empresa con tecnología Aplicación My Heritage, Ha probado una nueva aplicación para su tecnología. Llamado el “retrato parlante”, permite animar cualquier foto con una realidad extraña y es capaz de decirle al usuario lo que quiere.

Mi tradicion Apareció en los titulares en 2020 por primera vez “Photo Enhancer” Una herramienta que utilizó inteligencia artificial para recuperar fotos familiares antiguas. A principios de este año, My Heritage llevó su trabajo un paso más allá Nostalgia profunda, Que tiene la capacidad de animar a las personas a partir de fotografías.

Señalado En Petapixel Cobertura original, AI en el núcleo de la aplicación tiene licencia de D-ID, que se especializa en la reconstrucción de video mediante el aprendizaje en profundidad. T-ID Deep Nostalgia no parece contentarse con relajarse en los laureles, sin embargo, ha probado su nueva aplicación de tecnología que puede animar una foto y permitir que un usuario la controle en tiempo real.

Como Reportado por Tech CrunchEl resultado puede parecer un “deepfax” en línea que crece con precisión, pero la tecnología detrás del retrato hablado es muy diferente y no requiere entrenamiento para construir uno básico.

Speaking Portraits permite a cualquier persona crear un video de alta definición a partir de una imagen original y combinar esa animación con voz grabada o texto mecanografiado. T-ID planea lanzar el producto con soporte para tres idiomas, inglés, español y japonés, pero también planea agregar otros idiomas si lo desea.

Hay dos tipos de retrato hablado: uno se llama “personaje entrenado” y se debe enviar un video de entrenamiento de 10 minutos del personaje solicitado, que debe cumplir con las pautas proporcionadas por el D-ID. Si bien requiere mucho trabajo, es más fluido en una animación de personajes, lo que admite la capacidad de cambiar el fondo.

A continuación se muestra un ejemplo de un presentador de noticias generado por IA creado utilizando el método “Escritura capacitada”.

El uso de metraje entrenado de 10 minutos recuerda a la tecnología Enviado por la hora uno en febrero. En él, los usuarios pueden crear un “clon de IA” dentro de sí mismos, que, una vez entrenado, puede hablar y moverse como el original.

Pero otra aplicación de la tecnología D-ID es más interesante: “retrato único”. Estos se pueden hacer en cualquier foto fija y animar la cabeza, otras partes son estables y el fondo no se puede cambiar. Sin embargo, el resultado a continuación muestra cómo los gestos y expresiones faciales realizados por la persona real se incorporan a la perfección en una foto. El hombre puede actuar como una especie de marioneta de película fotográfica.

Al reconocer los peligros potenciales de este tipo de tecnología, TechCrunch reconoce que él y su empresa están “ansiosos por asegurarse de que sea buena, no mala”. La compañía planea asociarse con otros para evitar abusos mientras hace todo lo posible para crear garantías.

Estaremos encantados de escuchar lo que piensas

Deje una respuesta

El Universal Colonia del Valle