Tunisie-Tribune (IA de Microsoft) –Microsoft crée une technologie d’IA pour transformer une photo et un échantillon de voix en vidéo ultra réaliste, futur terreau pour les fraudes et les fakenews.
Microsoft a mis au point une technologie d’intelligence artificielle (IA) qui permet de transformer une photo de visage et un échantillon de voix en une vidéo ultra réaliste d’un « visage en train de parler ». Baptisée VASA-1, cette technologie prend une simple photo de portrait et un fichier audio et les convertit en une vidéo où le visage s’anime et parle de façon hyperréaliste.
L’essor rapide de l’IA générative, qui permet de produire facilement toutes sortes de contenus (textes, images, sons…) de qualité bluffante, suscite de nombreuses inquiétudes, notamment en termes d’exploitation à des fins de fraude et de désinformation. Microsoft reconnaît que cette technologie pourrait être utilisée à mauvais escient pour usurper l’identité d’un être humain.
Microsoft se concentre sur des applications positives de l’IA
Cependant, la firme informatique assure se concentrer sur des applications positives de l’IA générative, telles que le renforcement de l’équité en matière d’éducation, l’amélioration de l’accessibilité pour les personnes ayant des difficultés de communication, et le soutien thérapeutique aux personnes qui en ont besoin. Microsoft ne prévoit pas de rendre le nouvel outil disponible ou de donner des informations techniques « tant que nous ne sommes pas certains que la technologie sera utilisée de manière responsable et conformément aux réglementations en vigueur ».
D’autres entreprises travaillent également sur cette technologie, comme Runway, une des spécialistes de l’IA générative pour la vidéo. Des chercheurs de Google ont aussi créé un modèle d’IA, Vlogger, qui peut générer des vidéos réalistes de têtes parlantes.