Révolution technologique ou fin du monde ?

Oh, le beau titre aguicheur ! …

Ces dernières semaines, ces derniers jours, il se passe sur Internet, une révolution un peu particulière. Tout le monde ne la vit pas, tout le monde ne la voit pas, mais il se passe quelque chose de réellement spectaculaire. Et ceux qui perçoivent ce changement se partagent rapidement en deux groupes : le premier a l’impression de se retrouver au siècle des Lumières et embrasse cette nouvelle technologie avec le plus fervent enthousiasme. Le second groupe éprouve crainte, mépris et n’a plus aucun doute concernant le naufrage poche de notre civilisation. Rien que ça ! Mais de quoi s’agit-il ? Un laser capable de détruire des planètes ? Un dispositif permettant de pirater l’iPhone ou le Samsung de n’importe qui ? Non. Il s’agit d’un “algorithme de dessin”.

Deep Learning, Intelligence Artificielle, GPGPU, etc.

Algorithme de dessin, c’est un peu réducteur. Reprenons. Entrons dans les détails sans trop vous noyer non plus dans les entrailles de cette technologie. On doit pouvoir trouver un juste milieu qui permettrait à tout le monde de comprendre le phénomène, ses tenants, ses promesses et les craintes qu’il suscite.

Depuis toujours, l’informatique évolue grâce à des génies capables de résumer sous une forme mathématique, des problèmes et besoins plus ou moins complexes. Ce sont ces personnes, avec leurs morceaux de programmes, qui mettent au point des technologies servant à la balance qui pèse vos fruits et légumes chez Carrefour et devine qu’il s’agit de pommes Pink Lady, ou bien aux voitures autonomes afin qu’elles réagissent au trafic, à la signalisation, aux dangers. Enfin, on retrouve également ces algorithmes brillants derrière vos filtres snapchat, pour bien aligner les effets sur vos visages et vous faire vomir des arcs-en-ciel lorsque vous tirez la langue, etc.

Début février 2018, un utilisateur de la communauté Reddit met au point une interface “facile” à manipuler et assemblant plusieurs de ces morceaux de code pour répondre à une problématique très spécifique : et si l’on remplaçait les visages d’acteurs/actrices de certaines vidéos, par des visages d’autres personnes, tout en gardant l’éclairage de la scène, la position et l’expression de l’acteur/actrice d’origine ?

Cet outil se base sur une “intelligence artificielle” qui va comparer un très grand nombre de photos de portrait de… Amy Adams, disons, à tout un tas de clichés de Nicolas Cage. À travers un processus qui permet au programme de tester, comparer, tester, améliorer, recommencer, tester encore, etc. (processus nommé “Deep Learning”), et sollicitant toute la puissance de votre carte graphique, le logiciel va progressivement apprendre à convertir Amy Adams en Nicolas Cage. En préservant les expressions, les mouvements des yeux, de bouche, et (dans une certaine mesure), le passage d’objets (cheveux, mains, etc.) devant ce visage.

On pourrait transposer ça à la saisie prédictive de vos téléphones. Lorsque vous écrivez “bonne” et que votre smartphone vous propose directement “soirée” ou “journée”, mais jamais “autruche”. Et bien là, c’est la même chose, mais avec des formes et des couleurs basées sur la prédiction de transformation d’un visage A vers un visage B et de l’effet des ombres et des lumières sur ses reliefs.

Et vous savez quoi ? Ça fonctionne drôlement bien ! Allez voir la chaîne YouTube de “derpfake” pour vous en convaincre : https://www.youtube.com/watch?v=ChVgT980Jck

FakeApp, deepfakes

C’en est fini du temps où pour remplacer une tête par une autre, sur une photo, il fallait les bons outils, les bonnes connaissances et être méticuleux. C’en est également fini du temps où pour intervertir deux visages dans une vidéo, il fallait s’appeler Industrial Light & Magic — ou MPC pour l’exemple ci-dessous —, solliciter des centaines d’heures de travail à des dizaines d’artistes accomplis, tout ça pour des sommes faramineuses.

Autant j’ai trouvé Tarkin particulièrement laid dans Rogue One, autant Rachel est bluffante dans Blade Runner 2049.

Désormais, cette petite application téléchargeable gratuitement sur Reddit permet donc à tout un chacun de transformer son ordinateur en savant fou autonome. Pas besoin de connaissances, pas besoin de rester devant l’écran. Tout au plus un travail préparatoire de récolte d’images est nécessaire, puis l’intelligence artificielle fait le boulot. C’est long, c’est très long. La carte graphique est sollicitée pendant plusieurs heures. Mais pour ceux d’entre nous qui ne sommes pas en train de miner du Bitcoin ou qui ne tentons pas inlassablement d’effectuer un top 1 dans PUBG, ça n’est pas bien grave ! On peut laisser notre PC calculer des visages.

Et c’est là qu’on arrive dans les dérives glauques et effrayantes de cette technologie…

Je ne vais pas mettre de lien vers des exemples — oh, zut alors ! —, mais donnez une technologie de ce type aux gens et vous êtes sûrs de voir surgir des tonnes de sex-tapes truquées de Cara Delevingne, Natalie Dormer, Emma Watson, Gal Gadot, etc. La plupart de ces vidéos sont de qualité moyenne, voire catastrophique — l’auteur n’a pas eu la patience d’attendre 20 heures de calcul, ou bien les photos qu’il a fournies à l’IA n’étaient pas assez nettes —, mais parfois il y a des réalisations qui sortent du lot et sont parfaitement crédibles. Et ça, c’est potentiellement dangereux/grave.

J’ose espérer que les célébrités sauront se défendre et éviteront la plupart du temps, les scandales. Mais que ferons-nous, pauvres personnes lambdas, lorsque nos ex auront récupéré tous nos selfies depuis notre page Facebook ou Instagram, qu’ils auront collé notre visage sur un porno amateur dont le web regorge et qu’ils partageront le lien à nos amis ou à notre famille ? Comment pourrons-nous faire face ?

Au final, c’est bien ou pas, ce gadget ?

Je ne vous cache pas que je suis un fervent passionné de technologie. Je suis d’ailleurs en train de m’essayer à mon premier trucage vidéo : rien de sordide, juste un montage de Nicolas Cage — parce que c’est un peu la mascotte de cette technologie parmi les gentils blagueurs sur Internet — à la place de Scarlett Johansson dans un extrait d’Avengers. Et c’est tellement incroyable de voir progressivement se dessiner le visage de l’un et de l’autre au fur et à mesure que le programme teste et ajuste ses prédictions. J’ai vraiment l’impression de vivre dans un film de science-fiction. Je suis donc totalement excité et emballé par ce qui découlera de cette technologie et qui nous servira au quotidien.

Quant aux dérives dangereuses pour nous et nos proches, comme évoqué plus haut, nous avions les mêmes craintes avec l’arrivée de Photoshop et la démocratisation des montages photo. Au final, tout se passe plutôt bien et la seule conséquence qu’il y a eu, c’est de nous avoir rendu un peu plus sceptiques lorsque l’on nous montre un homme politique chevaucher un gigantesque pygargue à tête blanche.

Donc j’espère que dans les mois et années à venir, nous appliquerons la même attitude, que nous deviendrons moins crédules, plus critiques et que nous nous efforcerons de tourner sept fois notre cerveau dans notre crâne avant d’accepter une “preuve”, un “fait”. Même s’il s’agit d’une vidéo.

Et en bonus — mais là, je n’y crois pas trop et c’est un autre sujet —, ça serait bien que ça nous incite aussi à réfléchir aux conséquences potentielles lorsque l’on poste des centaines de selfies de nous sur tous les réseaux sociaux en accès libre à la Terre entière.

Étiqueté , , ,

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.