Actuellement, les technologies de génération de contenus par IA pullulent. Au point où il devient de plus en plus difficile de distinguer les créations humaines de ce qu’une IA produit. Les grands modèles de langage (LLM) modernes ont rendu les tests comme celui de Turing presque obsolètes. Pour résoudre ce problème, Google DeepMind a développé un nouvel outil de tatouage numérique appelé SynthID. Ce dernier est capable d’identifier du contenu généré par IA.
SynthID : Une solution invisible pour repérer le contenu IA
SynthID applique sur une technique unique. Il tatoue de manière invisible le texte généré par IA pour le différencier de celui écrit par des humains. Contrairement à d’autres outils qui marquent les images, vidéos ou sons avec des filigranes, SynthID se concentre sur les textes créés par des modèles comme Gemini, l’un des LLM de Google. Ce tatouage est imperceptible à l’œil humain. Toutefois, il reste identifiable par des algorithmes spécialisés.
Le fonctionnement de SynthID est basé sur une légère modification des mots prévus par l’algorithme de génération de texte. En ajustant légèrement le choix de mots sans altérer le sens ou la fluidité du texte, l’outil permet d’injecter une signature unique dans le contenu. Grâce à cela, il devient possible de retracer l’origine du texte et de confirmer s’il a été produit par un modèle comme Gemini.
Des tests concluants pour garantir la fiabilité
Pour s’assurer que SynthID fonctionne sans compromettre la qualité des textes générés, DeepMind a testé l’outil sur environ 20 millions de passages de texte. Certains d’entre eux contenaient des filigranes invisibles. Tandis que d’autres étaient laissés intacts. Les utilisateurs n’ont pas fait de distinction notable entre les textes marqués et ceux sans signature. La précision et la fluidité des passages restaient quasiment indiscernables. Ce qui prouve ainsi que SynthID n’altère pas la qualité du texte.
En outre, l’outil n’a pas ralenti la vitesse de génération du modèle, ce qui est un point crucial pour assurer une bonne expérience utilisateur.
Un outil open source pour une adoption massive
Google DeepMind a fait un choix stratégique en rendant SynthID open source. Cela permet à d’autres développeurs et entreprises travaillant sur des modèles de génération de contenu de l’adopter facilement. L’objectif est de standardiser l’usage de ces techniques de tatouage pour aider l’industrie à mieux identifier les contenus générés par IA. Par conséquent, pour lutter contre la désinformation.
Cependant, ce type de technologie pose aussi des défis. Certains développeurs malveillants pourraient tenter de contourner SynthID en cherchant à masquer ces signatures. Cependant, avec les vastes ressources dont dispose Google, la société espère renforcer la sécurité et l’intégrité de l’identification des contenus IA.