Qu'est-ce que l'empoisonnement des données dans la recherche par IA ?

L'empoisonnement des données consiste à déposer une petite quantité de texte sur le web ouvert pour modifier ce qu'un système d'IA rapporte sur un sujet. Des chercheurs de Cornell Tech, dans un article de 2026, ont constaté qu'un court passage empoisonné de l'ordre de 13 mots, placé dans du contenu ordinaire généré par les utilisateurs comme un commentaire de forum, peut orienter ce que dit un agent d'IA de recherche approfondie. Pas 13 pages. Pas une campagne. Environ 13 mots. Le résultat a été démontré de bout en bout contre des agents de recherche open source et observé via le comportement de citation sur les agents commerciaux fermés, ce qui constitue un signal plus étroit mais réel.

Pourquoi cela compte-t-il plus qu'il n'y paraît ?

Parce que la recherche par IA condense toute votre réputation en une seule phrase assurée et masque les sources qui la sous-tendent. Pendant la plus grande partie de l'ère d'internet, votre réputation était une page de résultats que vous pouviez voir et juger vous-même. Désormais, un modèle lit le web, pondère ce qu'il trouve et le répète d'une voix calme et digne de confiance qui ne laisse rien deviner de la minceur des preuves sous-jacentes. Lorsque ce résumé a été empoisonné, le lecteur n'a aucun moyen de le savoir ni le moindre réflexe d'en douter. Servola conseille en matière de risque et de gouvernance de l'IA, et c'est la faille que nous voyons échapper à la plupart des dirigeants.

Un résultat Google propre me protège-t-il ?

Non. Vous pouvez avoir en même temps une page de résultats de recherche irréprochable et une réponse d'IA empoisonnée, car ce sont désormais deux surfaces différentes et presque personne ne surveille la seconde. Le travail classique de réputation, surveiller la presse et faire descendre le mauvais lien dans la page, suppose qu'un humain est en train de lire. Il ne fait rien contre un assistant d'IA qui a discrètement absorbé une affirmation fausse et la répète maintenant à tous ceux qui demandent, avec une totale assurance et sans note de bas de page visible.

Que devrait réellement faire une entreprise ?

Trois mouvements. D'abord, savoir ce que disent les machines : interrogez régulièrement les grands assistants à votre sujet, sur votre entreprise et vos personnes clés, et traitez leurs réponses comme des déclarations publiques vivantes dont vous êtes responsable. Ensuite, possédez vos propres faits, car un corpus profond, cohérent et bien structuré d'informations exactes de première main est la défense la plus solide ; les modèles s'appuient sur ce qui est clair et corroboré et exploitent ce qui est vague. Enfin, traitez votre réputation auprès de l'IA comme une surface d'attaque. Vous ne laisseriez pas un bâtiment ouvert simplement parce que personne n'a encore essayé la porte, et 13 mots sont un seuil très bas pour quiconque veut s'y essayer.