Wikipédia + IA : L’encyclopédie se dote d’une intelligence artificielle

par Yohann Poiron le 02/05/2025

La Fondation Wikimedia, l’organisation à but non lucratif qui gère Wikipédia, vient d’annoncer une intégration progressive de l’intelligence artificielle générative dans le processus éditorial de la célèbre encyclopédie en ligne. Loin de vouloir remplacer ses contributeurs humains, l’objectif est d’alléger leur charge de travail en automatisant certaines tâches répétitives et techniques.

Une IA au service des humains, pas l’inverse

Dans un communiqué publié mercredi, Chris Albon, directeur de l’apprentissage automatique chez Wikimedia, a précisé que cette nouvelle orientation ne vise ni à produire du contenu avec l’IA, ni à substituer les humains. L’approche est qualifiée de “centrée sur l’humain”, avec une priorité donnée à l’autonomie des éditeurs, à l’utilisation de modèles open source, à la transparence et à une gestion linguistique nuancée.

Concrètement, cette IA pourra être utilisée pour :

  • Effectuer des recherches de contexte
  • Traduire des articles
  • Faciliter l’intégration des nouveaux bénévoles
  • Réduire les tâches fastidieuses (reformulations, vérifications, etc.)

Des outils IA déjà en place, mais discrets jusqu’ici

Wikipédia n’en est pas à ses premiers pas avec l’IA. Le site utilise déjà depuis plusieurs années des algorithmes pour :

  • Détecter les actes de vandalisme
  • Traduire automatiquement certains contenus
  • Évaluer la lisibilité des articles

Mais jusqu’à présent, ces outils étaient en arrière-plan, au service de la plateforme elle-même, et non des éditeurs. Cette nouvelle annonce marque donc un tournant dans l’ouverture de l’IA à la communauté éditoriale.

Une réponse à un double défi : surcharge humaine et invasion des bots

Le besoin de soutien pour les bénévoles est devenu de plus en plus pressant. Alors que la quantité d’informations à modérer ne cesse d’augmenter, le nombre d’éditeurs actifs, lui, stagne. Face à ce déséquilibre, l’IA peut devenir un allié stratégique pour maintenir la qualité encyclopédique.

Par ailleurs, Wikipédia fait face à une explosion du trafic de robots IA, notamment ceux utilisés pour entraîner des modèles comme ChatGPT. Cette activité de scraping excessif a augmenté la consommation de bande passante de 50 % et met en péril l’infrastructure technique du site.

C’est dans ce contexte que la fondation a lancé un projet de jeu de données structuré ouvert, destiné spécifiquement à l’entraînement des IA, afin de décourager le scraping sauvage et préserver Wikipédia comme espace de navigation humaine.

Une évolution prudente, mais nécessaire

Avec cette initiative, Wikipédia fait un choix équilibré : embrasser les atouts de l’IA sans compromettre son essence collaborative et humaine. Dans un monde où les contenus générés par des machines deviennent omniprésents, la célèbre encyclopédie cherche à protéger sa singularité tout en outillant ses contributeurs pour rester pertinents et efficaces.