Wikipédia ouvre un accès structuré à ses données pour entraîner des modèles d’IA

Wikipédia se positionne au cœur d’une révolution numérique en offrant un accès structuré à ses données pour l’entraînement des modèles d’intelligence artificielle (IA). Cette démarche s’inscrit dans la pensée de la gestion responsable des ressources informationnelles, à la manière des théories sociales de la propriété intellectuelle débattues par des penseurs comme Lawrence Lessig. En mettant en ligne un dataset structuré sur Kaggle, Wikimedia Enterprise répond aux défis techniques posés par le **scraping intensif**, qui surcharge ses infrastructures. Cette initiative rejoint l’idée d’**open data** chère à des penseurs comme Yochai Benkler, qui prône l’accès libre aux connaissances pour favoriser l’innovation collaborative. En proposant des données fiables et prêtes à l’emploi, Wikimedia promeut une exploitation fluide et respectueuse de ses contenus, alignant ainsi ses actions sur les principes de l’économie de la connaissance.

Suivez nous sur les réseaux

Nos derniers articles

Archives
QR code ECW