Le mythe de la simplicité de l’IA : Le travail humain dans les bibliothèques assistées par l’IA

Par Stefania Kuczynski et Jacqueline Whyte Appleby

L’Ontario Council of University Libraries (OCUL) est un consortium de bibliothèques universitaires composé de membres. En 2024, l’OCUL a lancé le programme OCUL Artificial Intelligence and Machine Learning (AIML), qui vise à promouvoir une utilisation responsable et éthique de l’AIML dans l’environnement des bibliothèques universitaires tout en renforçant les connaissances et les compétences connexes parmi les membres de l’OCUL et au-delà. Le programme comprend cinq projets distincts. Un des projets, qui vise à améliorer l’accès aux collections de documents gouvernementaux grâce à des métadonnées générées par l’IA, fait partie du Consortium sur l’IA du COQES. Visitez le site web de l’OCUL pour plus d’informations sur le programme et les projets AIML de l’OCUL.


On parle souvent de l’IA comme d’un outil qui faciliterait nos vies et rendrait notre travail plus productif. Cela peut être vrai, mais faire fonctionner ces outils d’IA de manière à ce qu’ils soient toujours utiles nécessite un travail humain important!

Trouver comment demander des résultats utiles aux modèles d’IA est, comme le savent tous ceux qui ont travaillé sur des messages-guides pour de grands modèles de langage (GML), un énorme travail. L’ingénierie rapide est le processus de création et de mise au point des instructions pour les GML. Pour obtenir des résultats de haute qualité, il faut une bonne dose d’ingénierie, y compris la rédaction, l’ajustement et la réécriture d’ensembles d’instructions. Nous avons constaté que beaucoup de ces GML nécessitent des orientations très, très spécifiques, parce qu’ils ont chacun leurs propres défis et leurs propres particularités. Certains lisent les instructions, aussi précises soient-elles, comme de simples suggestions. Certains suivent ces instructions pendant les cinq premières pages, puis « oublient ». Certains ne peuvent s’empêcher d’ajouter un contexte et des notes supplémentaires. En fin de compte, les outils d’IA ne sont bons que dans la mesure où nous leur donnons des instructions.

Faire fonctionner les outils d’IA de manière à ce qu’ils soient toujours utiles nécessite un travail humain important.

Dans le cadre du Consortium sur l’IA du COQES, notre équipe de projet (composée de bibliothécaires, de développeur·ses, de spécialistes du soutien aux systèmes et d’étudiant·es en alternance) explore l’application de l’IA générative et des technologies de reconnaissance optique de caractères (ROC) pour améliorer la qualité des métadonnées et la découvrabilité des collections numériques des bibliothèques. Ce projet améliorera la visibilité de 50 000 documents gouvernementaux numérisés par les bibliothèques de l’Université de Toronto, qui sont librement accessibles sur Internet Archive.

La première phase de notre projet a consisté à tester plusieurs outils de ROC afin de déterminer celui qui convenait le mieux à notre projet (vous pouvez lire ici). Nous avons commencé à travailler sur la phase suivante : l’extraction des métadonnées. L’identification de détails tels que le nom des auteurs, l’année de publication et le type de document est essentielle pour découvrir, organiser et exploiter efficacement les informations précieuses contenues dans ces ressources. Nous commencerons par un petit nombre de documents et une série d’invites, puis nous testerons, affinerons et enregistrerons les résultats au fur et à mesure, en améliorant les invites de manière itérative. La modification des messages-guides sera basée sur nos propres conclusions, ainsi que sur les réactions de la communauté de l’information gouvernementale et les changements dans le paysage de l’IA, qui évolue rapidement.

L’identification de détails tels que le nom des auteurs, l’année de publication et le type de document est essentielle pour découvrir, organiser et exploiter efficacement les informations précieuses contenues dans ces ressources.

Nous fournissons des instructions de haut niveau aux GML, notamment Llama4, Qwen et Gemma3. Voici un exemple du langage spécifique que nous utilisons dans les invites principales pour obtenir des résultats bien structurés de la part de Gemma3 :

Vous êtes un assistant conçu pour suivre attentivement les instructions. Votre rôle principal est de traiter les documents gouvernementaux numérisés. Vous devez être minutieux et méthodique. Vous ne pouvez répondre qu’avec des données JSON, ne donnez pas de contexte supplémentaire ou de commentaires avant ou après la question.

Notez que JSON (JavaScript Object Notation) est un format de texte standard largement utilisé pour structurer et partager des données.

À partir de là, nous passons à des invites ciblant des champs de métadonnées spécifiques. La paternité d’une œuvre, par exemple, englobe les auteur·rices individuel·les, les éditeur·rices et les personnes morales qui peuvent être auteurs (ce qui est souvent le cas des documents gouvernementaux). Nos instructions doivent être détaillées :

Veuillez extraire les informations suivantes du texte du document : (1) auteur·rices – une liste de noms ou d’entités responsables du document, qui peut inclure des individus, des comités, des ministères, des agences ou des groupes liés à un ministère, y compris toute personne ayant signé une lettre d’introduction. S’il n’y a pas d’auteur·rice clair·e, utilisez le niveau de gouvernement responsable comme auteur (par exemple, « gouvernement du Canada »); et (2) éditeur·rices – une liste de noms de personnes ou d’entités créditées d’avoir édité le document. Chaque liste ne doit contenir que des chaînes de caractères représentant les noms respectifs. Renvoie le résultat au format JSON avec uniquement les champs « auteurs » et « éditeurs ». Ne pas inclure d’explication, de note, de raisonnement ou de texte supplémentaire. Ne renvoie que l’objet JSON.

Voici un exemple de document que nous avons utilisé pour nos tests, publié par le ministère des Affaires municipales de l’Ontario en 1986 :

Lorsque nous avons examiné les résultats obtenus par les GML à partir des questions sur la paternité, nous avons obtenu des réponses différentes : seule Gemma3 a compris que le ministère des Affaires municipales était l’auteur de ce document; Llama4 et Qwen n’ont pas été en mesure d’identifier un auteur. Au fur et à mesure que nous progression dans ce test, nous devrons décider quels GML valent la peine d’être améliorés et lesquels ne sont tout simplement pas adaptés aux questions pour lesquelles nous avons besoin de réponses.

En ces premiers jours de tests d’ingénierie rapide, nous comparons également nos résultats avec des enregistrements de catalogues produits par l’humain. Bien que de nombreux documents ne contiennent pas de métadonnées, certains ont des notices MARC (catalogage ordinolingue) complètes (un ancien format normalisé utilisé par les bibliothèques pour stocker et partager des métadonnées) et c’est un moyen utile de voir où nos notices ne sont pas suffisantes. À l’avenir, nous serons peut-être en mesure d’identifier les lacunes des documents plus anciens, et il sera passionnant de voir où les résultats de notre GML peuvent éventuellement enrichir ou améliorer les documents existants.

Les documents gouvernementaux sont pleins de bizarreries, et leur histoire et leur contexte sont essentiels pour comprendre ce qui constitue un résultat approprié et utile. Nous avons la chance d’être soutenus par les experts en information du gouvernement de l’Ontario qui comprennent comment le monde de l’information gouvernementale est structuré et utilisé. Lorsque les expert·es estiment qu’une invite ne fonctionne pas comme elle le devrait, de nouvelles questions ou de nouveaux paramètres peuvent être introduits dans nos invites.

On nous présente souvent des scénarios dans lesquels l’IA produit instantanément des résultats étonnants avec peu d’aide humaine, mais ce n’est pas le cas. Notre projet est à forte intensité de main-d’œuvre et l’objectif n’est pas de reproduire le travail effectué par les humains, mais de voir où nous pouvons utiliser des outils d’intelligence artificielle pour améliorer la découvrabilité d’un contenu qui n’a pas été décrit depuis longtemps. Les outils existent et sont très prometteurs, mais ils nécessitent des investissements en temps et en expertise pour être correctement configurés et utilisés.

Notre objectif n’est pas de reproduire le travail effectué par les humains, mais de voir où nous pouvons utiliser des outils d’intelligence artificielle pour améliorer la découverte de contenu

À propos de l’OCUL et du Scholars Portal

Scholars Portal, le service numérique du Conseil des bibliothèques universitaires de l’Ontario (OCUL), fournit des services partagés et une infrastructure technique à l’appui de l’enseignement, de la recherche et de l’apprentissage dans les universités de l’Ontario. Ensemble, le Scholars Portal et l’OCUL répondent aux besoins des établissements d’enseignement postsecondaire en leur offrant des services d’information innovants et en garantissant l’accès à la recherche et au contenu ainsi que leur préservation.

Pour en savoir plus sur l’OCUL et le programme AIML de l’OCUL

Laisser un commentaire

Votre adresse courriel ne sera pas publiée. Les champs obligatoires sont indiqués avec *