Technologie | Le 21 octobre 2021, par Sambuc éditeur. Temps de lecture : sept minutes.

« Humanités numériques »

OpenAI dévoile un logiciel de résumé automatique de livres

Intelligence artificielle appliquée au langage

L’entreprise américaine OpenAI a présenté récemment un modèle d’intelligence artificielle capable de produire, de façon automatique, des résumés de très bonne qualité de romans et de livres. La solution développée s’inscrit dans une démarche générale de la recherche en intelligence artificielle, notamment autour du langage, et qui vise à faciliter l’interaction du logiciel avec un juge humain pour progresser, et s’ajuster aux attentes humaines.

(Image de l'article n°84 : ) — © Sambuc éditeur, 2024

La supervision par un être humain est au cœur du développement de l’intelligence artificielle, en particulier pour les tâches qui se rapportent au langage ou aux différentes activités intellectuelles humaines, et qui forment le champ dit de l’intelligence artificielle forte – en anglais artificial general intelligence (AGI). Il s’agit de faire évaluer le modèle de façon interactive par un humain, selon un procédé nommé « apprentissage par renforcement ». Pour de nombreux problèmes, toutefois, cette supervision se révèle très coûteuse et difficile à mettre en place, notamment lorsque les résultats à évaluer par l’homme sont longs ou complexes.

C’est notamment le cas des résumés automatiques de livres, dont l’évaluation suppose la lecture de l’œuvre résumée pour la comparer aux quelques lignes de la synthèse produite. Dans le cas d’un livre d’un millier de pages, cela demande donc plusieurs dizaines d’heures de lecture avant de pouvoir évaluer la qualité du résumé produit par le modèle.

Une approche cartésienne : diviser pour mieux juger

L’entreprise OpenAI, cofondée par Elon Musk et Sam Altman en 2015, vient de publier un compte-rendu de ses recherches sur le sujet, et qui présente une solution originale pour aborder le résumé de textes longs, comme les romans ou les essais. OpenAI est connue pour ses recherches en intelligence artificielle forte, notamment dans le domaine du langage avec des modèles comme GPT-3, capable de rédiger de façon automatique des textes cohérents sur un sujet quelconque. La technologie de ce logiciel utilise les réseaux de neurones en apprentissage dit « profond » (deep learning), et a été entraînée à la rédaction en langue naturelle à partir de milliards de contenus textuels, utilisés comme exemples.

L’enjeu de l’approche du langage par la machine est, entre autres, de parvenir à ce que le modèle conçu dispose d’une grande quantité de connaissance sur le monde, ainsi qu’une capacité d’abstraction. Dans le cas d’un moteur de résumé d’ouvrages, le programme doit reconnaître les éléments essentiels d’un texte tel qu’il est perçu par un être humain, ce qui place la capacité à l’abstraction dans le cadre de l’intention humaine. Pour cette raison, et comme le constate OpenAI, les modèles classiques (qui utilisent des données d’exemples pour entraîner le moteur d’intelligence artificielle) ne sont pas performants pour cette tâche, et la supervision humaine par renforcement est nécessaire.

Comme l’objectif d’OpenAI est de développer des modèles d’intelligence artificielle à grande échelle, le temps demandé à un être humain pour valider le modèle de résumés était un réel obstacle. La solution trouvée a été de décomposer la tâche complexe (résumer un livre entier) en sous-tâches plus simples appliquées aux différents chapitres de l’ouvrage. Cette approche cartésienne (diviser les difficultés en « parcelles ») est ensuite itérée, afin de résumer l’ensemble des textes produits pour chaque chapitre, afin de produire le résumé du livre dans sa totalité. En plus de permettre l’évaluation du modèle par l’homme sur des textes relativement courts, ce procédé récursif rend possible de retracer le processus d’élaboration du résumé, à travers des sélections successives d’aspects essentiels du livre.

Les auteurs dévoilent, dans l’article de blog qui présente cette approche, un exemple des étapes de résumés successifs, par chapitre, puis de l’ensemble du livre, pour le roman Alice au pays des merveilles de Lewis Caroll.

Le problème d’alignement

« Au fur et à mesure que nous formons nos modèles à des tâches de plus en plus complexes, il devient de plus en plus difficile pour les humains de faire des évaluations éclairées des résultats des modèles. »

(Blog OpenAI, « Summarizing Books with Human Feedback ».)

Faire en sorte qu’un logiciel d’intelligence artificielle réponde à une tâche en fonction d’attentes humaines est connu sous le nom de problème d’alignement. Or, à mesure les tâches deviennent de plus en plus complexes, l’évaluation par renforcement devient plus délicate à opérer.

La solution proposée par OpenAI s’inscrit donc dans un problème plus général : celle du déploiement à grande échelle de modèles complexes, intégrant par exemple plusieurs tâches ayant trait au langage. L’approche de l’entreprise consiste à chercher à simplifier les évaluations demandées, soit en décomposant des tâches complexes, soit en en faisant traiter une partie par la machine.

Ces travaux sur les résumés de textes constituent, au dire des auteurs, le premier résultat empirique visant à déployer l’apprentissage par renforcement sur des tâches complexes et de grande ampleur. Parmi les applications esquissées dans l’article, est évoqué un logiciel donnant des réponses à des questions, portant par exemple sur des œuvres littéraires.

Sambuc éditeur

Notes et références

Jeff Wu, Long Ouyang et al., « Recursively Summarizing Books with Human Feedback », Cornell university, sept. 2021 (arxiv.org/abs/2109.10862).

Voir aussi

L’intelligence artificielle dans l’encyclopédie Sambuc.

Apprentissage par renforcement.

Le problème d’alignement.

Entités nommées fréquentes : OpenAI.

Sambuc éditeur

« Humanités numériques »

OpenAI dévoile un logiciel de résumé automatique de livres

Une approche cartésienne : diviser pour mieux juger

Le problème d’alignement

Notes et références

Voir aussi

L’actualité : derniers articles

Sciences humaines

Langues isolantes, agglutinantes et flexionnelles

Actualités culturelles

Québec et édition francophone : le festival Livre Paris 2024 s’est ouvert pour trois jours

Actualités culturelles

Manuscrits, incunables : deux collections d’ouvrages de la Renaissance mises en vente à Lyon

Sambuc éditeur

« Humanités numériques »

OpenAI dévoile un logiciel de résumé automatique de livres

Une approche cartésienne : diviser pour mieux juger

Le problème d’alignement

Notes et références

Voir aussi

L’actualité : derniers articles

Sciences humaines

Langues isolantes, agglutinantes et flexionnelles

Actualités culturelles

Québec et édition francophone : le festival Livre Paris 2024 s’est ouvert pour trois jours

Actualités culturelles

Manuscrits, incunables : deux collections d’ouvrages de la Renaissance mises en vente à Lyon

« Humanités numériques »

Une approche cartésienne : diviser pour mieux juger

Québec et édition francophone : le festival Livre Paris 2024 s’est ouvert pour trois jours

Manuscrits, incunables : deux collections d’ouvrages de la Renaissance mises en vente à Lyon