ACTUALITÉ SCIENTIFIQUE
ET INNOVATION DE L'ÉTS
TRIZ pour prédire le succès littéraire d’une oeuvre - Par : Substance,

TRIZ pour prédire le succès littéraire d’une oeuvre


triz

Image d’entête provenant de Ronnie Pitman, licence CC, source.

Et si nous pouvions prédire quel livre deviendra un best-seller? Les chercheurs Vikas Ganjigunte Asho, Song Fen et Yejin Choi du département d’ingénierie et des sciences appliquées de l’Université Stony Brook à New York, pensent y être parvenus en concevant un programme informatique qui utilise la stylométrie statistique. Bien sûr, l’éditeur fait déjà ce travail (du moins, il essaie), mais il n’est pas évident de prédire le succès d’un livre à partir de milliers de propositions. Qu’adviendrait-il du monde de l’édition si un algorithme numérique s’avérait plus efficace et plus précis qu’un éditeur? L’outil pourrait aussi servir aux écrivains qui, de cette façon, pourraient évaluer le potentiel de leur œuvre. La stylométrie est une technique aussi utilisée pour détecter les œuvres littéraires plagiées.

triz

Ce schéma résume la pertinence des différentes approches de détection de plagiat en fonction de ses différentes formes. Source [Img1].

Le programme se base sur l’analyse d’environ 800 romans provenant d’une banque de plus de 42 000 livres gratuits du projet Gutenberg. Les livres choisis ont été analysés en fonction de leurs succès littéraires : les prix qu’ils ont gagnés et les critiques littéraires dont ils ont fait l’objet.

L’ingénieur et scientifique russe Genrich Altshuller a élaboré à partir de 1946 un algorithme appelé TRIZ, acronyme qui signifie théorie de résolution des problèmes inventifs (Teorija Reshenija Izobretateliskih Zadatchen). Il a fait l’analyse de 40 000 brevets sélectionnés parmi 400 000 brevets provenant de partout dans le monde.  Altshuller a remarqué par l’analyse des brevets choisis qu’ils présentaient des principes communs d’innovation. Il a aussi constaté que les problèmes rencontrés durant la conception d’un nouveau produit présentaient des analogies avec d’autres et que des solutions analogues devaient pouvoir s’appliquer. Cette analyse lui a permis de concevoir la théorie TRIZ.

triz

Source [Img2]

triz

Organigramme de sélection basé sur la classe du problème. Source [Img2].

Les chercheurs qui ont conçu l’algorithme de stylométrie statistique ont fait l’analyse de 800 romans pour découvrir les principes communs associés à leur renommée, de la même manière que TRIZ a été conçu par Altshuller.

Quelques principes de leur analyse :

  • Le choix des prépositions, noms, pronoms, déterminants, adjectifs détermine quel livre aura du succès;
  • Les livres moins populaires sont caractérisés par l’utilisation d’un pourcentage plus élevé de verbes, adverbes et noms étrangers. Ils comptent également plus de mots d’actualité qui sont des clichés (amour), de lieux typiques, de termes forts (à bout de souffle) et négatifs (meurtri);
  • Les livres les moins réputés décrivent davantage des actions et des émotions. À l’inverse, les plus renommés ont un vocabulaire associé à la réflexion, à la pensée et aux souvenirs;
  • Plus un roman est dense et compliqué, plus il court la chance de se démarquer.

triz

Dr Choi et ses collègues de la faculté d’ingénierie et des sciences appliquées-Vikas Ashok, une assistante d’enseignement au Département d’informatique et Song Feng, une doctorante dans le même département. Source [Img3].

Pour de plus amples informations sur cet algorithme, nous vous invitons à consulter

l’article suivant disponible en format PDF :

Ashok, V.G., S. Feng and Y. Choi. Success with Style: Using Writing Style to Predict the Success of Novels.Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing, pages 1753–1764,Seattle, Washington, USA, 18-21 October 2013