NLTO
/ Magazine d'actualité politique, économique et internationale /




Littérature, jamais sans mon algorithme







22 Juillet 2014

Depuis quelques années, les livres sur les mathématiques, les mathématiciens célèbres, ou écrits par des mathématiciens, cartonnent. En revanche, que se passe t-il quand on met les maths au service de la littérature pour évaluer la qualité d’un livre ? La société française Short Edition planche en effet, sur un algorithme capable de déterminer la qualité d'un texte pour un choix optimum…


Littérature, jamais sans mon algorithme
Le mathématicien, Cédric Villani, une pointure dans son domaine, est l’auteur d’un best seller sur les mathématiques, Théorème vivant publié il y a deux ans chez Grasset. Au même moment, est sorti, La déesse des petites victoires de Yannick Grannec chez Anne Carrière, qui retraçait la vie du mathématicien Kurt Gödel. Ce roman a remporté un grand succès. Il semblerait que le sujet des mathématiques ou le portrait de mathématiciens célèbres soient des thèmes dans l’air du temps. Une fois vulgarisées, ces histoires se dévorent.
 
Mais que se passe t-il au juste, quand ce sont les mathématiques qui se se mêlent de juger la littérature et dictent les choix ? Short Edition, une maison d’édition française, travaille sur la question. Mieux, elle est en train de mettre au point un algorithme. Ce dernier serait en mesure de déterminer la qualité littéraire d’un texte. Cette formule à l'étude, mélange Data Mining, l’exploration de données, et Big Data, littéralement, « les grosses données ».

Pour se faire, l’éditeur se sert d’une base de données compilant les textes proposés par Short Edition. Ces derniers ont été évalués par une demi-douzaine de lecteurs. Avec ces premières informations, la machine se met au travail : elle les traite et établit des connections entre qualité et exigences.

On est en plein dans l’intelligence artificielle. D'ailleurs, Short Edition travaille en étroite collaboration avec trois structures spécialisées dans ce domaine, LIMSI, (Laboratoire d'informatique pour la mécanique et les sciences de l'ingénieur), LIRIS, (Laboratoire d'Informatique en Image et Systèmes d'information)
 et le LIG, (Laboratoire d'Informatique de Grenoble).
 
Bientôt, pas moins de 25 000 textes feront parti du programme, rapporte le site Actuallité. De quoi traiter une foultitude de références et d’en ressortir la substantifique moelle. La machine devra se baser sur plusieurs éléments pour mener à bien son évaluation. Entre autres : critères sémantiques, champ lexical, longueur des phrases et des paragraphes, style, nombre d'adverbes, d'adjectifs, de pronoms, de verbes, de noms, fautes d'orthographe, erreur de ponctuation, fluidité du texte…
 
Tout ça pour ça, peut-on se demander. Et aussi, pourquoi l’ordinateur jugerait à la place de l’homme, ou remplacerait la lecture humaine ? L’algorithme est-il suffisamment pointu pour définir la qualité d’un texte ? Est-ce qu’à long terme, la machine ne va pas pousser les auteurs à formater leurs écrits en fonction des critères validés par l’ordinateur ? Cela fait beaucoup de questions.

Pourtant, chez Short Edition, rapporte encore le site Actualitté, on tempère : « Il ne s'agit pas de remplacer notre Comité éditorial par une machine : plutôt que cette dernière serve de filtrage-assistant, dans une détection, moins de la qualité littéraire, que de l'absence de qualités. »  Autrement dit, la machine va faire ressortir les indicateurs qu'on lui demande de repérer, effectuer une pré-sélection. Les textes seront ensuite relus et vérifiés par un humain. Ah. Ouf.
 
 
 
 

Littérature, jamais sans mon algorithme