
Une startup romande basée à Martigny a donc décidé de se lancer à la chasse des étudiants qui ont recours à cette forme de tricherie, grâce à un logiciel actuellement en phase de test, qui permettrait de détecter cela.
L’algorithme de détection élaboré par la société OrphAnalytics s’inspire de la recherche sur le génome. Selon Claude-Alain Roten, concepteur du logiciel, « chaque individu a un style d’écriture homogène ». En découpant un texte en plusieurs séquences, il est donc fort probable de savoir si ce texte a été écrit par plusieurs personnes. Le programme découpe en effet le texte en plusieurs séquences de taille identique auxquelles il cherche à attribuer une identité. Effets de style, fréquences et longueurs des mots, constructions des phrases, toutes ces caractéristiques stylistiques sont analysées statistiquement. En comparant différents travaux attribués à un même étudiant, on peut également savoir s’il s’agit des mêmes empreintes de style, donc du même auteur.
Le logiciel fonctionnerait dans toutes les branches académiques, du français médiéval à la finance, et dans différentes langues testées. Le logiciel a été testé sur la célèbre série de romans suédois Millénium. La série a été écrite par deux auteurs différents, les trois premiers ouvrages de la série (Millénium 1, 2 et 3) ont été écrits par Stieg Larsson (SL), alors que le quatrième (Millénium 4) a été écrit par David Lagercrantz (DL). Ce dernier a également écrit deux autres livres (Alan Turing et Everest), qui traitent de thèmes totalement différents de la série Millénium. Les résultats de l’analyse statistique des styles d’écriture sont donnés dans le graphique suivant.
Il faut avant tout savoir que chaque point représente l’identité d’une séquence de texte. L’empreinte d’une même personne devrait donc former un même nuage de points. On voit que les ouvrages de Stieg Larsson se distinguent de ceux de David Lagercrantz par deux nuages de points distincts. Ce qui montre donc qu’il s’agit de deux auteurs distincts. Le plus intéressant, c’est que les empreintes des deux derniers livres de David Lagercrantz rejoignent celle de Millénium 4, bien que les thèmes traités par l’auteur soient différents. Ce qui pourrait permettre de dire que l’empreinte d’une personne n’est pas liée au thème traité.
Régulièrement soupçonnés de faire appel à des écrivains fantômes, François Bayrou (FB) et Nicolas Sarkozy (NS) ont été également soumis à ce logiciel à travers respectivement cinq et six ouvrages qui leur sont attribués. À l’issue des analyses, Bayrou peut se voir blanchir alors que le logiciel a permis de détecter trois empreintes stylistiques différentes (trois nuages de points distincts) chez Sarkozy. Claude-Alain Roten fait toutefois remarquer que le logiciel « ne donne pas une preuve irréfutable du ghostwriting », mais « il met en avant les textes suspects ».
Source : RTS
Et vous ?
