Pour analyser un texte, les détecteurs IA s’appuient sur plusieurs leviers complémentaires. Voici les plus courants :
Perplexité
La perplexité mesure la prévisibilité des mots dans une phrase. Les textes générés par une IA ont tendance à être plus linéaires, ce qui réduit leur perplexité. Un score bas peut indiquer un contenu trop « prévisible » pour être entièrement humain.
Éclatement lexical
Cet indicateur évalue la diversité du vocabulaire. Un texte généré automatiquement peut présenter des répétitions fréquentes, un éventail lexical limité ou des structures syntaxiques récurrentes. Cela peut trahir l’utilisation d’un générateur de texte.
Croisement des sources
Certains détecteurs comparent les structures du texte avec des corpus de contenus humains et générés. Ils repèrent des schémas d’écriture typiques de l’IA, comme un enchaînement trop fluide de paragraphes ou l’absence d’erreurs naturelles.
Croisement des analyses
Les résultats sont rarement issus d’un seul critère. La plupart des détecteurs combinent les signaux faibles (vocabulaire, syntaxe, structure, rythme…) pour obtenir une évaluation globale. Cette approche permet d’éviter les conclusions hâtives basées sur un seul indice.