Les services Compilatio Magister et Magister+ permettent de réaliser une analyse textuelle des documents déposés.
Selon la version utilisée, certaines fonctionnalités diffèrent :
👉 Logiciel anti-plagiat pour enseignants & universités | Compilatio
Dans cet article, nous nous intéressons à deux types de détection :
- la détection des similitudes exactes et des reformulations légères, souvent associées au similitudes syntaxique,
- la détection des reformulations profondes, également appelée similitudes sémantique.
L’objectif est de clarifier le fonctionnement de ces deux approches et d’en faciliter la lecture dans le rapport d’analyse.
1. Similitudes syntaxiques et similitudes sémantiques, quelles différences ?
La détection des similitudes sémantiques est une fonctionnalité disponible dans Compilatio Magister+. Elle complète la détection des similitudes syntaxiques, déjà proposée dans Compilatio Magister.
L’objectif n’est pas de remplacer l’analyse existante. Il s’agit d’identifier des reformulations profondes : des passages similaires en termes de contenu, malgré une formulation différente.
Compilatio s’appuie sur des choix techniques précis. Des seuils encadrent la détection afin de limiter les interprétations excessives. Cette fonctionnalité ne vise donc pas à tout signaler, ni à produire un jugement automatique.
Les similitudes syntaxiques
(Ce que Compilatio détecte depuis toujours, aujourd’hui inclus dans Compilatio Magister et Compilatio Magister+.)
Les similitudes syntaxiques concernent le copié-collé et les reformulations légères. Elles correspondent aux situations les plus courantes.
Lorsque Compilatio Magister ou Magister+ identifie des chaînes de mots identiques ou très proches entre deux documents, il signale une similitude. La détection repose donc directement sur les mots et leur organisation dans le texte.
Ce type de détection :
- reste toujours actif,
- ne nécessite aucun paramétrage,
- fonctionne pour l’ensemble des langues analysées.
Il permet d’identifier rapidement des reprises directes, même lorsque quelques mots ont été modifiés.
Exemples courants :
- un passage repris mot pour mot depuis une source,
- un texte très proche de l’original, avec quelques synonymes ou ajustements mineurs.
Cette détection constitue la base de l’analyse. Elle reste indispensable, même lorsque la détection des similitudes sémantiques est activée.
Les similitudes sémantiques
(la reformulation profonde)
Ici, ce ne sont plus les mots qui comptent en priorité, mais le sens du texte. Un passage peut être considéré comme similaire d’un point de vue sémantique même si :
- les mots employés sont différents,
- la structure des phrases a été modifiée,
- aucune chaîne de mots identiques n'est visible à première lecture.
Cette détection ne remplace pas l’analyse syntaxique. Elle la complète afin de signaler des situations que la comparaison mot à mot ne permet pas toujours d’identifier.
2. Comment fonctionne la détection des similitudes sémantiques ?
La question revient souvent : comment comparer des textes qui n’utilisent pas les mêmes mots ?
Le principe est assez simple, du moins dans son idée générale. Chaque passage est analysé de manière à représenter son contenu, indépendamment de sa formulation.
La comparaison porte ensuite sur la proximité de sens entre deux passages. Lorsque deux contenus expriment la même idée, la détection les rapproche. À l’inverse, des contenus différents apparaissent plus éloignés.
Cette approche repose sur une comparaison automatisée. Elle ne correspond ni à une lecture humaine, ni à une interprétation pédagogique.
3. Comment paramétrer la détection des similitudes sémantiques ?
La détection des similitudes sémantiques se paramètre au niveau du compte administrateur. L’administrateur peut activer, autoriser ou désactiver cette fonctionnalité pour les utilisateurs du compte.
- Lorsqu’elle est activée, la détection est prise en compte automatiquement.
- Lorsqu'elle est autorisée, les utilisateurs peuvent choisir de l’utiliser ou non lors des analyses.
- Lorsqu’elle est désactivée, elle n’est pas disponible et l’interface en précise la raison.
Ce paramétrage permet de cadrer l’usage de la détection et d’éviter toute ambiguïté lors du lancement d’une analyse.
Du côté utilisateur, vous pouvez vérifier les types de détection configurés et les ajuster si besoin.
4. Comment lire et interpréter les résultats dans le rapport d’analyse
Le rapport d’analyse présente plusieurs éléments distincts. Il vise à mettre en évidence des proximités, et non à produire une conclusion automatique.
Le score global
Il correspond à l’ensemble des similitudes détectées dans le document et prend en compte :
- les similitudes syntaxiques,
- les similitudes sémantiques, lorsque la fonctionnalité est activée.
Ces deux types de similitudes apparaissent séparément afin de faciliter la lecture.
Les sources et les points d’intérêt
Dans la liste des sources, certaines peuvent être associées à des similitudes sémantiques. Des indicateurs visuels permettent de les identifier.
Les points d’intérêt signalent les passages concernés dans le document. Ils servent de repères pour orienter la lecture, sans constituer un jugement en soi.
La vue face-à-face
La vue face-à-face permet de comparer le document analysé avec une source.
- les passages en gras correspondent à des similitudes exactes,
- les passages non en gras indiquent des reformulations sémantiques.
Les deux peuvent apparaître dans un même extrait. Ce fonctionnement est normal et reflète la manière dont le contenu a été reformulé.
5. Reformulation et traduction : deux cas différents
La détection des similitudes sémantiques peut rappeler la détection de traduction. Il s’agit pourtant de deux situations différentes.
La reformulation concerne un texte réécrit dans la même langue, avec une formulation différente mais un contenu équivalent.La traduction correspond, quant à elle, au passage d’un texte d’une langue à une autre, tout en conservant un contenu similaire.
Dans les rapports Compilatio Magister+, ces deux types de similitudes apparaissent séparément afin de faciliter la lecture et d’éviter toute confusion.
6. Pourquoi certaines similitudes ne sont pas mesurées ?
Afin de garantir des résultats fiables et exploitables, la détection des similitudes sémantiques repose sur des seuils précis.Compilatio signale les rapprochements qui présentent un intérêt pédagogique ou analytique, et non l’ensemble des similitudes possibles.
Ce choix vise à préserver la qualité de lecture du rapport et à limiter les interprétations excessives. Dans ce cadre, certaines similitudes peuvent ne pas être prises en compte par la détection sémantique Cela ne correspond pas à une erreur, mais au fonctionnement normal du système.
La détection sémantique intervient après une première analyse et s’applique uniquement aux sources principales. Un minimum de mots communs est nécessaire pour déclencher l’analyse. En dessous de ce seuil, la source n’est pas prise en compte.
Concrètement, une reformulation très poussée, sans vocabulaire partagé, ou présente uniquement dans des sources secondaires, peut ne pas apparaître dans les résultats.
Ce choix méthodologique vise à garantir un équilibre entre précision, lisibilité et pertinence des analyses proposées.
7. À retenir
- Les similitudes syntaxiques reposent sur les mots,
- les similitudes sémantiques portent sur le sens,
- la détection sémantique complète l’analyse existante, sans la remplacer,
- les résultats signalent des zones à analyser, pas des conclusions,
- le rapport s’interprète toujours dans son contexte.
📌 Des questions sur Magister, Magister+, le plagiat ou l'IA ?
Obtenez des réponses en direct lors de notre Webinar "Questions & Réponses".
👉 Inscrivez-vous à la prochaine session