Wo wird die Analyse ausgeführt?
Die Analysen Ihrer Dokumente werden auf den Servern von Compilatio verarbeitet und nicht auf Ihrem Gerät. Wenn Sie eine Analyse anfordern, indem Sie auf den Button [Analysieren] klicken, wird Ihre Anfrage berücksichtigt. Sie wird in die Warteschlange gestellt, bis die für die Verarbeitung der Analyse notwendigen Ressourcen bei Compilatio verfügbar sind. Die Zeit in der Warteschleife kann von wenigen Sekunden bis zu mehreren Stunden dauern, abhängig von der Nachfrage auf unserer Plattform zu dem Zeitpunkt, an dem Sie die Analyse anfordern.
Sobald die Anfrage berücksichtigt wurde, können Sie sich aus Ihrem Compilatio Account ausloggen und sich später wieder einloggen, um den Analysebericht einzusehen.
Der extrahierte Text
Der Analyseprozess verarbeitet den aus dem Dokument extrahierten Text. Es handelt sich um den im Dokument enthaltenen „kopierbaren“ Text. Die in den Dokumenten enthaltenen Bilder werden von unserer Software derzeit nicht verarbeitet, sondern ignoriert.
Es kann vorkommen, dass eine Warnung in Form eines Ausrufezeichens in einem gelben Dreieck () angezeigt wird, mit der Aufforderung den aus dem Dokument extrahierten Text zu kontrollieren. Dies geschieht, wenn die automatische Spracherkennung des Dokuments einen maßgeblichen Teil des Textes nicht erkannt hat. Möglicherweise ist der Text dann nicht mehr originalgetreu, entsprechend dem im Originaldokument sichtbaren Text. Dies kann entweder absichtlich geschehen, um die Ähnlichkeitsanalyse zu verfälschen oder aufgrund einer Inkompatibilität zwischen der Art und Weise geschehen, wie der auf dem Bildschirm sichtbare Text erzeugt und wie er im Dokument kodiert wurde. Einige PDF-Generatoren verwenden beispielsweise Schriftarten, die nicht über die übliche Kodierung verfügen. Infolgedessen ist der auf dem Bildschirm angezeigte Text für das Auge korrekt, der auf den Zeichencodes basierende extrahierte Text jedoch verändert.
Die Quellensuche
Die Analyse durch beginnt mit der Suche nach Quelldokumenten, die Ähnlichkeiten mit dem aus dem analysierten Dokument extrahierten Text aufweisen. Diese Suche nach Quelldokumenten erfolgt sowohl in im Internet frei verfügbaren Dokumenten als auch in unserer Dokumentendatenbank.
Mit unserer Software können die offensichtlichsten Ähnlichkeitsquellen, aber auch häufig Dokumente mit geringen Ähnlichkeiten von etwa zehn Wörtern sowie solche mit Ähnlichkeiten, die geringfügig umformuliert wurden, ermittelt werden.
Der Vergleich
Dann kommt die Phase, in der diese Quelldokumente mit dem analysierten Dokument verglichen werden. In dieser Phase ermitteln wir Details zu den Ähnlichkeiten, anhand derer wir sie quantifizieren und einen Ähnlichkeitsprozentsatz pro Quelle angeben können.
Die Ergebnisse der Analyse
Der Analysebericht liefert Ihnen eine Liste der Quelldokumente. Sie sind nach Ähnlichkeitsprozentsatz aufgelistet, und zwar im Tab 'Quellen' des Analyseberichts. Neben jeder Quelle wird ein Pegel angezeigt, die dem Ähnlichkeitsprozentsatz gegenüber dem analysierten Dokument entspricht.
Mit Magister und Copyright können zudem die Details der gefundenen Ähnlichkeiten in einer direkten Gegenüberstellung eingesehen werden, und zwar im Tab 'Synthese' des Analyseberichts.