Ein Segment, dessen tokenisierte Struktur eine von mehreren
Möglichkeiten der Tokenisierung darstellt, sei es wegen der Ambivalenz der Lesung
oder wegen vorhandener Revisionen innerhalb der Textstelle. Unter verschiedener
Tokenisierung wird nicht nur eine jeweils andere Festlegung der Tokengrenzen,
sondern auch eine infolge von Revisionen jeweils unterschiedlich ausfallende
linguistische Bewertung verstanden.
Definition (englisch)
A segment with a tokenized structure that represents one of
several alternatives of tokenization, either because of the ambivalence of the
reading or because of revisions within the text passage. Different tokenization is
used to refer not only to a different definition of token boundaries, but also to
a different linguistic evaluation as a result of revisions.