Logo heiEDITIONS
🔧Dieser Abschnitt ist aktuell in Bearbeitung.

XML-Entitäten

Bei sog. XML-Entities handelt es sich um Codes, mit denen in XML Zeichen eingegeben werden können, die in XML-Dokumenten eine besondere Funktion haben, weil sie Teil der XML-Syntax sind. Wenn diese Zeichen im Text benötigt werden (also eben nicht als spezielle Operatoren der XML-Syntax), müssen sie über die sog. Entities eingegeben werden. Entities sind also stellvertretende Codes für bestimmte Zeichen, die im Text nicht direkt eingegeben werden können. Stattdessen werden sie bei der Texteingabe durch die entsprechenden Entitäten ›maskiert‹.

Vordefinierte XML-Entitäten

In der Sprachdefinition von XML sind diese fünf Entititäten vordefiniert:

Zeichen Entität Bedeutung
< &lt; Kleiner-als-Zeichen (mathematisches Symbol)
> &gt; Größer-als-Zeichen (mathematisches Symbol)
& &amp; Et-Zeichen bzw. kaufmännisches Und-Zeichen
" &quot; gerade Anführungszeichen (im Text nicht typographisch korrekt)
' &apos; Apostroph (im Text nicht typographisch korrekt)

Falls also etwa in der Transkription eines Drucks das ›kaufmännische Und-Zeichen‹ eingegeben werden müsste, sähe der TEI-Code so aus:


               <p>
                  ...
                  terra &amp; aqua
               </p>
            

Weitere Entitäten in heiEDITIONS

Menota und MUFI Über diese fünf XML-Entities hinaus definiert heiEDITIONS in Anlehnung an HTML-Konventionen und die mediävistischen Zeichenkodierungsinitiativen von Menota und ↪ MUFI eine Reihe weiterer Entities. Sie dienen zum Einen der sicheren und transparenten Eingabe von Zeichen, die zwar in Unicode definiert sind, aber nicht einfach über die deutsche Tastatur eingegeben werden können, und zum Anderen als stellvertretende Platzhalter für Zeichen, die in Unicode fehlen, in heiEDITIONS mit den standardkonformen TEI-Mitteln eigens definiert sind, die aber mithilfe einer Entity leichter eingegeben (und gelesen) werden können als der vollständig ausgeschriebene TEI-Code.

Die jeweils aktuelle Definition der Entitäten für heiEDITIONS ist unter der URL https://digi.ub.uni-heidelberg.de/schema/tei/heiEDITIONS/declarations/heieditions-entities.txt verfügbar.

Eine Referenz auf diese Datei wird in den TEI-Arbeitsversionen nach den Processing Instructions mit der Schemaangabe eingefügt:


               <?xml-model href="https://digi.ub.uni-heidelberg.de/schema/tei/heiEDITIONS/tei_hes.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
               <?xml-model href="https://digi.ub.uni-heidelberg.de/schema/tei/heiEDITIONS/tei_hes.rng" type="application/xml" schematypens="http://purl.oclc.org/dsdl/schematron"?>
               <!DOCTYPE TEI SYSTEM "https://digi.ub.uni-heidelberg.de/schema/tei/heiEDITIONS/declarations/heieditions-entities.txt">
            

Die heiEDITIONS-Entitäten werden nur in den Arbeitscodierungen verwendet. Im Rahmen der Generierung der TEI-Dateien für die verschiedenen Visualisierungen durch die Verarbeitungspipeline werden diese anhand der angegebenen Entitätendatei ersetzt.

Fälle, in denen heiEDITIONS-Entitäten in den Arbeitscodierungen eingesetzt werden, sind:

  • Eindeutig lesbare (und eingebbare) Kodierung von Unicode-Zeichen, die an sich auch direkt eingegeben werden könnten.
  • Kodierung von Zeichen, für die es in heiEDITIONS eine eigene Definition gibt, die aber für bei der Anzeige mit einem Standard-Unicode-Zeichen darstellt werden. In solchen Fällen wird die Entität bei der Verarbeitung für die Visualisierung aufgelöst zu einem <g>-Element, das auf die Definition des Zeichens verweist und gleichzeitig ein Standard- oder PUA-Unicode-Zeichen (bzw. die nummerische Entität dafür) für die (ersatzweise) Anzeige als Inhalt hat, z.B. <g ref='char:bar'>&#x0304;</g> (siehe auch Zeichenangabe über g/glyph).
  • Kodierung von Zeichen, die in heiEDITIONS mit einem ↪ PUA-Zeichen angezeigt werden sollen und deren Definition von MUFI übernommen wurde. Auch hier werden die Entitäten zu einem <g>-Element aufgelöst. Die Empfehlung des TEI-Standards sieht vor, PUA-Zeichen stets so aufzulösen und mit einer Definition zu verknüpfen. Ein Beispiel hierfür wäre die Entität &inodotsup; ("COMBINING LATIN SMALL LETTER DOTLESS I"). Diese wird aufgelöst zu <g ref='char:inodotsup'>&#xF02F;</g> (siehe auch Zeichenangabe über g/glyph).

Sonderbuchstabenformen

Entität Zeichen für Anzeige Definition Beschreibung Beispiel Unicode / TEI-Auflösung
Rrot LATIN CAPITAL LETTER R ROTUNDA Großbuchstabe R in Rotunda-Form (rundes R) [Bsp.] &#xA75A;
rrot LATIN SMALL LETTER R ROTUNDA Kleinbuchstabe r in Rotunda-Form (rundes r) [Bsp.] &#xA75B;

Kombinierende diakritische Abkürzungszeichen

Entität Zeichen für Anzeige Definition Beschreibung Beispiel Unicode / TEI-Auflösung
bar ◌̄ COMBINING ABBREVIATION MARK BAR ABOVE Kürzungszeichen in Form eines horizontalen Strichs, ggf. mit verzierendem Anstrich, Abstrich oder Wellung, mit typischen Funktionen als Nasalersatz oder Suspensionszeichen. [Bsp.] <g ref='char:bar'>&#x0304;</g>
combdblac ◌̋ COMBINING DOUBLE ACUTE ACCENT Kombinierendes doppeltes Akut-Zeichen [Bsp.] &#x030B;
combdblgr ◌̏ COMBINING DOUBLE GRAVE ACCENT Kombinierendes doppeltes Gravis-Zeichen [Bsp.] &#x030F;
curlbl ◌̧ COMBINING ABBREVIATION MARK CURL BELOW Kombinierendes Kürzungszeichen in Form einer Schlaufe unterhalb des Basiszeichens [Bsp.] <g ref='char:curlbl'>&#x0327;</g>
doublebar ◌̿ COMBINING ABBREVIATION MARK DOUBLE BAR ABOVE Kombinierendes Kürzungszeichen in Form eines doppelten horizontalen Strichs, meist als Suspensionszeichen eingesetzt. [Bsp.] <g ref='char:doublebar'>&#x033F;</g>
er ◌͛ COMBINING ABBREVIATION MARK ER ABOVE Kombinierendes Kürzungszeichen für er oberhalb des Basiszeichens [Bsp.] <g ref='char:er'>&#x035B;</g>
re ◌̔ COMBINING ABBREVIATION MARK RE ABOVE Kombinierendes Kürzungszeichen für re oberhalb des Basiszeichens [Bsp.] <g ref='char:re'>&#x0314;</g>
zig ◌͛ COMBINING ABBREVIATION MARK ZIGZAG ABOVE Kombinierendes Kürzungszeichen in Form eines Zickzacks oberhalb des Basiszeichens [Bsp.] <g ref='char:zig'>&#x035B;</g>
curl ◌̓ COMBINING ABBREVIATION MARK CURL ABOVE Kombinierendes Kürzungszeichen in Form einer Schlaufe oberhalb des Basiszeichens [Bsp.] <g ref='char:curl'>&#x0313;</g>
ra ◌ᷓ COMBINING LATIN SMALL LETTER FLATTENED OPEN A ABOVE Kombinierender übergeschriebener Kleinbuchstabe a (abgeflachte offene Form) [Bsp.] &#x1DD3;
rabar ◌ COMBINING ABBREVIATION MARK SUPERSCRIPT RA OPEN A FORM WITH BAR ABOVE Kombinierendes Kürzungszeichen für übergeschriebenes ra in offener a-Form mit Strich darüber [Bsp.] <g ref='char:rabar'>&#xF1C1;</g>
urrot ◌ᷣ COMBINING LATIN SMALL LETTER R ROTUNDA Kombinierender übergeschriebener Kleinbuchstabe r in Rotunda-Form (übergeschriebenes rundes r) [Bsp.] &#x1DE3;
urlemn ◌ COMBINING ABBREVIATION MARK SUPERSCRIPT UR LEMNISKATE FORM Kombinierendes Kürzungszeichen für übergeschriebenes ur in Lemniskaten-Form [Bsp.] <g ref='char:urlemn'>&#xF1C2;</g>
us ◌᷒ COMBINING US ABOVE Kombinierendes Kürzungszeichen für us oberhalb des Basiszeichens [Bsp.] &#x1DD2;

Weitere kombinierende diakritische Zeichen

Entität Zeichen für Anzeige Definition Beschreibung Beispiel Unicode / TEI-Auflösung
combgrave ◌̀ COMBINING GRAVE ACCENT Kombinierendes Gravis-Zeichen [Bsp.] &#x0300;
combacute ◌́ COMBINING ACUTE ACCENT Kombinierendes Akut-Zeichen [Bsp.] &#x0301;
combmacr ◌̄ COMBINING MACRON Kombinierendes Makron [Bsp.] &#x0304;
combcar ◌̌ COMBINING CARON Kombinierendes Caron (Háček) [Bsp.] &#x030C;
combcirc ◌̂ COMBINING CIRCUMFLEX ACCENT Kombinierendes Zirkumflex-Zeichen [Bsp.] &#x0302;
combbreve ◌̆ COMBINING BREVE Kombinierendes Brevis-Zeichen [Bsp.] &#x0306;
combdot ◌̇ COMBINING DOT ABOVE Kombinierender Punkt oberhalb [Bsp.] &#x0307;
combuml ◌̈ COMBINING DIAERESIS Kombinierendes Trema (Umlautpunkte) [Bsp.] &#x0308;
combcomma ◌̓ COMBINING COMMA ABOVE Kombinierendes Komma oberhalb [Bsp.] &#x0313;
iuml ◌̓ COMBINING APOSTROPHE-LIKE MARK I-UMLAUT ABOVE Apostrophähnliches kombinierendes Zeichen, das überwiegend in der Funktion des i-Umlauts oder eines Diphthongs über u, v, w und gelegentlich anderen Grundbuchstaben verwendet wird. [Bsp.] <g ref='char:iuml'>&#x0313;</g>
asup ◌ͣ COMBINING LATIN SMALL LETTER A Kombinierender übergeschriebener Kleinbuchstabe a [Bsp.] &#x0363;
esup ◌ͤ COMBINING LATIN SMALL LETTER E Kombinierender übergeschriebener Kleinbuchstabe e [Bsp.] &#x0364;
isup ◌ͥ COMBINING LATIN SMALL LETTER I Kombinierender übergeschriebener Kleinbuchstabe i [Bsp.] &#x0365;
inodotsup ◌ COMBINING LATIN SMALL LETTER DOTLESS I Kombinierender übergeschriebener Kleinbuchstabe i ohne Punkt [Bsp.] <g ref='char:inodotsup'>&#xF02F;</g>
osup ◌ͦ COMBINING LATIN SMALL LETTER O Kombinierender übergeschriebener Kleinbuchstabe o [Bsp.] &#x0366;
usup ◌ͧ COMBINING LATIN SMALL LETTER U Kombinierender übergeschriebener Kleinbuchstabe u [Bsp.] &#x0367;
vsup ◌ͮ COMBINING LATIN SMALL LETTER V Kombinierender übergeschriebener Kleinbuchstabe v [Bsp.] &#x036E;
wsup ◌ COMBINING LATIN SMALL LETTER W Kombinierender übergeschriebener Kleinbuchstabe w [Bsp.] <g ref='char:wsup'>&#xF03C;</g>
combtilde ◌̃ COMBINING TILDE Kombinierendes Tilde-Zeichen [Bsp.] &#x0303;
diagdots ◌̈ COMBINING TWO DIAGONAL DOTS ABOVE Kombinierendes Zeichen in Form von zwei diagonal aufsteigenden Punkten, das in der Regel über Vokalen als Umlaut- oder Diphthong-Marker verwendet wird. [Bsp.] <g ref='char:diagdots'>&#x0308;</g>
cauda ◌̨ COMBINING CAUDA Kombinierender Schwanz (Cauda) unterhalb des Basiszeichens [Bsp.] <g ref='char:cauda'>&#x0328;</g>

Griechische kombinierende diakritische Zeichen

Entität Zeichen für Anzeige Definition Beschreibung Beispiel Unicode / TEI-Auflösung
combperispomeni ◌͂ COMBINING GREEK PERISPOMENI Kombinierendes griechisches Perispomeni [Bsp.] &#x0342;

Weitere Abkürzungszeichen

Entität Zeichen für Anzeige Definition Beschreibung Beispiel Unicode / TEI-Auflösung
dstrok đ LATIN SMALL LETTER D WITH STROKE Lateinischer Kleinbuchstabe d mit Strich [Bsp.] &#x0111;
de LATIN ABBREVIATION SIGN SMALL DE Lateinisches Abkürzungszeichen für de (de-Ligatur) [Bsp.] <g ref='char:de'>&#xF159;</g>
Kstrleg LATIN CAPITAL LETTER K WITH DIAGONAL STROKE Lateinischer Großbuchstabe K mit diagonalem Strich [Bsp.] &#xA742;
kstrleg LATIN SMALL LETTER K WITH DIAGONAL STROKE Lateinischer Kleinbuchstabe k mit diagonalem Strich [Bsp.] &#xA743;
condes LATIN SMALL LETTER CON Lateinischer Kleinbuchstabe con (Abkürzungszeichen) [Bsp.] &#xA76F;
per LATIN SMALL LETTER P WITH STROKE THROUGH DESCENDER Lateinischer Kleinbuchstabe p mit Strich durch die Unterlänge [Bsp.] &#xA751;
pro LATIN SMALL LETTER P WITH FLOURISH Lateinischer Kleinbuchstabe p mit Schnörkel [Bsp.] &#xA753;
qbardes LATIN SMALL LETTER Q WITH STROKE THROUGH DESCENDER Lateinischer Kleinbuchstabe q mit Strich durch die Unterlänge [Bsp.] &#xA757;
qds LATIN SMALL LETTER Q WITH DIAGONAL STROKE Lateinischer Kleinbuchstabe q mit diagonalem Strich [Bsp.] &#xA759;
RUM LATIN CAPITAL LETTER RUM ROTUNDA Lateinischer Großbuchstabe rum in Rotunda-Form [Bsp.] &#xA75C;
rum LATIN SMALL LETTER RUM ROTUNDA Lateinischer Kleinbuchstabe rum in Rotunda-Form [Bsp.] &#xA75D;
tcurl LATIN SMALL LETTER T WITH CURL Lateinischer Kleinbuchstabe t mit Schlaufe (tur-Abbreviatur) [Bsp.] <g ref='char:tcurl'>&#xF199;</g>
is LATIN SMALL LETTER IS Lateinischer Kleinbuchstabe is (Abkürzungszeichen) [Bsp.] &#xA76D;
etfin LATIN SMALL LETTER ET Lateinischer Kleinbuchstabe et (Abkürzungszeichen) [Bsp.] &#xA76B;
et TIRONIAN SIGN ET Tironisches Zeichen et [Bsp.] &#x204A;
etslash LATIN ABBREVIATION SIGN SMALL ET WITH STROKE Lateinisches Abkürzungszeichen kleines et mit Strich [Bsp.] <g ref='char:etslash'>&#xF158;</g>
lhighstrok LATIN ABBREVIATION SIGN SMALL LETTER L WITH HIGH STROKE Lateinisches Abkürzungszeichen Kleinbuchstabe l mit hochgesetztem Strich [Bsp.] <g ref='char:lhighstrok'>&#xA749;</g>
slongflour LATIN SMALL LETTER LONG S WITH FLOURISH Lateinisches langes s mit Schnörkel [Bsp.] <g ref='char:slongflour'>&#xE8B7;</g>
usbase LATIN ABBREVIATION SIGN SPACING BASE-LINE SMALL US Kürzungszeichen us in Form einer Schlaufe oder eines Spiralenansatzes, das auf der Grundlinie erscheint. [Bsp.] <g ref='char:usbase'>&#xF1A6;</g>
nlrlegab ƞ LATIN ABBREVIATION SIGN SMALL LETTER N WITH LONG RIGHT LEG Lateinisches Abkürzungszeichen Kleinbuchstabe n mit langem rechtem Schaft (Abkürzung für en) [Bsp.] <g ref='char:nlrlegab'>&#x019E;</g>

Ligaturen

Entität Zeichen für Anzeige Definition Beschreibung Beispiel Unicode / TEI-Auflösung
ctlig LATIN SMALL LIGATURE CT Lateinische Ligatur ct [Bsp.] <g ref='char:ctlig'>&#xEEC5;</g>
ftlig LATIN SMALL LIGATURE FT Lateinische Ligatur ft [Bsp.] <g ref='char:ftlig'>&#xEECB;</g>
qet LATIN SMALL LETTER Q LIGATED WITH FINAL ET Lateinischer Kleinbuchstabe q ligiert mit finalem et [Bsp.] <g ref='char:qet'>&#xE8BF;</g>
etcem ⁊c LATIN EARLY MODERN ET CETERA LIGATURE Frühneuzeitliche Ligatur für et cetera [Bsp.] <g ref='char:etcem'>&#x204A;c</g>
etcemra ⁊cᷓ LATIN EARLY MODERN ET CETERA LIGATURE WITH FLATTENED OPEN A Frühneuzeitliche Ligatur für et cetera mit abgeflachtem offenem a [Bsp.] <g ref='char:etcemra'>&#x204A;c&#x1DD3;</g>

Doppelzeichen

Entität Zeichen für Anzeige Definition Beschreibung Beispiel Unicode / TEI-Auflösung
dblf4F F DOUBLE LATIN SMALL LETTER F REPRESENTING THE CORRESPONDING SIMPLE CAPITAL LETTER Doppeltes Minuskel-f, das funktional die entsprechende einfache Majuskel oder eine ›littera notabilior‹ repräsentiert. [Bsp.] <g ref='char:dblf4F'>F</g>
dbll4L L DOUBLE LATIN SMALL LETTER L REPRESENTING THE CORRESPONDING SIMPLE CAPITAL LETTER Doppeltes Minuskel-l, das funktional die entsprechende einfache Majuskel oder eine ›littera notabilior‹ repräsentiert. [Bsp.] <g ref='char:dbll4L'>L</g>

Zeichen der modernen Typographie

Entität Zeichen für Anzeige Definition Beschreibung Beispiel Unicode / TEI-Auflösung
laquo « LEFT-POINTING DOUBLE ANGLE QUOTATION MARK Links-weisendes doppeltes Winkelzeichen; in der deutschen Typographie als schließendes Anführungszeichen verwendet [Bsp.] &#x00AB;
raquo » RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK Rechts-weisendes doppeltes Winkelzeichen; in der deutschen Typographie als öffnendes Anführungszeichen verwendet [Bsp.] &#x00BB;
lsaquo SINGLE LEFT-POINTING ANGLE QUOTATION MARK Links-weisendes einfaches Winkelzeichen; in der deutschen Typographie als schließendes einfaches Anführungszeichen verwendet [Bsp.] &#x2039;
rsaquo SINGLE RIGHT-POINTING ANGLE QUOTATION MARK Rechts-weisendes einfaches Winkelzeichen; in der deutschen Typographie als öffnendes einfaches Anführungszeichen verwendet [Bsp.] &#x203A;

Mittelalterliche Interpunktionszeichen

Entität Zeichen für Anzeige Definition Beschreibung Beispiel Unicode / TEI-Auflösung
posit COMMA POSITURA Mittelalterliches Interpunktionszeichen ›Comma Positura‹ [Bsp.] <g ref='char:posit'>&#xF1E2;</g>
punctelev PUNCTUS ELEVATUS Mittelalterliches Interpunktionszeichen ›Punctus elevatus‹ [Bsp.] <g ref='char:punctelev'>&#xF161;</g>
punctelevdiag PUNCTUS ELEVATUS DIAGONAL STROKE Mittelalterliches Interpunktionszeichen ›Punctus elevatus‹ mit diagonalem Strich [Bsp.] <g ref='char:punctelevdiag'>&#xF1F0;</g>
bidotscomposit TWO DOTS OVER COMMA POSITURA Mittelalterliches Interpunktionszeichen Zwei Punkte über ›Comma Positura‹ [Bsp.] <g ref='char:bidotscomposit'>&#xF1F2;</g>
virgsusp VIRGULA SUSPENSIVA Mittelalterliches Interpunktionszeichen ›Virgula suspensiva‹ [Bsp.] <g ref='char:virgsusp'>&#xF1F4;</g>

Währungszeichen

Entität Zeichen für Anzeige Definition Beschreibung Beispiel Unicode / TEI-Auflösung
curren ¤ CURRENCY SIGN Allgemeines Währungszeichen; zu verwenden, wenn ein Währungszeichen keinem spezifischen Währungssymbol zugeordnet werden kann. [Bsp.] &#x00A4;
pennygerm GERMAN PENNY SIGN Deutsches Pfennigzeichen [Bsp.] &#x20B0;
florloop FLOREN SIGN WITH LOOP Währungszeichen für Florin bzw. Gulden mit Schlaufe [Bsp.] <g ref='char:florloop'>&#xF2E8;</g>
libradut DUTCH LIBRA SIGN Niederländisches Pfundzeichen [Bsp.] <g ref='char:libradut'>&#xF2EA;</g>

Sonstige Symbole

Entität Zeichen für Anzeige Definition Beschreibung Beispiel Unicode / TEI-Auflösung
para PILCROW SIGN Absatzzeichen (Pilcrow, Paragraphzeichen) [Bsp.] &#x00B6;
insup INSERTION SYMBOL UP ARROWHEAD Einweisungszeichen in Form eines aufwärts zeigenden Pfeils [Bsp.] <g ref='char:insup'>&#x2303;</g>
insdown INSERTION SYMBOL DOWN ARROWHEAD Einweisungszeichen in Form eines abwärts zeigenden Pfeils [Bsp.] <g ref='char:insdown'>&#x2304;</g>
adm AD ALBRECHT DÜRER MONOGRAM Albrecht-Dürer-Monogramm [Bsp.] <g ref='char:adm'>AD</g>

Leerzeichen

Entität Zeichen für Anzeige Definition Beschreibung Beispiel Unicode / TEI-Auflösung
emsp EM SPACE Leerzeichen in Em-Breite [Bsp.] &#x2003;
nnbsp NARROW NO-BREAK SPACE Schmales geschütztes Leerzeichen [Bsp.] &#x202F;
decoration