Hexadezimal-Unicode-Zeichen-Braille-Tabellen

Auch bekannt als Hexadecimal Unicode Characters Braille Tables, als HUC Braille Tables und als HUC-Braille-Tabellen
Vereinfachte, weltweit vereinheitlichte 8- und 6-Punkt-Darstellung für den Hexadezimalwert von Unicode-Zeichen

Inhaltsverzeichnis

Erklärung von Unicode-Zeichen in einfacher Sprache

Einführung zu Unicode:

Unicode ist ein weltweiter Kodierungs-Standard zum Speichern von Text.
Unicode enthält Buchstaben, Ziffern, musikalische Symbole, Emoticons und so weiter.
Jedes Unicode-Zeichen hat seinen eigenen Unicode-Code-Punkt.
Es gibt 1.114.112 Code-Punkte.
Der Unicode-Standard 11.0 (Juni 2018) definiert 137.439 Zeichen.

Unicode-Version:

Der Unicode-Standard wird regelmäßig aktualisiert.
Mit jedem Update werden dem Unicode-Standard weitere Zeichen hinzugefügt.
Die HUC-Braille-Tabellen benötigen keine Updates, nachdem ein neuer Unicode-Standard veröffentlicht wurde.
Denn alle 1.114.122 Code-Punkte sind bereits in den HUC-Braille-Tabellen definiert.

Hexadezimal-Wert:

Die Code-Punkte werden in hexadezimalen Werten dargestellt.
Ein hexadezimaler Wert enthält die Ziffern 0, 1 bis 9 und die Buchstaben A bis F.
Vier bis sechs hexadezimale Werte stehen hinter "U+".
U+0030 ist der Code-Punkt für das Zeichen "Ziffer Null" ("0").
Der Bereich der Code-Punkte geht von U+0000 bis U+10FFFF.

Kodierungs-Formate:

Es gibt drei gängige Kodierungs-Formate für Unicode: UTF-8, UTF-16 und UTF-32.
UTF-8 wird von vielen Websites auf der ganzen Welt verwendet.
UTF-16 wird häufig von Betriebssystemen und Anwendungen verwendet.
Und UTF-32 benötigt den meisten Speicherplatz, um ein Unicode-Zeichen zu speichern.

Surrogate in UTF-16:

Die Code-Punkte für UTF-16 gehen von U+0000 bis U+FFFF.
Unicode-Zeichen zwischen U+10000 und U+10FFFF werden in UTF-16 in zwei Teile aufgeteilt.
Diese beiden Teile werden als obere und untere Surrogate bezeichnet.
Daher sind diese Surrogat-Zeichen nur Ersatzzeichen.
NVDA 2018.4.1 unterstützt nur UTF-16 für die Braille-Ausgabe.

Deshalb werden auf einer Braillezeile zwei statt einem Zeichen angezeigt.
Unicode-Zeichen zwischen U+0000 und U+FFFF werden weiterhin mit einem Zeichen angezeigt.
Oder mit noch mehr Zeichen, denn das hängt von der verwendeten Braille-Tabelle ab.

Definition für 8- und 6-Punkt in einfacher Sprache

Einführung zu den Braille-Tabellen:

Auf der ganzen Welt werden verschiedene Braille-Tabellen verwendet.
Und es gibt auch ungekürzte und gekürzte Braille-Tabellen.
Aber alle diese Braille-Tabellen definieren nur wenige hundert Zeichen bzw. Wörter.
Die deutsche 8-Punkte-Braille-Tabelle enthält keine Emoticons.
Der Unicode-Charakter "Grinsendes Gesicht" ist ein Emoticon.

Das Problem:

Dieses Emoticon wird in NVDA 2018.4.1 als '\xd83d''\xde00' angezeigt.
Aber andere Braille-Tabellen zeigen nur ⠀ oder ein Fragezeichen an.
Das Braille-Zeichen ⠀ hat keinen haptischen Punkt.
Dieses Zeichen ist also identisch mit einem Leerzeichen.
Die erste Darstellung benötigt ziemlich viel Platz auf einer Braillezeile.

Und die zweite verwendet für alle undefinierten Zeichen dasselbe Braille-Zeichen.
Beide Systeme sind nicht wirklich gut.

Die Lösung:

Die Hexadezimal-Unicode-Zeichen-Braille-Tabellen vereinfachen und verkürzen undefinierte Zeichen.
Die HUC-Braille-Tabellen ändern jedoch nicht die bestehenden Definitionen.
Die HUC-Braille-Tabellen erweitern nur alle bestehenden Braille-Tabellen.
Somit wird das oben genannte Unicode-Zeichen nun als ⣥⣆⡉⣥⢂⣺ in 8-Punkt-Braille dargestellt.
Und in 6-Punkt-Braille wird ⠿⠆⠛⠆⠿⠂⠼⠞ in NVDA 2018.4.1 angezeigt.

Schlussendlich sparen Sie Platz und können das Unicode-Zeichen schneller lesen.

Präfix- und Suffix-Braille-Zeichen:

Jedes bisher undefinierte Zeichen beginnt mit ⣥, ⣭, ⣽, ⣵ oder mit ⠿.
⣥ steht für Unicode-Zeichen zwischen U+0000 und U+FFFF.
Dieses so genannte Präfix-Zeichen wird häufig in 8-Punkt-Braille verwendet.
⣭, ⣽ und ⣵ stehen für Unicode-Zeichen zwischen U+10000 und U+10FFFF.
⠿ ist das Präfix-Zeichen für alle bisherigen undefinierten Zeichen in 6-Punkt-Braille.

Da 6-Punkt-Braille hauptsächlich für den Druck verwendet wird, wird das vierte Zeichen immer als ⠄, ⠠ oder als ⠤ angezeigt.
Und wenn sich ⠤ an der vierten Position befindet, folgt ⠄ oder ⠤ als zweites sogenanntes Suffix-Zeichen.
Der Hexadezimal-Wert eines Unicode-Code-Punktes wird kombiniert, um Platz zu sparen.
Zwei Hexadezimal-Werte werden innerhalb eines einzigen 8-Punkt-Braille-Zeichens dargestellt.
In den ersten beiden 6-Punkt-Braille-Zeichen werden drei Hexadezimal-Werte dargestellt.

Der zweite Hexadezimal-Wert wird hier auf die beiden Braille-Zeichen aufgeteilt.
Das vierte und das fünfte 6-Punkt-Braille-Zeichen sind immer eine Kombination aus einem Hexadezimal-Wert und dem Suffix-Zeichen.

Umwandlung von Hexadezimal-Werte in Braille:

Die Hexadezimal-Werte sind in den HUC-Braille-Tabellen wie folgt definiert:
0 = ⠚, 1 = ⠁, 2 = ⠃, 3 = ⠉, 4 = ⠙, 5 = ⠑, 6 = ⠋, 7 = ⠛
8 = ⠓, 9 = ⠊, A = ⠈, B = ⠘, C = ⠒, D = ⠂, E = ⠐, F = ⠀
⣥⣆⡉⣥⢂⣺ sowie ⠿⠆⠛⠂⠆⠿⠂⠼⠞ stehen beide für die Unicode-Zeichen U+D83D und U+DE00.
Diese beiden Unicode-Zeichen sind aufgrund von UTF-16 ein Surrogat-Paar.

Nach dem Zeichen suchen:

Suchen Sie im Internet nach beiden Unicode-Code-Punkten zusammen.
Wenn Sie das Unicode-Zeichen nicht direkt finden können, sollten Sie die beiden Code-Punkte nach UTF-32 umwandeln.
Besuchen Sie dafür den Surrogate Pair Calculator von Russell W. Cottrell.
Diese Surrogat-Umwandlung ist für Zeichen zwischen U+0000 und U+FFFF nicht erforderlich.
Und auch nicht mehr, nachdem NVDA UTF-32 unterstützt.

Daraufhin wird das oben genannte Zeichen als ⣭⡤⣺ oder als ⠿⠤⠵⠺ angezeigt.
Letzter Tipp: Erstellen Sie eine Text-Datei mit einigen Unicode-Zeichen und deren Namen, um sie schneller zu finden.

Verwendung

Anmerkung: Dieser Abschnitt wird zurzeit noch ins Deutsche übersetzt. Hier geht's zur englischen Version.

Definition für 8-Punkt

Präfix-Braille-Zeichen:

  • Das Präfix-Zeichen muss vor jedem einzelnen Unicode-Zeichen stehen. Um Verwirrungen zu vermeiden, ist die Gruppierung von zwei oder mehreren ungetrennten, aufeinanderfolgenden Unicode-Zeichen, wie zum Beispiel ⣥⣺⣩⣥⣥⣺⣩ nach ⣥⣺⣩⣺⣩, nicht erlaubt.
  • ⣥ = Code-Punkte zwischen U+0000 und U+FFFF
    Code-Punkt: U+28E5; Braille-Punkte: 13678
    Definiert die ersten 65.536 Unicode-Code-Punkte.
    Das Präfix-Zeichen ist eine Kombination aus den Buchstaben u und c.
  • ⣭ = Code-Punkte zwischen U+10000 und U+1FFFF
    Code-Punkt: U+28ED; Braille-Punkte: 134678
    Definiert die zweiten 65.536 Unicode-Code-Punkte.
    Das Präfix-Zeichen ist eine Kombination aus den Buchstaben u und c und der Ziffer 1.
  • ⣽ = Code-Punkte zwischen U+20000 und U+2FFFF
    Code-Punkt: U+28FD; Braille-Punkte: 1345678
    Definiert die dritten 65.536 Unicode-Code-Punkte.
    Das Präfix-Zeichen ist eine Kombination aus den Buchstaben u und c und der Ziffer 2.
  • ⣵ = Code-Punkte zwischen U+30000 und U+10FFFF
    Code-Punkt: U+28F5; Braille-Punkte: 135678
    Definiert die anderen 917.504 Unicode-Code-Punkte.
    Das Präfix-Zeichen ist eine Kombination aus den Buchstaben u, e und c.
    Und ab hier werden drei Braille-Zeichen benötigt, um einen Unicode-Code-Punkt korrekt zu definieren.
    U+30000 wird vor der Konvertierung nach Braille auf U+030000 geändert.
    In Unicode 11.0 (Juni 2018) sind in diesen Ebenen nur 337 Zeichen zugeordnet.

Liste für alle 17 Unicode-Ebenen:

  • ⣥ = Code-Punkte zwischen U+0000 und U+FFFF
  • ⣭ = Code-Punkte zwischen U+10000 und U+1FFFF
  • ⣽ = Code-Punkte zwischen U+20000 und U+2FFFF
  • ⣵⠾ = Code-Punkte zwischen U+30000 und U+3FFFF
  • ⣵⢾ = Code-Punkte zwischen U+40000 und U+4FFFF
  • ⣵⢞ = Code-Punkte zwischen U+50000 und U+5FFFF
  • ⣵⡾ = Code-Punkte zwischen U+60000 und U+6FFFF
  • ⣵⣾ = Code-Punkte zwischen U+70000 und U+7FFFF
  • ⣵⣞ = Code-Punkte zwischen U+80000 und U+8FFFF
  • ⣵⡺ = Code-Punkte zwischen U+90000 und U+9FFFF
  • ⣵⠺ = Code-Punkte zwischen U+A0000 und U+AFFFF
  • ⣵⢺ = Code-Punkte zwischen U+B0000 und U+BFFFF
  • ⣵⣚ = Code-Punkte zwischen U+C0000 und U+CFFFF
  • ⣵⡚ = Code-Punkte zwischen U+D0000 und U+DFFFF
  • ⣵⢚ = Code-Punkte zwischen U+E0000 und U+EFFFF
  • ⣵⠚ = Code-Punkte zwischen U+F0000 und U+FFFFF
  • ⣵⣡ = Code-Punkte zwischen U+100000 und U+10FFFF

Hexadezimal-Werte nach Braille konvertieren:

0 = ⠚, 1 = ⠁, 2 = ⠃, 3 = ⠉, 4 = ⠙, 5 = ⠑, 6 = ⠋, 7 = ⠛
8 = ⠓, 9 = ⠊, A = ⠈, B = ⠘, C = ⠒, D = ⠂, E = ⠐, F = ⠀

Hexadezimal-Werte kombinieren:

00 = ⣺, 01 = ⠞, 10 = ⣡, EF = ⠐, FE = ⢀, FF = ⠀

Beispiele für 8-Punkt

Unicode-Name Zeichen Code-Punkt Hexadezimal-Darstellung HUC8-Darstellung
Ziffer Null 0 U+0030 '\x0030' ⣥⣺⣩
2 × Ziffer Null 00 U+0030U+0030 '\x0030''\x0030' ⣥⣺⣩⣥⣺⣩
Notenschriftzeichen Kreuz U+266F '\x266f' ⣥⡧⠋
Braille-Punktmuster 12 U+2803 '\x2803' ⣥⣇⠾
Notenschriftzeichen Violinschlüssel 𝄞 U+1D11E '\y1d11e' / '\xd834''\xdd1e' ⣭⠆⢁ / ⣥⣆⢭⣥⡂⢁
Grinsendes Gesicht 😀 U+1F600 '\y1f600' / '\xd83d''\xde00' ⣭⡤⣺ / ⣥⣆⡉⣥⢂⣺

Anmerkungen: Die Endanwendung muss UTF-32 unterstützen, ansonsten werden alle Unicode-Zeichen zwischen U+10000 und U+10FFFF mit deren UTF-16-Surrogaten angezeigt. Bitte besuchen Sie den Surrogate Pair Calculator von Russell W. Cottrell, um ein UTF-16-Surrogat-Paar wieder in ein eindeutiges UTF-32-Zeichen zurück zu konvertieren.

Definition für 6-Punkt

Präfix- und Suffix-Braille-Zeichen:

  • Das Präfix-Zeichen muss vor jedem einzelnen Unicode-Zeichen stehen. Um Verwirrungen zu vermeiden, ist die Gruppierung von zwei oder mehreren ungetrennten, aufeinanderfolgenden Unicode-Zeichen, wie zum Beispiel ⠿⠺⠛⠞⠿⠺⠛⠞ nach ⠿⠺⠛⠞⠺⠛⠞, nicht erlaubt.
  • Der allerletzte Hexadezimal-Wert steht immer im Bereich der Punkte 1245 im vierten Braille-Zeichen. Die Punkte 3 und 6 definieren das Suffix-Zeichen, das sich ebenfalls immer an der vierten Position befindet. Mit anderen Worten: Das vierte Braille-Zeichen ist immer eine Kombination aus einem Hexadezimal-Wert und dem Suffix-Zeichen. Und genauso verhält es sich auch mit dem fünften Braille-Zeichen für die Unicode-Code-Punkte zwischen U+20000 und U+10FFFF.
  • Die beiden geschützten Leerzeichen (" ") zwischen dem Präfix- und dem Suffix-Zeichen sind lediglich Platzhalter für drei Hexadezimal-Werte. Der viertletzte Hexadezimal-Wert befindet sich im Bereich der Punkte 1245 im ersten Braille-Zeichen, der drittletzte wird zwischen dem ersten und dem zweiten Braille-Zeichen aufgeteilt (Punkte 36 und 14) und der vorletzte befindet sich im Bereich der Punkte 2356 im zweiten Braille-Zeichen. Die letzten beiden Hexadezimal-Werte eines Unicode-Code-Punktes sind die wichtigsten. Daher sollten sie nicht zwischen zwei 6-Punkt-Braille-Zeichen aufgeteilt werden.
  • Und um Missverständnisse zu vermeiden, ist ⠀ (U+2800, Braille-Punkt 0) als Suffix-Zeichen nicht erlaubt.
  • ⠿  ⠄ = Code-Punkte zwischen U+0000 und U+FFFF
    Code-Punkte: U+283F und U+2804; Braille-Punkte: 123456 und 3
    Definiert die ersten 65.536 Unicode-Code-Punkte.
  • ⠿  ⠠ = Code-Punkte zwischen U+10000 und U+1FFFF
    Code-Punkte: U+283F und U+2820; Braille-Punkte: 123456 und 6
    Definiert die zweiten 65.536 Unicode-Code-Punkte.
  • ⠿  ⠤⠇ = Code-Punkte zwischen U+20000 und U+2FFFF
    Code-Punkte: U+283F, U+2824 und U+2807; Braille-Punkte: 123456, 36 und 123
    Definiert die dritten 65.536 Unicode-Code-Punkte.
    Und ab hier werden vier Braille-Zeichen benötigt, um einen Unicode-Code-Punkt korrekt zu definieren.
    In Unicode 11.0 (Juni 2018) sind 60.859 Zeichen in der Ebene U+2xxxx und weitere 337 in den Ebenen höher als U+30000 zugeordnet.
    Der erste Hexadezimal-Wert für U+2xxxx muss hinter dem vierten Braille-Zeichen im Bereich der Punkte 1245 stehen, um die Unicode-Ebene korrekt zu definieren.
    Und für die Unicode-Code-Punkte von U+100000 bis U+10FFFF wird mit dem Braille-Zeichen ⠥ (U+2825, Braille-Punkte 136) jene Unicode-Ebene definiert.

Liste für alle 17 Unicode-Ebenen:

  • ⠿  ⠄ = Code-Punkte zwischen U+0000 und U+FFFF
  • ⠿  ⠠ = Code-Punkte zwischen U+10000 und U+1FFFF
  • ⠿  ⠤⠇ = Code-Punkte zwischen U+20000 und U+2FFFF
  • ⠿  ⠤⠍ = Code-Punkte zwischen U+30000 und U+3FFFF
  • ⠿  ⠤⠝ = Code-Punkte zwischen U+40000 und U+4FFFF
  • ⠿  ⠤⠕ = Code-Punkte zwischen U+50000 und U+5FFFF
  • ⠿  ⠤⠏ = Code-Punkte zwischen U+60000 und U+6FFFF
  • ⠿  ⠤⠟ = Code-Punkte zwischen U+70000 und U+7FFFF
  • ⠿  ⠤⠗ = Code-Punkte zwischen U+80000 und U+8FFFF
  • ⠿  ⠤⠎ = Code-Punkte zwischen U+90000 und U+9FFFF
  • ⠿  ⠤⠌ = Code-Punkte zwischen U+A0000 und U+AFFFF
  • ⠿  ⠤⠜ = Code-Punkte zwischen U+B0000 und U+BFFFF
  • ⠿  ⠤⠖ = Code-Punkte zwischen U+C0000 und U+CFFFF
  • ⠿  ⠤⠆ = Code-Punkte zwischen U+D0000 und U+DFFFF
  • ⠿  ⠤⠔ = Code-Punkte zwischen U+E0000 und U+EFFFF
  • ⠿  ⠤⠄ = Code-Punkte zwischen U+F0000 und U+FFFFF
  • ⠿  ⠤⠥ = Code-Punkte zwischen U+100000 und U+10FFFF

Hexadezimal-Werte nach Braille konvertieren:

0 = ⠚, 1 = ⠁, 2 = ⠃, 3 = ⠉, 4 = ⠙, 5 = ⠑, 6 = ⠋, 7 = ⠛
8 = ⠓, 9 = ⠊, A = ⠈, B = ⠘, C = ⠒, D = ⠂, E = ⠐, F = ⠀

Hexadezimal-Werte kombinieren:

0000 = ⠺⠽⠚, 0001 = ⠺⠽⠁, 0010 = ⠺⠋⠚, 0100 = ⠞⠴⠚
1000 = ⠡⠽⠚, FFEF = ⠀⠠⠀, FFFE = ⠀⠀⠐, FFFF = ⠀⠀⠀

Beispiele für 6-Punkt

Unicode-Name Zeichen Code-Punkt Hexadezimal-Darstellung HUC6-Darstellung
Ziffer Null 0 U+0030 '\x0030' ⠿⠺⠛⠞
2 × Ziffer Null 00 U+0030U+0030 '\x0030''\x0030' ⠿⠺⠛⠞⠿⠺⠛⠞
Notenschriftzeichen Kreuz U+266F '\x266f' ⠿⠧⠗⠄
Braille-Punktmuster 12 U+2803 '\x2803' ⠿⠇⠽⠍
Notenschriftzeichen Violinschlüssel 𝄞 U+1D11E '\y1d11e' / '\xd834''\xdd1e' ⠿⠆⠂⠰ / ⠿⠆⠛⠝⠿⠂⠃⠔
Grinsendes Gesicht 😀 U+1F600 '\y1f600' / '\xd83d''\xde00' ⠿⠤⠵⠺ / ⠿⠆⠛⠆⠿⠂⠼⠞

Anmerkungen: Die Endanwendung muss UTF-32 unterstützen, ansonsten werden alle Unicode-Zeichen zwischen U+10000 und U+10FFFF mit deren UTF-16-Surrogaten angezeigt. Bitte besuchen Sie den Surrogate Pair Calculator von Russell W. Cottrell, um ein UTF-16-Surrogat-Paar wieder in ein eindeutiges UTF-32-Zeichen zurück zu konvertieren.

Downloads

  • HUC8-Braille-Tabellen – 2019-03-01 (1,58 MB, 7z)
    SHA-256: ec60e5cd6cae8302870fa422361562febb5d6a0a2c05de869ba545cb5294d65f
    Lizenz: © 2019 Daniel Mayr (alias Dr. Sooom), LGPL 2.1+
    Hinweis: Diese Version ist für die Aufnahme in Liblouis vorbereitet. Sie ist noch nicht Teil davon.
  • Die HUC6-Braille-Tabellen sind derzeit in Arbeit.
  • Weitere herunterladbare Dateien sind auf der Downloads-Seite auf Daniel Mayr.at (nur auf Deutsch verfügbar) ersichtlich.

Installations-Anleitung für NVDA 2018.4.1 (installierte Version, UTF-16)

Anmerkung: Dieser Abschnitt wird zurzeit noch ins Deutsche übersetzt. Hier geht's zur englischen Version.

Installations-Anleitung für NVDA 2018.4.1 (portable Version, UTF-16)

Anmerkung: Dieser Abschnitt wird zurzeit noch ins Deutsche übersetzt. Hier geht's zur englischen Version.

Deinstallations-Anleitung für NVDA 2018.4.1 (installierte/portable Version)

Anmerkung: Dieser Abschnitt wird zurzeit noch ins Deutsche übersetzt. Hier geht's zur englischen Version.

Häufig gestellte Fragen (FAQ)

Anmerkung: Dieser Abschnitt wird zurzeit noch ins Deutsche übersetzt. Hier geht's zur englischen Version.