|
Next
Previous
Contents
Linux wird von einer weltweiten Gemeinde von Hackern im Internet
entwickelt. Obwohl Linux ursprünglich aus Finnland kommt, ist Englisch
gemeinsame Sprache und Ausgangspunkt bei der Programmierung sind meist
amerikanische Standards (Papierformat "letter", Zeichensatz
ohne Umlaute, usw.).
Gerade weil die Linux-Gemeinde weltweit operiert, sind
landesspezifische Einstellungen an vielen Stellen vorgesehen und
müssen lediglich aktiviert werden. Das ist schon alles.
Tasten werden durch ihre Aufschrift in spitzen Klammern markiert.
Das Linux Configuration-HOWTO (to appear) erläutert die Handhabung der
erwähnten Konfigurationsdateien.
Im Linux Keyboard- und Keystroke-HOWTO findet man alle "Tricks" für
die Tastatur.
- ASCII
ist ein 7-bit Zeichensatz und enthält 2^7 = 2*2*2*2*2*2*2
= 128 Zeichen, was gerade mal für a-z, A-Z, 0-9 und einige wichtige
Zeichen ausreicht. Das amerikanische Alphabet halt.
- 8-bit-clean
ein 8-bit Zeichensatz umfaßt 128*2 = 256 Zeichen und
kann einige Sonderzeichen aufnehmen. Ist ein Programm in der Lage mit
einen 8-bit Zeichensatz umzugehen, so bezeichnet man es auch als
`8-bit clean'. Ist ein Programm nicht 8-bit clean, so erscheinen oft
anstelle der Umlaute `äöü' die Zeichen `dv|'.
Man beachte den subtilen Unterschied zwischen `8bit clean' und `localized':
Ein 8bit cleanes Programm braucht nichts von seiner Locale (und dem
verwendeten Zeichensatz!) zu wissen; es muss ``nur'' alle 256 Zeichen
bearbeiten können. Handkehrum kann ein Programm localized sein, aber
trotzdem nicht 8bit clean sein, da es gewisse Zeichen verschluckt
(z.B. alle Control-Codes).
- `ISO-latin1' oder `ISO-8859-1'
Internationaler 8-bit Zeichensatz, enthält Umlaute und viele Sonderzeichen
für die `westeuropäischen' Sprachen. (Die osteuropäischen und weitere
haben andere Endziffern.)
- Unicode
Unicode ist ein Standard, der Zeichen aus den unterschiedlichsten
Sprachen der Länder dieser Welt enthält. Dazu werden die
Zeichenpositionen in einem 32-bit Zeichensatz definiert, was noch
längst nicht abgeschlossen ist. Gängigere Zeichensätze (wie die
Zeichen der europäischen Sprachfamilien) sind als 16-bit Untergruppen
festgelegt, die in kompatibler Weise als einzelne 16-bit
Unicode-Zeichensätze verwendet werden können. Wenn hier von einem
Unicode-Zeichensatz die Rede ist, ist die 16-bit Untergruppe der
europäischen Sprachfamilien gemeint.
- POSIX
POSIX steht für `Portable Operating System Interface for UniX'. Normierte
Schnittstellenbeschreibung zu Kernel- und libc-Funktionen (POSIX.1)
resp. zu den Grundutilities (sh, ed, vi, awk, cut, ...) (POSIX.2).
- Locale
Ist die formale Beschreibung eines Teils der kulturellen Eigenheiten für
ein Land oder einen Spracheraum und die vom jeweiligen Programm benötigten
übersetzten Texte.
- Internationalization
Veränderung eines Programms zur Unterstützung mehrerer Sprachen.
- i18n
Abkürzung für internationalization. Da viele Leute zu
faul waren dieses lange Wort immer wieder auszuschreiben, wurden
einfach der erste und letzte Buchstabe belassen und der Zwischenraum
durch die Anzahl fehlender Buchstaben ersetzt.
- Localisation
Mit localisation wird der Prozeß bezeichnt, einem bereits
internationalisierten Programm alle benötigten Informationen zur Verfügung
zu stellen, um den nationalen Besonderheiten, bezüglich der Sprache und
kulturellen Umfeld zu entsprechen. Kurz gesagt, i18n ist der eigentliche
Übersetzungsprozeß.
Der Nutzer kann das lokalisieren eines Programms erreichen, indem er
besonderen Umgebungsvariablen geeignete Werte zuweist, welche die zu
benutzende `locale' angeben.
- l10n
Abkürzung für localization, die wie i18n entstanden ist.
Next
Previous
Contents
|