[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Patentierte Problemstellungen und internationalisiertes DNS



Holger Veit <holger.veit@gmd.de> writes:

> > Der zweite Punkte ist i.a. nicht richtig. ;-) Das ist ja auch nicht
> 
> Fuer die 26 Buchstaben und ein paar andere Glyphs/Zeichen gibt es 
> so eine Zuordnung.

Die Typen <LATIN CAPITAL LETTER A> und <GREEK CAPITAL LETTER ALPHA>
sind IIRC im Druck in der Regel nicht zu unterscheiden, und trotzdem
ist <LATIN SMALL LETTER A> nicht als Kleinbuchstabe <GREEK CAPITAL
LETTER ALPHA> zugeordnet.

Es ist sinnlos, bei Typen von Groß- und Kleinbuchstaben zu sprechen.

> > der Punkt, es ist in der Tat nicht sinnvoll, Typen Eigenschaften
> > zuzuschreiben, die zu Zeichen gehören.
> 
> Das ist aber letztlich der angesprochene Asienstreit, weswegen die
> Japaner lange Zeit (und immer noch) ISO-2022-JP dem "CJK" und "Unicode"
> vorgezogen haben.

IIRC sind die Dinge ein wenig anders gelagert. Jedenfalls wurde viel
Porzellan zerschlagen, als die erste Unicode-Version (1.1?) mit dem
Han-Repertoire nur in chinesischer Typenvariante erschien.

> allerdings besitzt durchaus Unicode die Schwierigkeit, dass die klassischen
> alten Codierungen (ASCII, Latin-XX) recht einfach abbildbar sind, die
> asiatischen frueheren Standards allerdings geradeweg ignoriert wurden

Belege? Die Han-Vereinigung hat ziemlichen Aufwand bedeutet, es waren
zahlreiche Experten aus allen Han-Sprachkreisen beteiligt, und es
sind auch die üblichen Zeichensätze berücksichtigt worden. Einigen
Experimenten zufolge sind die Zeichenvarianten, die bei Verwendung
falscher Fonts angezeigt werden, trotzdem für die andere Seite lesbar
(angeblich gibt das da ein, zwei Ausnahmen, aber selbst das konnte im
Experiment nicht bestätigt werden).

> (dasselbe gilt fuer KOI-8, welches ebenfalls unter den Tisch gefallen ist).

Gibt es ein Zeichen in KOI-8, welches sich nicht in Unicode
wiederfindet?

> Wenn man sich auf den Standpunkt zurueckzieht, dass Unicode einfach nur
> Glyphs codiert,

Unicode kodiert Zeichen. Wenn ich etwas anderes geschrieben haben
sollte, dann war das ein Schreibfehler: Zeichen, nicht Typen.

> (warum hat man etwa die mit dem Lateinischen uebereinstimmenden kyrillischen
> Zeichen nicht auf ASCII abgebildet?)

Die Unicode-Puristen hören das zwar nicht gerne (es ist nicht
Standard-Terminologie): Es gibt die 'source separation rule', die
besagt, daß Zeichen, die in Quellzeichensätzen verschieden kodiert
sind, auch in Unicode verschieden sein müssen. Sonst könnte man nicht
verlustfrei hin- und herkonvertieren.

> ACK. So ist zum Beispiel die Collation-Order bei westlichen Sprachen 
> weitgehend erhalten geblieben, bei den Asiaten aber generell zum Teufel.
> Kein Wunder, dass die nicht gluecklich darueber sind.

'Collation Order' im Chinesischen sieht sowieso etwas seltsam aus.
Natürlich kann man das Zeichenrepertoire jederzeit wohlordnen, aber
AFAIK ist das nicht üblich.

> ... was die Sache noch weiter verwurschtelt, weil ggf. dann ein
> Grossteil lesbar ist, aber bestimmte Zeichen doch wieder nicht.

Deswegen braucht man ja schon Unicode, selbst wenn man nur ISO 8859
sinnvoll verwenden will.