[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [FYI] Hacking Insurance



On 2000-07-18 12:22:10 +0200, Florian Weimer wrote:

> Sicherlich können Probleme entstehen, wenn man unsauber
> arbeitet und z.B. RFC 2279 in den Wind schlägt, aber
> dann wird man schon an korrekten ASCII-Parsern
> scheitern.

... was auch viele tun, nicht wahr?

Tatsache ist, daß Code, der _eigentlich_ UTF-8 als
irgendeine Obermenge von US-ASCII betrachten könnte, durch
die faktische Mehrdeutigkeit der Codierung zusätzlich die
Aufgabe aufgebrummt bekommt, die Eingabedaten auf
ungültige Sequenzen zu überprüfen, da man ja nie weiß, ob
nicht irgendein darüberliegender Decoder etwas zu "liberal
in what it accepts" ist und diese ungültigen Sequenzen
schluckt.  Das fügt unter Umständen eine ganze Menge an
Komplexität zum Code hinzu - und damit Gelegenheiten,
Fehler zu machen, die zu Sicherheitslücken führen.

Selbst wide-character- bzw. iconv-Implementierungen in
Sytembibliotheken sind häufig schlicht reif für den Müll.
(Und können, ganz nebenbei, gleich wieder zu neuen buffer
overflows führen, wenn etwa die erwartete Länge der
decodierten/codierten Daten falsch zurückgegeben wird.)

Und was schließen wir daraus?  Von us-ascii verschiedene
Zeichensätze haben in Kontrollinformationen nichts zu
suchen, weil sie zu Interoperabilitätsalbträumen,
Sicherheitslöchern und Bugs aller Art führen.

(Ich freue mich schon auf die erste Internet-Domain, die
ich nur mit einer chinesischen Tastatur eintippen kann.)

-- 
Thomas Roessler              <roessler@does-not-exist.org>