[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: http://www.spiegel.de/netzwelt/aktuell/somm_leeb.html



> >Gibst Du die URL einer  
> >Webseite an, erhältst Du ebenfalls eine Datei aus dem Cache. So what?
> 
> Mit "gezielt" meine ich, dass das ganze doch total transparent ist. Wenn 
> sie im Cache ist, ist sie im Cache, wenn nicht, kriege ich sie direkt. 
> Den Cache kriege ich als User doch gar nicht mit, ausser wenn er nicht 
> funktioniert. Wenn aber ein Artikel nicht im Newsspool ist, dann kriege 
> ich ihn nicht auf diesem Server, basta.

Nicht weit genug gedacht. Heute frage ich den Newsserver nach einer
Message-ID, und er antwortet: hab' ich nicht. Morgen frage ich nochmal nach
derselben, und bekomme einen Article-Header oder Body dazu. Magie? 
Die Idee, einen NNTP-Server nach einer MEssage-ID zu fragen, scheint mir 
persoenlich eher aus der Netscape-Generation zu kommen, wo man irgendwo
mal eine ID aufgeschnappt hat und jetzt Details herausfinden will. So
arbeitet das Usenet nicht; es ist im Gegensatz zum WWW kein direct-access-
network. Ueblich ist, dass ein newsreader seinen Server nach Artikel-Headern 
fragt und einen ganzen Rattenschwanz angeliefert bekommt. Die ausgewaehlten 
Artikel werden dann einzeln angefordert, wobei das *interne* Unterscheidungs-
kriterium die Message-ID ist. User bekommen diese ID normal nicht zu sehen.
Warum? Weil das Usenet nicht nur Raum, sondern auch noch die Zeit als 
Parameter hat: Hast du eine Message-ID zur Hand, dann hast du zunaechst mal
nichts. Es kann sein, dass 
- es *jetzt* einen solchen Artikel auf *deinem* Server gibt,
- es *frueher* mal eine Artikel gab, der aber expired ist,
- es *irgendwo* weltweit einen solchen Artikel gibt, der
  - nur noch nicht auf deinem Server angekommen ist,
  - der nur in einer nicht-gefeedeten lokalen Gruppe existiert,
- es nie einen Artikel mit dieser ID gegeben hat (typo, fake, etc.)
- es eine Dupe-Message-ID ist, die irgendein beknacktes Gate mal aus einem
  existierenden Artikel umgerechnet hat, so dass der zugehoerige Artikel
  zwar existiert, aber niemals das entsprechende Usenet-Teilnetz verlassen
  wird, so dass er nie bei Dir ankommen wird
- es, wie vor, eine Dupe-ID ist, die Du siehst, aber es gibt keinen Zusammen-
  hang zu dem eigentlichen Original: cancele das illegale Dupe, und das
  Original ist immer noch da.

> >Der Vergleich wäre korrekt, wenn Du Proxy-Cache-Dateien und Dateien im  
> >Newsspool vergleichen würdest. Dann gilt aber: _Beide_ werden nicht  
> >direkt angefordert.
> 
> Den Punkt verstehe ich nicht ganz.

Gemeint ist wohl, dass man weder Dateien in einem Proxy noch Dateien im
Newsspool ihre Herkunft ohne weiteres ansehen kann. Das ist bei Bildern,
etwa wie Icon-Files aus dem WWW recht eklatant: Lade Dir, so als Beispiel,
mal ein paar Seiten etwa von Yahoo rein, dann bekommst Du jeweils auch noch
ein Werbebild mit. Das ist unverlangt und bei einem hinreichend vollen
Cache ist nicht mehr nachvollziehbar, mit welcher Seite sowas reingezogen
wurde (im Logfile von Yahoo wuerde man finden koennen, dass Host 123.4.5.67
die Seite blah.html angefordert hat und dass da ein Bild werbung98765.gif
kurz danach abgeschickt wurde, wobei werbung98765.gif zwar im HTML-Source
der Seite eingetragen wird, aber vom Yahoo-Server zur allgemeinen Belustigung
jedesmal dynamisch ausgewaehlt wird).
Jetzt stelle man sich mal spasseshalber vor, dass ein boeswilliger ServerAdmin
mal ab und zu ein Bild mit vielen hautfarbenen Pixeln auf diesem Weg
einstreut. Das arme Individuum, das die Seite anfordert, bekommt erst mal
einen Schreck, aber das Kind(-erporno) ist erstmal in den Proxy-Brunnen
gefallen. Oder: ein Hyperlink, der sagt: "Pornofreie Zone" ist anklickbar,
weil da derartiges ganz bestimmt nicht zu finden ist? Und wenn doch,
was steht dann im Cache? Durch wen? Warum?

Oder, auf News bezogen: enthaelt die Message-ID <123456789@blah.blurb>
Verbotenes? Enthaelt die Datei /var/spool/news/476/2345 obige Message ID?
Woher kam die Datei? Wer hat sie vom Newsserver mit seinem Reader 
angefordert? Wollte er/sie den Artikel bewusst lesen, oder hat der Newsreader
die Seite praeventiv geholt, weil die Leser/in die entsprechende Newsgroup
ausgewaehlt hat? Hat eigentlich jemand den Admin gefragt, ob die obige
ID vom benachbarten Newsfeed geholt werden soll? Und wenn dieser News-Knoten
kein Endpunkt ist, soll diese ID nebst Text beim Exchange einem anderen
Newshost angeboten werden? Wenn nicht, warum nicht? Und wenn der Text
(dupe!) wieder angeboten wird und in /var/spool/news/761/24066 landet, ist
er dann damit erlaubt? Sind Fremd-Cancels aus dem Netz ohne Pruefung zulaessig?
Cancelt newswatch immer gesetzeskonform, oder muss man jeden Einzelfall
pruefen? Muss man alle gecancelten IDs endlos lange aufheben, falls mal der
Cancel vor der News eintrifft und dadurch die Message nicht beim Eintreffen 
des Cancels geloescht werden kann? Expired expire cancels? Wenn ja, sollte
man selten expiren, oder? Und dann haelt ein Newsserver Daten laenger als
"ein paar Stunden"? Wieviele Koepfe muss ein Admin im Kampf gegen
eine Hydra haben?

> >> Das ist der eine Gedanke, der andere ist das Mass an Kontrolle. Ein
> >> Provider kann ganze Newsgroups bestellen oder abbestellen, und wenn man
> >> ihm IDs von fragwuerdigen Artikeln sendet, kann er die identifizieren und
> >> runterwerfen. Sie kommen dann vielleicht gleich wieder rein, aber das
> >> kann man sicher automatisieren. NewsWatch sieht doch sowas vor, oder?

Und wieder wird das Kind(-erporno) mit dem Bade ausgeschuettet...

-- 
         Dr.-Ing. Holger Veit             | INTERNET: Holger.Veit"at"gmd.de
|  |   / GMD - German National Research   | Phone: (+49) 2241 14 2448
|__|  /  Center for Information Technology| Fax:   (+49) 2241 14 2242
|  | /   Schloss Birlinghoven             |  Get XFree86/OS2 Bugfix Version
|  |/    D-53754 Sankt Augustin, Germany  |    V3.3.2 from ftp.xfree86.org
         WWW: http://borneo.gmd.de/~veit/ | /pub/XFree86/3.3.2/binaries/OS2