[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: WebBlockfragen



Hallo Kai!

> w=E4re es technisch und konzeptionell (neben der Absurdit=E4t und den M=E4=
> ngeln)
> eigentlich machbar, da=DF man den Filter-Firewallrechner mit Webagenten-
> oder robots und einer Textanalysesoftware koppelt ?

Ja, sowas waere dummerweise sogar einigermassen einfach baubar, ohne
allzu viel Traffic zu verursachen. Man stelle sich eine Firewall zu,
die WWW-Requests folgendermassen behandelt:

1. Extrahiere URL
2. Frage Datenbank ob URL in Sperrliste
   falls ja, wenn Protokollflag in Datenbank gesetzt Zugriff vermerken.
   "Referer"-Info in Pruefliste aufnehmen.
   Abbruch.
3. (URL nicht blockiert)
   Hole Link und reiche ihm zum Benutzer weiter. Nehme Link in Pruefliste
   auf. Nehme Benutzerinfo und Link in temporaere Benutzerdatenbank auf.

Und dann gibt es da noch einen Pruefprozess der asynchron mitlaeuft:

Solange Pruefliste nichtleer, lese Link und Folgeseiten bis zu bestimmter
Baumtiefe. Textanalyse. Bei "Treffer" Speicherung in Sperrliste, Klassi-
fizierung (warum gesperrt), abhaengig von Klasse Setzen des Protokollflags.

Falls nicht "Treffer", also Seite nicht als "kritisch" eingestuft wird,
URL verwerfen und Benutzerinfo/Link aus der temporaeren Benutzerdatenbank
wieder streichen.

Ab und zu werden dann die in der temporaeren Benutzerdatenbank haengenge-
bliebenen Benutzer/URL-Tupel in eine "auswertbare" groessere Datenbank
umgelagert.



Tjaaa... mir faellt da erstmal auf Anhieb nicht viel ein was technisch
bei einem solchen Projekt schwierig waere. Es faellt noch nichtmal allzu-
sehr auf, weil es ja immer nur dann Daten holt wenn ein Benutzer das an-
fordert, bzw. andersrum kann der Pruefprozess ja sein Aktivitaetsschema
dem normalen Lastprofil angleichen.

Zum Nutzer hin faellt das ganze nicht auf: Er bekommt im Zweifelsfall alles
was er haben will wenn es noch nicht in der Sperrliste steht. URLs werden
immer nur nachtraeglich gespeert aus der Sicht eines Nutzers, der aber
dann auch direkt als "auffaellig geworden" in der Datenbank steht. Der
Vorteil aus Betreibersicht ist, dass ein solcher "Web-Filter" keine
Initialkonfiguration braeuchte, sondern einfach evolutionaer wachsen koennte.


Ziemlich erschreckendes Szenario.

Daniel

-- 
...... Daniel Roedding .... daniel@fiction.pb.owl.de ......... DR12-RIPE ......
................. Padertown City .............. +49 5251 541965 (AB) ..........