[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Die Datenmenge ist sauber definierbar



Holger Veit obskurierte:
(...)
>gutes Beispiel: Dein ganzes tolles RAID-Speichern nuetzt Dir einen Dreck, wenn
>bereits die Informationen Muell sind. Es gibt kein Wahrheits-PICS, welches

Nicht Wahrheit, sondern DEUT.

>die Qualitaet der Information bewertet. Beim Nachdenken, angeregt durch Wau
>letzte Woche, ueber das Weltkulturerbe, ist mir dieses klargeworden: gesetzt
>den Fall, man will jenes obskure Weltkulturerbe sichern, dann muss man es
>definieren, und wird auf diese Art und Weise entweder dazu kommen, dass man

Man kann Definitionen, Abgrenzungen dokumentieren.
Die Definition "Part of Library of Congress, USA at date"
ist eine exakte Filterbeschreibung. Sie ist historisch
auch dann halbwegs sauber definierbar, wenn Verbrennung
von Buechern in den USA zB bei Wilhelm Reich geschah und
ich recht neugierig bin, was von Reich in der LoC ist; dito
fuer Tesla ;-)

Bei "was URL ...  at time ... observed by at least one named
witness, better three" wird es schon schwieriger. Beispiel:
Die Vertragsvereinbarung mit Schulbuchverlag zwecks
Uebernahme von http://www.ccc.de/ALL.ALL
(ich weiss keine bessere Schreibweise)
auf eine CD-ROM war nicht ganz trivial.
Denn einerseits koennen wir nicht auch noch das
Zeitfenster und die Absaugtechnik kontrollieren
(Zeitaufwand nicht leistbar) und andererseits waere
es schon zB ein Problem, wenn ausgerechnet die paar
Stunden dokumentiert waeren, wo wegen eines
Eingabefehlers auf der Hauptseite www.ccc.de die
Forumulierung "dumme Justiz" stand (eher harmlos).
"Problem" meint hier im Extremfall aus irgendwelchen
sonstigen Seiten herruehrende haftungsrechtliche Folgen;
ich nenne nur Zarenweichen-Gravenierungen zum Bleistift.

>alles speichert, was irgendwie vor eine Scannerzeile, ein Kameraauge oder ein
>Mikrophon passt, inklusive des "Drecks", oder man muss filtern und Information
>in die Kategorien "wertvoll" bzw. "wertlos" einsortieren. Der Aufwand fuer
>letzteres ist immens; im anderen Falle haben wir moeglicherweise 99.999%
>redundant gespeicherten Muell (->Bibliothek von Babel).

Pessimale Betrachtung kann durch geeignete Definitionen
optimiert werden (Lib of Congr, Dt Bibliothek, KGB-Archiv
mit den Tagebuechern von Erich Muehsam, die seine Geliebte
Zenzl dummerweise ausgerechnet denen gab und die AFAIK
dort noch schlummern uswusf).

Die Informationsmenge auf Texte und Bilder bezogen,
deren Autor seit mehr als 70 Jahren tot ist, umfasst nur
den niedrigen Terabytebereich. Diese Datenmenge hat
zB Bill Gates finanziell zu unterstuetzen, aber nicht zu
verwerten.

Diese erhoeht sich auch dann nicht wesentlich, wenn zu
den Bibliotheksdaten komplexe 3-D-Daten hinzugenommen
werden, wie sie zB das Museum in Ottawa scannt und
speichert samt exzellenter Farbdaten (bunt anlasern
und Reflektionen messen).

Der Job ist eingrenzbar und durchfuehrbar.

Die Kenntnis der hier genannten Unwaegbarkeiten
gehoert hinzu. Ich habe nicht die Zeit, mich um das
Detail "Tagebuecher Erich Muehsam" zu kuemmern,
obwohl ich sie seit ca. 25 Jahren lesen will. Es ist
aber ein Zeitpunkt definierbar, ab dem zB diese
Information entweder zugaenglich ist oder der KGB
sagt "pardon, haben wir leider vernichtet;
hier sind Dokumente und Verantwortliche
des Vernichtungsvorgangs".

wau

Und nun ein Instant-Gedicht (kein Weltkulturerbe):
--
Selbst Zaren weichen Warenzeichen
wenn Jurograven Tinte spucken
und BRAG-Oleum goldig schlucken.
Geld aus Jauche ist sein Adel? Tadel!