[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Altavista Patente



PILCH Hartmut <phm@a2e.de> writes:

>      o a Web information table, stored in RAM (random access memory),

Das Patent dreht sich im wesentlichen darum, mittels dieser Tabelle
unnötige Festplattenzugriffe zu verhindern. Dieser Ansatz hat eine
ganze Reihe von Nachteilen, die vielleicht 1994 noch nicht so
offensichtlich waren (er skaliert in der Praxis wohl nicht so
richtig). Ich wäre mir gar nicht sicher, ob sich diese Tabelle
heutzutage noch lohnt. Auch ist bei Suchmaschinen neueren Typs die
Frage, ob ein URL bereits indiziert wurde oder nicht, mit Sicherheit
nicht der Flaschenhals.

Es gibt allerdings einige Forderungen, die so schwammig formuliert
sind, daß sie bei hinreichender Abstraktion praktisch jeden Webcrawler
betreffen, aber auch hier gibt es sehr effiziente Implementationen,
die mit dem beschriebenen Verfahren höchstens die Wirkung gemeinsam
haben.