PageRank
PageRank (nach einem seiner Entdecker, Lawrence Page und von engl. rank - Rang) ist das von der Internet-Suchmaschine Google genutzte System für die Bewertung der gelisteten Seiten.Das Grundprinzip lautet: Je mehr Links auf eine Seite verweisen, um so wichtiger ist sie. Je wichtiger wiederum die verweisenden Seiten sind, um so größer der Effekt (Vererbung). Daraus resultiert ein PageRank von 0-10. Normale Webseiten haben einen Rank von 1-5. Wichtige oder speziell optimierte Seiten erreichen Werte von 5-7. Seiten mit einem PageRank von 8 und höher sind sehr selten, z.b. die des Weißen Hauses.
Früher hatte ein hoher PageRank eine deutlich gehobene Positionierung in den Suchergebnissen bei Google zur Folge. Nach dem Jahreswechsel 2003/2004 ist nach einigen Änderungen dieser Effekt nicht mehr so stark zu spüren. Es ist eher eine Stabilisierung der Position von hoch bewerteten Seiten in der Trefferliste zu vermerken. Dennoch bringt ein hoher PageRank Vorteile für eine Webseite. So spidert (durchsucht) Google z.B. Webseiten mit einem hohen PageRank öfter und tiefer.
Aufgrund strikter Geheimhaltung lässt sich über die genaue Funktionsweise des heutigen PageRank-Verfahrens nur spekulieren. Zudem ändert Google regelmäßig das Verfahren, um die Qualität der Suchergebnisse auf einem gleichmäßigem Niveau zu halten.
Die Form des ersten Algorithmus aus der Arbeit von Lawrence Page und Sergey Brin ist jedoch bekannt:
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
Dabei ist:
- PR(A) der PageRank einer Seite A,
- PR(Ti) der PageRank der Seiten Ti, von denen ein Link auf die Seite A zeigt,
- C(Ti) die Summe der Links auf Seite Ti und
- d ein Dämpfungsfaktor (Damping Factor), wobei 0 <= d <= 1 ist.
Der heute von Google verwendete PageRank hat sicher nicht mehr exakt diese Form, geht aber auf diese Formel zurück.
Dieses Verfahren verstärkt nebenbei einen Effekt eines "skalenfreien Netzwerks", den "Matthäus-Effekt" nach Barabási. Dieser Effekt wird in der Netzwerktheorie beschrieben. Stark vereinfacht bedeutet er: "Wer hat, dem wird gegeben." D.h. neu hinzukommende Seiten verweisen vor allem auf bereits bekannte Seiten. Diese werden dadurch schneller bekannt und ziehen mehr Links an, als unbekannte Seiten von gleicher Qualität.
Dieses sinnvolle System wird in der Praxis von Seach Engine Optimizers (SEO) oft durch Cloaking, Spamming, dem Betreiben einer Linkfarm und anderen unseriösen Methoden missbraucht, da ein höherer PageRank durchaus ansehnliche wirtschaftliche Vorteile bringen kann.