Der PageRank-Algorithmus

Der PageRank-Algorithmus wurde, 1995 bis 1998, von Larry Page und Sergey Brin an der Stanford Universität entwickelt.

Der Algorithmus beschreibt ein Verfahren, dass verlinkte Dokumente für einen Suchindex gewichtet.

Die kommerzielle Websuchmaschine Google , die zur Zeit den größten Marktanteil aufweisen kann, verwendet den PageRank-Algorithmus als Grundlage für die Bewertung der Suchergebnisse.

Er ist einer der wesentlichen Innovationen, die Google, innerhalb weniger Jahre von einer von zwei Studenten gegründeten Firma zum Milliardenunternehmen machte.

In The PageRank Citation Ranking: Bringing Order to the Web beschreibt Larry Page zwei Annahmen auf denen der Algorithmus basiert:

Web pages vary greatly in terms of the numbers of backlinks they have. For example, the Netscape home page has 62,804 backlinks in our current database compared to the most pages which have just a few backlinks. General ly, highly linked pages are more ”important” than pages with a few links. […] For example, if a web page has a link off the Yahoo home page, it may be just a link but is a very important one. This page should be ranked higher than many pages with more links but from obscure places. (Page u. a. 1998, S.3)

 

Dies bedeutet, dass Webseiten die häufig verlinkt sind „wichtiger“ angesehen werden als solche, die nur wenige Verlinkungen aufweisen. Die zweite Annahme: Seitenlinks mit einem hohen PageRank sind potenziell „wichtiger“ als Links von Seiten mit einem niedrigerem Pagerank.

Wichtigkeit wird ausdrücklich nicht definiert und ergibt sich aus den Verlinkungen. Somit kann eine Implementierung des PageRank-Algorithmus als soziale Software betrachtet werden, sofern man das setzen eines Links als soziale Interaktion betrachten möchte.

Berechnung des Pagerank

Der PageRank-Algorithmus wurde von den Google Gründern in mehreren, unterschiedlichen Varianten beschrieben. Die folgenden Erklärungen beziehen sich auf die Beschreibung in The PageRank Citation Ranking: Bringing Order to the Web (Page u. a. 1998, S.4).

Der PageRank einer Webseite u wird als R'(u) bezeichnet. Der Dämpfungsfaktor c dient zur Normalisierung und muss zwischen Null und Eins liegen. Zur Berechnung des PageRanks von u werden die PageRank-Werte aller auf u zeigender Webseiten Bu durch ihre ausgehenden Links Nv dividiert und aufsummiert.

R(U) dient lediglich zum Ausgleich von PageRank-Senken, die durch ungünstige Kombinationen von Verlinkungen entstehen können.

 

 

R'(u) = Ranking der Webseite u

R'(v) = Ranking der Webseite v

c = Dämpfungsfaktor für den gilt: 0 < c < 1

Bu = Anzahl der Seiten mit Links zur Webseite u

Nv = Anzahl der abgehenden Links von v

E(u) = Faktor zur Verhinderung von PageRank-Senken

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.