Oktober 7 2008

Der PageRank-Algorithmus

0  kommentare

Der PageRank-Algorithmus wurde, 1995 bis 1998, von Larry Page und Sergey Brin an der Stanford Universität entwickelt. Der Algorithmus beschreibt ein Verfahren, dass verlinkte Dokumente für einen Suchindex gewichtet. Die kommerzielle Websuchmaschine Google , die zur Zeit den größten Marktanteil aufweisen kann, verwendet den PageRank-Algorithmus als Grundlage für die Bewertung der Suchergebnisse. Er ist einer der wesentlichen Innovationen, die Google, innerhalb weniger Jahre von einer von zwei Studenten gegründeten Firma zum Milliardenunternehmen machte. In The PageRank Citation Ranking: Bringing Order to the Web beschreibt Larry Page zwei Annahmen auf denen der Algorithmus basiert:
Web pages vary greatly in terms of the numbers of backlinks they have. For example, the Netscape home page has 62,804 backlinks in our current database compared to the most pages which have just a few backlinks. General ly, highly linked pages are more ”important” than pages with a few links. [...] For example, if a web page has a link off the Yahoo home page, it may be just a link but is a very important one. This page should be ranked higher than many pages with more links but from obscure places. (Page u. a. 1998, S.3)
Dies bedeutet, dass Webseiten die häufig verlinkt sind "wichtiger" angesehen werden als solche, die nur wenige Verlinkungen aufweisen. Die zweite Annahme: Seitenlinks mit einem hohen PageRank sind potenziell "wichtiger" als Links von Seiten mit einem niedrigerem Pagerank. Wichtigkeit wird ausdrücklich nicht definiert und ergibt sich aus den Verlinkungen. Somit kann eine Implementierung des PageRank-Algorithmus als soziale Software betrachtet werden, sofern man das setzen eines Links als soziale Interaktion betrachten möchte.

Berechnung des Pagerank

Der PageRank-Algorithmus wurde von den Google Gründern in mehreren, unterschiedlichen Varianten beschrieben. Die folgenden Erklärungen beziehen sich auf die Beschreibung in The PageRank Citation Ranking: Bringing Order to the Web (Page u. a. 1998, S.4). Der PageRank einer Webseite u wird als R'(u) bezeichnet. Der Dämpfungsfaktor c dient zur Normalisierung und muss zwischen Null und Eins liegen. Zur Berechnung des PageRanks von u werden die PageRank-Werte aller auf u zeigender Webseiten Bu durch ihre ausgehenden Links Nv dividiert und aufsummiert. R(U) dient lediglich zum Ausgleich von PageRank-Senken, die durch ungünstige Kombinationen von Verlinkungen entstehen können. R'(u) = Ranking der Webseite u R'(v) = Ranking der Webseite v c = Dämpfungsfaktor für den gilt: 0 < c < 1 Bu = Anzahl der Seiten mit Links zur Webseite u Nv = Anzahl der abgehenden Links von v E(u) = Faktor zur Verhinderung von PageRank-Senken

Veröffentlicht in Softwareentwicklung am 7. Oktober 2008

Über Jens Jäger.

Meine Mission ist es, den Unternehmens-Impact, meiner Kunden durch agile Softwareprojekte zu steigern:

  • Digitale Transformation ankurbeln.
  • Routineaufgaben automatisieren.
  • Freiraum für Innovation schaffen.

Das könnte dich auch interessieren

Learnings vom Java Forum Stuttgart 2023

Wie letztes Jahr waren wir wieder beim Java Forum Stuttgart. Diesmal war die JSE  mit fünf Mitarbeitern auf der Konferenz vertreten.Das waren unsere wichtigsten Erkenntnisse:Allgemein:Das Java Forum Stuttgart ist jedes mal wieder ein grandioses Community Event. Man kann der Java User Group Stuttgart nur ein absolutes Lob für die mega Organisation aussprechen. Respekt das ein gemeinnütziger

Read More

Learnings vom Java Forum Stuttgart 2022

Das Java Forum Stuttgart hat schon zum 25ten mal stattgefunden und war ein super Event! Folgende Erkenntnisse haben wir von der Konferenz mitgenommen:Softwarearchitektur:Erst Qualitätsanforderungen definieren, dann die Architekturentscheidungen treffen.Conference Driven Development vermeiden (wenn man was cooles auf einer Konferenz gesehen hat und dann sofort in seine Projekte einbaut)Dokumentation als Code: z.B. mit Doctoolchain. Damit kann

Read More

Meine Learnings von der der Contra 2022

Nachdem die letzten beiden Jahre die meisten großen Veranstaltungen ausgefallen sind. War ich zwei Tage in Düsseldorf auf der Contra. Der Konferenz für Conversion und Traffic. Vor zwei Jahren habe ich mir die Vorträge von der Contra im Stream angeschaut. Dazu habe ich einen ausführlichen Blogpost geschrieben: Online-Marketing Trends 2020. Nachdem seit einiger Zeit wieder

Read More

Du möchtest mit mir zusammenarbeiten? 

Werde ein Teil unseres Teams: