Juli 31 2008

Stammformreduktion

2  kommentare

Als Stammformreduktion bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden. So sollen bei einer Suche nach test auch Ergebnisse zu finden sein, die zum Beispiel die Begriffe tested, tests oder testing enthalten. Zur Stammformreduktion gibt es unterschiedliche Algorithmen für verschiedene Sprachen. Die Entwicklung eines Algorithmus zur Stammformreduktion ist eine experimentelle Wissenschaft, da dieser nicht mathematisch verifiziert werden kann, sondern an realen Texten getestet werden muss. Man verfolgt mit der Stammformreduktion zwei Ziele:
  1. Durch das Zusammenführen verschiedener Wortformen zu einem Wort tritt dieses tendenziell häufiger auf. Es sollten deshalb mehr Dokumente bei einem Suchbegriff gefunden werden.
  2. Durch die Zusammenführung verschiedener Wortformen zu Einem, werden Listen mit Verweisstrukturen auf die zu indizierenden Dokumente kleiner, da weniger Wörter verwaltet werden müssen.
Stammformreduktion ist immer sprachenabhängig, da je nach Sprache unterschiedliche grammatikalische Regeln für Wortkomposition, Flexion und das Hinzufügen von Affixen (Präfix, Suffix und Infix) gelten, die unterschiedliche Algorithmen erfordern.

Über Jens Jäger.

Meine Mission ist es, den Unternehmens-Impact, meiner Kunden durch agile Softwareprojekte zu steigern:

  • Digitale Transformation ankurbeln.
  • Routineaufgaben automatisieren.
  • Freiraum für Innovation schaffen.

Das könnte dich auch interessieren

Learnings vom Java Forum Stuttgart 2023

Wie letztes Jahr waren wir wieder beim Java Forum Stuttgart. Diesmal war die JSE  mit fünf Mitarbeitern auf der Konferenz vertreten.Das waren unsere wichtigsten Erkenntnisse:Allgemein:Das Java Forum Stuttgart ist jedes mal wieder ein grandioses Community Event. Man kann der Java User Group Stuttgart nur ein absolutes Lob für die mega Organisation aussprechen. Respekt das ein gemeinnütziger

Read More

Learnings vom Java Forum Stuttgart 2022

Das Java Forum Stuttgart hat schon zum 25ten mal stattgefunden und war ein super Event! Folgende Erkenntnisse haben wir von der Konferenz mitgenommen:Softwarearchitektur:Erst Qualitätsanforderungen definieren, dann die Architekturentscheidungen treffen.Conference Driven Development vermeiden (wenn man was cooles auf einer Konferenz gesehen hat und dann sofort in seine Projekte einbaut)Dokumentation als Code: z.B. mit Doctoolchain. Damit kann

Read More

Meine Learnings von der der Contra 2022

Nachdem die letzten beiden Jahre die meisten großen Veranstaltungen ausgefallen sind. War ich zwei Tage in Düsseldorf auf der Contra. Der Konferenz für Conversion und Traffic. Vor zwei Jahren habe ich mir die Vorträge von der Contra im Stream angeschaut. Dazu habe ich einen ausführlichen Blogpost geschrieben: Online-Marketing Trends 2020. Nachdem seit einiger Zeit wieder

Read More

Du möchtest mit mir zusammenarbeiten? 

Werde ein Teil unseres Teams: