Juli 31 2008

Stammformreduktion

2  kommentare

Als Stammformreduktion bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden. So sollen bei einer Suche nach test auch Ergebnisse zu finden sein, die zum Beispiel die Begriffe tested, tests oder testing enthalten. Zur Stammformreduktion gibt es unterschiedliche Algorithmen für verschiedene Sprachen. Die Entwicklung eines Algorithmus zur Stammformreduktion ist eine experimentelle Wissenschaft, da dieser nicht mathematisch verifiziert werden kann, sondern an realen Texten getestet werden muss. Man verfolgt mit der Stammformreduktion zwei Ziele:
  1. Durch das Zusammenführen verschiedener Wortformen zu einem Wort tritt dieses tendenziell häufiger auf. Es sollten deshalb mehr Dokumente bei einem Suchbegriff gefunden werden.
  2. Durch die Zusammenführung verschiedener Wortformen zu Einem, werden Listen mit Verweisstrukturen auf die zu indizierenden Dokumente kleiner, da weniger Wörter verwaltet werden müssen.
Stammformreduktion ist immer sprachenabhängig, da je nach Sprache unterschiedliche grammatikalische Regeln für Wortkomposition, Flexion und das Hinzufügen von Affixen (Präfix, Suffix und Infix) gelten, die unterschiedliche Algorithmen erfordern.

Über Jens Jäger.

Meine Mission ist es, den Unternehmens-Impact, meiner Kunden durch agile Softwareprojekte zu steigern:

  • Digitale Transformation ankurbeln.
  • Routineaufgaben automatisieren.
  • Freiraum für Innovation schaffen.

Das könnte dich auch interessieren

Es gibt ein Social Network nur für KI-Agenten

Es gibt ein Social Network nur für KI-Agenten (nein nicht LinkedIn 🙂  Und die haben bereits eine Religion gegründet.Moltbook heißt die Plattform. Sie ist ein Reddit-Nachbau, aber nur für KI-Agenten. Menschen können mitlesen, aber nicht posten. Nur über die API können KI-Agenten dort aktiv werden. Und was machen die Agenten dort? Sie posten massenhaft und

Read More

Ohne zuverlässige Zeiterfassung kein Wachstum. Das haben wir am eigenen Leib erlebt …

Ohne zuverlässige Zeiterfassung kein Wachstum. Das haben wir am eigenen Leib erlebt … … denn wir haben zwischen Excel-Tabellen und externen Tätigkeitsberichten die Übersicht verloren. So hat sich der fehlende Überblick für uns ausgewirkt: ⏳ Nicht jede Arbeitsstunde wurde verrechnet. Wir haben abgeliefert, aber manchmal zu wenig Geld verlangt. ⏰ Doppelte Zeiterfassung hat unsere Produktivität gestört. Es hat uns genervt, die benötigte

Read More

Learnings vom Java Forum Stuttgart 2025

Dieses Jahr war ich mit einem Teil des JSE Teams wieder auf dem Java Forum Stuttgart: Grandioses Event. Super Vorträge. Spitzen Orga. Mega Essen. Networking vom feinsten.Hier sind meine Keytakeaways:KIKI ist Mainstream, jeder nutzt inzwischen KI-Tools.Kontext ist wichtig. Um so mehr Kontext um so besser die Ergebnisse von KI.KI halluziniert: KI spart wenn richtig eingesetzt

Read More

Du möchtest täglich 2-3 Stunden mehr für deine wichtigsten Aufgaben