Besonders im Dokumentenmanagement ist diese Methode unverzichtbar. Sie ist ein zentraler Baustein jeder Suchlösung, die mit unsauberen Daten, unterschiedlichen Schreibweisen oder transkribierten Namen umgehen muss. So findet man Kundennamen, Produktbezeichnungen oder Adressen – selbst bei falscher Eingabe.
Was ist die Phonetische Suche?
Die Phonetische Suche ist die Technologie, die Tippfehler verzeiht. Im Gegensatz zur starren Volltextsuche, die nach exakten Begriffen sucht, orientiert sich dieses phonetische Suchverfahren am Klang eines Wortes.
Wie funktioniert phonetisches Suchen?
Der Mechanismus basiert auf einem sogenannten Phonetik-Code (Klangcode). Das System vergleicht nicht direkt den Suchbegriff mit dem indizierten Wort. Stattdessen werden sowohl der Suchbegriff als auch alle Wörter im Index in einen alphanumerischen Code übersetzt. Dieser Code repräsentiert den Klang des jeweiligen Wortes – und bildet die Basis für die Suche.
Die Phonetische Suche erfolgt dann ausschließlich über den Vergleich dieser Codes.
Phonetik-Codes: Der Schlüssel zur Fehlertoleranz
Buchstaben mit ähnlichem Klang erhalten denselben Code. Vokale erhalten häufig den Null-Code, da sie die Aussprache nur gering beeinflussen, aber oft Quelle von Schreibfehlern sind. So entsteht ein Match, auch wenn die Schreibweise im Dokument abweicht.
gängige Mechanismen: Kölner Phonetik
International ist der Algorithmus Soundex bekannt. Im deutschsprachigen Raum hat sich jedoch die Kölner Phonetik als Standard etabliert. Diese Methode ist auf die Besonderheiten der deutschen Aussprache optimiert.
Die Kölner Phonetik übersetzt ein Wort in eine Zahlenfolge. Jede Zahl steht für einen bestimmten Laut:
| Buchstabe(n) | Code | Repräsentierter Klang | Beispiel für Zuordnung |
| Vokale (A, E, I, O, U, Y) | 0 | Kein relevanter Konsonantenklang | Vokale werden ignoriert. |
| C, Z, S (vor A, O, U) | 8 | S- und Zisch-Laute | Cesare, Zeit, Sache |
| D, T | 2 | T- und D-Laute | Dokument, Text |
| G, K, Q | 4 | G-, K-Laute | Gut, Kunde, Quelle |
Beispiel: Die Suche nach dem Code
Die verschiedenen Schreibweisen des Namens “Maier” erhalten durch die Kölner Phonetik denselben Code:
| Name | Übersetzungsschritte | Finaler Code |
| Meier | M (6) – E(0) – I(0) – E(0) – R(7) | 67 |
| Mayer | M (6) – A(0) – Y(0) – E(0) – R(7) | 67 |
| Maier | M (6) – A(0) – Y(0) – E(0) – R(7) | 67 |
Das Suchverfahren sucht nur nach dem Code 67 im Index. So findet es alle Varianten und stellt sicher, dass die richtige Kundenakte angezeigt wird.
Vorteile im Unternehmensalltag
Die phonetische Suche gleicht im Enterprise Content Management die natürlichen Schwächen menschlicher Dateneingabe aus:
- Höhere Trefferquote: Schreibfehler sind kein Ausschlusskriterium mehr.
- Fehlertoleranz: Abweichende Schreibweisen von Namen, Firmen oder Produkten werden zuverlässig erkannt.
- Bessere Nutzererfahrung: Die Suche ist intuitiver. Der Mitarbeiter muss nicht wissen, wie der Name im System hinterlegt wurde.
Die Phonetische Suche ergänzt die starre Volltextsuche ideal um die Ebene der Fehlertoleranz. Sie ist jedoch keine semantische Suche – sie erkennt den Klang, nicht die Bedeutung oder den Kontext.
