Morphy

Morphy ist ein frei verfügbares Softwarepaket für die morphologische Analyse und Synthese und die kontextsensitive Wortartenbestimmung des Deutschen. Die Verwendung der Software unterliegt keinen Beschränkungen. Da die Weiterentwicklung eingestellt worden ist, verwenden Sie Morphy as is, d.h. auf eigenes Risiko, ohne jegliche Haftung und Gewährleistung und vor allem ohne Support. Morphy ist nur für die Windows-Plattform verfügbar und nur auf Standalone-PCs lauffähig.

Morphologie und Tagging

Leistungsmerkmale

Morphologische Analyse und Synthese

  • Stammformenlexikon mit über 50.000 Einträgen (ca. 350.000 Vollformen, alte Rechtschreibung)
  • morphologische Analyse und Synthese
  • Wortklassenprognose für unbekannte Wortformen
  • interaktive Lexikonpflege zur Minimierung von Benutzereingaben

Kontextsensitive Wortartenbestimmung

  • Verwendung eines kleinen (51 Tags) und eines großen (456 Tags) Tag Sets
  • Korrektheitsraten von ca. 96% für das kleine und ca. 85% für das große Tag Set
  • hohe Robustheit gegenüber unbekannten Wortformen
  • Ermittlung des Wortstamms beim Tagging (echte Lemmatisierung)

Publikationen

  • Rapp, Reinhard; Lezius, Wolfgang (2001) Statistische Wortartenannotierung für das Deutsche Sprache und Datenverarbeitung 25(2):5-21.
  • Lezius, Wolfgang (2000) Morphy - German Morphology, Part-of-Speech Tagging and Applications in Ulrich Heid; Stefan Evert; Egbert Lehmann and Christian Rohrer, editors, Proceedings of the 9th EURALEX International Congress pp. 619-623 Stuttgart, Germany. PDF
  • Lezius, Wolfgang; Rapp, Reinhard; Wettler, Manfred (1998) A Freely Available Morphological Analyzer, Disambiguator, and Context Sensitive Lemmatizer for German in Proceedings of the COLING-ACL 1998 pp. 743-747. PDF
  • Lezius, Wolfgang (1996) Morphologiesystem Morphy in R. Hausser, editor, Linguistische Verifikation. Dokumentation zur ersten Morpholympics 1994 pp. 25-35 Niemeyer. PDF
  • Lezius, Wolfgang; Rapp, Reinhard; Wettler, Manfred (1996) A Morphology-System and Part-of-Speech Tagger for German in D. Gibbon, editor, Natural Language Processing and Speech Technology. Results of the 3rd KONVENS Conference. pp. 369-378 Mouton de Gruyter. PDF

Eine Liste aller meiner Publikationen aus dem Computerlinguistik-Bereich ist am Institut für Maschinelle Sprachverarbeitung abrufbar.

Download

  • Dokumentation: Die Wortklassensysteme von Morphy - wklassen.pdf

Vollformenlexikon

Daniel Naber stellt auf seiner Homepage u.a. ein Vollformenlexikon und eine Lemmatisierungdatei zum Download zur Verfügung, die mit Hilfe von Morphy generiert worden ist. Das Vollformenlexikon berücksichtigt dabei sogar die neue Rechtschreibung!

Installationshinweise

Starten Sie die Installation durch Anklicken des Programms mosetup.exe. Die Windows-Applikation InstallShield führt Sie durch den Installationsvorgang. Eine Deinstallation ist jederzeit über Systemsteuerung-Software möglich.

Da die Installationsdatei unter einer älteren Windows-Version (Windows 95/98) erzeugt worden ist, gibt es gelegentlich Probleme bei der Installation auf einer neueren Windows-Version. In diesem Falle gehen Sie folgendermaßen vor (Dank an Tom Gelhausen für diesen Workaround!):

  1. Temporäres Verzeichnis identifizieren.
  2. mosetup.exe starten und nach dem Absturz abbrechen (Taskmanager).
  3. In das temporäre Verzeichnis wechseln und die Datei setup.exe im Windows95-Kompatibilitätsmodus starten (Rechtsklick - Eigenschaften - Kompatibilität).
  4. Mit Standardeinstellungen installieren.

FAQs

Lizenzfragen

  • F: Ich möchte Daten, die ich mit Hilfe von Morphy erzeugt habe, anderen Nutzern im Netz zur Verfügung stellen. Sehen Sie hier Restriktionen vor?
    A: Die aus Morphy exportieren Textdateien unterliegen der Creative-Commons-Lizenz Attribution-Share Alike 4.0.
  • F: Ich möchte Morphy in einem kommerziellen Umfeld einsetzen. Was sind Ihre Bedingungen für einen solchen Einsatz?
    A: Sie können Morphy gern kostenlos in einem kommerziellen Umfeld einsetzen. Beachten Sie aber, dass ich keine Haftung oder Gewährleistung und auch keinen Support übernehmen kann. Über einen Link auf diese Seite innerhalb Ihres Projekts würde ich mich sehr freuen.
  • F: Ich bin am Quellcode von Morphy interessiert. Unter welchen Bedingungen sind Sie bereit, diesen freizugeben? Ich würde den Quellcode ggf. auch als OpenSource-Projekt weiterentwickeln.
    A: Eine Weitergabe des Quellcodes ist aus lizenzrechtlichen Gründen nicht möglich.

Anwendungen von Morphy

  • F: Ist eine Portierung der Software auf Unix geplant?
    A: Nein. Morphy ist unter Delphi realisiert worden und damit plattformenabhängig. Um auch die Unix-User zu unterstützen, steht eine Export-Funktion zur Verfügung, mit deren Hilfe eine Vollformenliste aus Morphy erzeugt werden kann. Schickt man diese Liste nun durch die Morphologische Analyse, wird aus der Vollformenliste ein Vollformenlexikon. Durch die Konfigurierbarkeit von Export und Morphologischer Analyse ist das generierte Lexikon individuell anpassbar.
  • F: Ich möchte mit Morphy gern eine Reihe von Dateien analysieren oder taggen. Kann ich dazu Morphy auch im Kommandozeilen-Modus aufrufen?
    A: Leider nicht. Binden Sie stattdessen (z.B. mit einem Perl-Skript) Ihre Texte zu einem Korpus zusammen, markieren Sie die Übergänge mit einem Trennwort (z.B. HierTrenner). Analysieren Sie nun das Korpus und nehmen die Analysen anhand der Trenner wieder auseinander.
  • F: Ich habe ein eigenes Tagset entworfen oder möchte mit einem anderen Tagset (z.B. STTS-Tagset) arbeiten. Ist das möglich?
    A: Leider nicht. Die Komponenten Morphologie und Tagging von Morphy arbeiten Hand in Hand und können nicht getrennt werden.

Technische Probleme

  • F: Ich habe Morphy ordnungsgemäß installiert, es lässt sich aber nicht starten. Woran kann es liegen?
    A: Morphy bereitet Probleme im Netzwerk-Betrieb. Installieren Sie die Software auf einer lokalen Festplatte.
  • F: Ich kann die Installation von Morphy nicht ordnungsgemäß durchführen, das Installationsprogramm stürzt beim Installationsvorgang ab.
    A: Morphy wurde ursprünglich unter Windows 95/98 entwickelt. Sie verwenden eine neuere Windows-Version. Bitte lesen Sie die Installationshinweise.