Morphy
Morphy ist ein frei verfügbares Softwarepaket für die morphologische Analyse und Synthese und die kontextsensitive Wortartenbestimmung des Deutschen.
Die Verwendung der Software unterliegt keinen Beschränkungen. Da die Weiterentwicklung eingestellt worden ist, verwenden Sie Morphy as is, d.h. auf eigenes Risiko, ohne jegliche Haftung und Gewährleistung und vor allem ohne Support. Morphy ist nur für die Windows-Plattform verfügbar und nur auf Standalone-PCs lauffähig.
Leistungsmerkmale
Morphologische Analyse und Synthese
Stammformenlexikon mit über 50.000 Einträgen (ca. 350.000 Vollformen, alte Rechtschreibung)
morphologische Analyse und Synthese
Wortklassenprognose für unbekannte Wortformen
interaktive Lexikonpflege zur Minimierung von Benutzereingaben
Kontextsensitive Wortartenbestimmung
Verwendung eines kleinen (51 Tags) und eines großen (456 Tags) Tag Sets
Korrektheitsraten von ca. 96% für das kleine und ca. 85% für das große Tag Set
hohe Robustheit gegenüber unbekannten Wortformen
Ermittlung des Wortstamms beim Tagging (echte Lemmatisierung)
Publikationen
Lezius, Wolfgang (2000) Morphy - German Morphology, Part-of-Speech Tagging and Applications in Ulrich Heid; Stefan Evert; Egbert Lehmann and Christian Rohrer, editors, Proceedings of the 9th EURALEX International Congress pp. 619-623 Stuttgart, Germany.
PDF
Lezius, Wolfgang; Rapp, Reinhard; Wettler, Manfred (1998) A Freely Available Morphological Analyzer, Disambiguator, and Context Sensitive Lemmatizer for German in Proceedings of the COLING-
ACL 1998 pp. 743-747.
PDF
Lezius, Wolfgang (1996) Morphologiesystem Morphy in R. Hausser, editor, Linguistische Verifikation. Dokumentation zur ersten Morpholympics 1994 pp. 25-35 Niemeyer.
PDF
Lezius, Wolfgang; Rapp, Reinhard; Wettler, Manfred (1996) A Morphology-System and Part-of-Speech Tagger for German in D. Gibbon, editor, Natural Language Processing and Speech Technology. Results of the 3rd KONVENS Conference. pp. 369-378 Mouton de Gruyter.
PDF
Eine Liste aller meiner Publikationen aus dem Computerlinguistik-Bereich ist am Institut für Maschinelle Sprachverarbeitung abrufbar.
Download
Dokumentation: Die Wortklassensysteme von Morphy -
wklassen.pdf
Daniel Naber stellt auf seiner Homepage u.a. ein Vollformenlexikon und eine Lemmatisierungdatei zum Download zur Verfügung, die mit Hilfe von Morphy generiert worden ist. Das Vollformenlexikon berücksichtigt dabei sogar die neue Rechtschreibung!
Installationshinweise
Starten Sie die Installation durch Anklicken des Programms mosetup.exe. Die Windows-Applikation InstallShield führt Sie durch den Installationsvorgang. Eine Deinstallation ist jederzeit über Systemsteuerung-Software möglich.
Da die Installationsdatei unter einer älteren Windows-Version (Windows 95/98) erzeugt worden ist, gibt es gelegentlich Probleme bei der Installation auf einer neueren Windows-Version. In diesem Falle gehen Sie folgendermaßen vor (Dank an Tom Gelhausen für diesen Workaround!):
Temporäres Verzeichnis identifizieren.
mosetup.exe starten und nach dem Absturz abbrechen (Taskmanager).
In das temporäre Verzeichnis wechseln und die Datei setup.exe im Windows95-Kompatibilitätsmodus starten (Rechtsklick - Eigenschaften - Kompatibilität).
Mit Standardeinstellungen installieren.
FAQs
Lizenzfragen
F: Ich möchte Daten, die ich mit Hilfe von Morphy erzeugt habe, anderen Nutzern im Netz zur Verfügung stellen. Sehen Sie hier Restriktionen vor?
A: Die aus Morphy exportieren Textdateien unterliegen der Creative-Commons-Lizenz
Attribution-Share Alike 3.0.
F: Ich möchte Morphy in einem kommerziellen Umfeld einsetzen. Was sind Ihre Bedingungen für einen solchen Einsatz?
A: Sie können Morphy gern kostenlos in einem kommerziellen Umfeld einsetzen. Beachten Sie aber, dass ich keine Haftung oder Gewährleistung und auch keinen Support übernehmen kann. Über einen Link auf diese Seite innerhalb Ihres Projekts würde ich mich sehr freuen.
Anwendungen von Morphy
F: Ist eine Portierung der Software auf Unix geplant?
A: Nein. Morphy ist unter Delphi realisiert worden und damit plattformenabhängig. Um auch die Unix-User zu unterstützen, steht eine Export-Funktion zur Verfügung, mit deren Hilfe eine Vollformenliste aus Morphy erzeugt werden kann. Schickt man diese Liste nun durch die Morphologische Analyse, wird aus der Vollformenliste ein Vollformenlexikon. Durch die Konfigurierbarkeit von Export und Morphologischer Analyse ist das generierte Lexikon individuell anpassbar.
F: Ich möchte mit Morphy gern eine Reihe von Dateien analysieren oder taggen. Kann ich dazu Morphy auch im Kommandozeilen-Modus aufrufen?
A: Leider nicht. Binden Sie stattdessen (z.B. mit einem
Perl-Skript) Ihre Texte zu einem Korpus zusammen, markieren Sie die Übergänge mit einem Trennwort (z.B. HierTrenner). Analysieren Sie nun das Korpus und nehmen die Analysen anhand der Trenner wieder auseinander.
Technische Probleme