Maddraxikon:Forschungsarbeit

Aus Maddraxikon

Das Maddraxikon ist momentan Bestandteil einer Forschungsarbeit in der Data Science.

Hintergrund

Im Maddraxikon sind mit aktuellem Stand rund 1600 Personen-Artikel eingepflegt. Zur korrekten Annotation des Geburts- und evtl. auch des Sterbedatums müssen mühselig sämtliche Artikel nach den entsprechenden Informationen durchsucht werden um diese dann in der Infobox einzutragen.
In einem Experiment wird nun versucht alle noch nicht mit semantisch annotiertem Geburts- und Sterbejahr versehenen Artikel mittels eines Algorithmus aus der Data Science auf bestimmte Wörter zu prüfen und sie eindeutig zu klassifizieren in Artikel. Dabei sollen Artikel mit noch nicht annotierten, aber im Fließtext vorhandenen Daten gefunden werden. Als Ergebnis soll dadurch eine Liste entstehen, die dann nur noch händisch abgearbeitet werden muss. Diese Liste wird uns dann bei Erfolg freundlicherweise zur Verfügung gestellt.