Neu: Översetter - ein vielversprechender Anfang
(Thema des Tages vom 09.06.2020)
Aufruf zur Mithilfe
Plattdeutsch - ist es möglich dem Computer die gefährdete Sprache beizubringen?
Der Översetter unternimmt zumindest den ersten Schritt mit dem ersten speziell entwickeltem Tool, das hochdeutsche Sätze ins Plattdeutsche übersetzen kann. Die Grundlage des Översetters hat Marcel Meyer innerhalb von vier Wochen als Abschlussprojekt des Bootcamps Data Science bei neuefische GmbH programmiert. Für die Übersetzung wird ein künstliches neuronales Netz eingesetzt (Neural Machine Translation). Die größte Herausforderung ist jedoch die Datenbasis. Für gute Übersetzungen werden möglichst viele hochqualitative hochdeutsch-plattdeutsch Satzpaare benötigt. Der Översetter arbeitet derzeit mit den öffentlich zugänglichen Datenquellen Tatoeba.org (Nutzungslizenz CC BY 2.0 FR) und der Satzpaar-KollektionWikiMatrix (Wissenschaftliches Paper).
Falls ihr weitere Daten zum Training des Algorithmus zur Verfügung stellen könnt, freuen wir uns sehr! Bitte einfach eine E-Mail an an.marcel.meyer@gmail.com senden. Weiterhin kann der Algorithmus durch die Schoolmeester-Funktion verbessert werden, indem die Übersetzungen korrigiert werden.
Plattdeutsch lebt im Alltag durch die Gemeinschaft - diesen Gedanken greift der Översetter auf und stellt den Code offen auf Github zur Verfügung. Jeder der Interesse hat, ist herzlich eingeladen an diesem Projekt mitzuarbeiten. Sei es die Übersetzungen oder den Code zu verbessern oder das Projekt allgemein zu unterstützen.
Hier gehts zum oeversetter.de/