Using the Classical Language Toolkit (Graz, November 6, 2019)

Posted on behalf of Sarah Lang:

I would like to invite you to participate in the workshop “Using the Classical Language Toolkit” at Centre for Information Modelling (ZIM) in Graz on the 6th of November 2019.

Find the German and English information below and also please consult this link if interested:

In diesem Workshop wird das Classical Language Toolkit (CLTK) vorgestellt. Es handelt sich dabei um ein Toolkit, das auf Pythons Natural Language Toolkit (NLTK) aufbaut und Funktionalitäten zur natursprachlichen Verarbeitung historischer Sprachen anbietet. Im Gegensatz zu modernen Sprachen liegen im Falle der klassischen Sprachen nur deutlich kleinere Korpora vor, was die automatische Verarbeitung erschwert. Hinzukommt der Umstand, dass die Rohdaten nicht notwendigerweise grammatikalisch und orthographisch normalisiert sind. Der Workshop zeigt die Möglichkeiten auf, die das CLTK zur Verfügung stellt, und bietet eine praktische Einführung in die Anwendung anhand des Beispiels von De re coquinaria. Der Fokus liegt besonders auf Latein, der Sprache, die im Toolkit als erste entwickelt wurde und wohl am besten erschlossen ist. Frühneuhochdeutsch soll als Anwendungsfall einer im Projekt noch weniger tief erschlossenen Sprache vorgestellt und die Übertragbarkeit des Toolkits auf diese diskutiert und erprobt werden.

Der Workshop wird auf das im Abstract genannte Textmaterial fokussieren, Interessierte sind aber prinzipiell willkommen! Von Akkadisch, Altgriechisch und Altnordisch, über Altenglisch, Mittelhochdeusch und Sanskrit bishin zu Urdu bietet das CLTK eine weite Auswahl an Sprachen an. Mehr Information über vertretene Sprachen finden Sie hier: Die Teilnahmerzahl ist begrenzt daher bitte um rasche Anmeldung (bis spätestens 1. Oktober 2019) bei sarah.lang(at) Es wird erwartet, dass Teilnehmende ihre eigenen Laptops mit Python-Installation mitbringen.

In this workshop, the Classical Language Toolkit (CLTK) will be presented, a computational toolkit for the Python programming language, focused on processing classical languages. They need specific attention because of the very nature of accessible data: Contrary to contemporary languages, classical languages have a fixed corpus of texts and may not be precisely understood. We will show how it is possible to deal with these limitations in order to automatically extract information from texts. As an example document, De re coquinaria will be processed during the presentation in order to give an idea of the domain in a concrete situation and teach the fundamental usage of CLTK.

The workshop will focus on the languages mentioned but those interested in other languages covered by the CLTK are welcome as well (learn about available languages here: The number of participants is limited; if you want to participate, contact sarah.lang(at); application deadline: October 1st; participants are expected to bring their own laptops with a python installed.

This entry was posted in Events, Tools and tagged , , . Bookmark the permalink.

Leave a Reply

Your email address will not be published. Required fields are marked *