python-ucto

Maarten van Gompel (Ontwikkelaar)

Onderzoeksoutput: Niet-tekstuele vormSoftwareWetenschappelijk

Samenvatting

This is a Python binding to the tokeniser Ucto. Tokenisation is one of the first step in almost any Natural Language Processing task, yet it is not always as trivial a task as it appears to be. This binding makes the power of the ucto tokeniser available to Python. Ucto itself is a regular-expression based, extensible, and advanced tokeniser written in C++ (https://languagemachines.github.io/ucto).
Originele taal-2Engels
Outputmediasource code/data file (online)
StatusGepubliceerd - 09 okt. 2020

Vingerafdruk

Duik in de onderzoeksthema's van 'python-ucto'. Samen vormen ze een unieke vingerafdruk.

Citeer dit