Programma's van wikipedia2xml.sf.net
-
wikipedia2XML Gratis
Een verzameling python-scripts om een XML-corpus (een grote verzameling tekst voor taalkundig doel) te maken en te verwerken uit een originele Wikipedia-database back-updump. Het bevat een reguliere expressie gebaseerde parse