Programma's van wikipedia2xml.sf.net

  • wikipedia2XML Gratis

    Een verzameling python-scripts om een XML-corpus (een grote verzameling tekst voor taalkundig doel) te maken en te verwerken uit een originele Wikipedia-database back-updump. Het bevat een reguliere expressie gebaseerde parse