Een verzameling python-scripts om een XML-corpus (een grote verzameling tekst voor taalkundig doel) te maken en te verwerken uit een originele Wikipedia-database back-updump. Het bevat een reguliere expressie gebaseerde parser voor de MediaWiki markup taal.
versiegeschiedenis
- Versie 0.1 geplaatst op 2008-04-01
Verschillende oplossingen en updates - Versie 0.1 geplaatst op 2008-04-01
Programmadetails
- Categorie: Onderwijs > Andere
- Publisher: wikipedia2xml.sf.net
- Licentie: Gratis
- Prijs: N/A
- Versie: 0.1
- Platform: windows