wikipedia2XML 0.1

Licentie: Gratis ‎Bestandsgrootte: N/A
‎Gebruikersbeoordeling: 3.0/5 - ‎1 ‎Stemmen

Een verzameling python-scripts om een XML-corpus (een grote verzameling tekst voor taalkundig doel) te maken en te verwerken uit een originele Wikipedia-database back-updump. Het bevat een reguliere expressie gebaseerde parser voor de MediaWiki markup taal.

versiegeschiedenis

  • Versie 0.1 geplaatst op 2008-04-01
    Verschillende oplossingen en updates
  • Versie 0.1 geplaatst op 2008-04-01

Programmadetails