Web Data Extractor Pro 3.10

Licentie: Gratis proefperiode ‎Bestandsgrootte: 8.31 MB
‎Gebruikersbeoordeling: 4.3/5 - ‎15 ‎Stemmen

Web Data Extractor Pro is een web scraping tool speciaal ontworpen voor het verzamelen van massa's van verschillende gegevenstypen. Het kan URL's, telefoon- en faxnummers, e-mailadressen en metataggegevens en hoofdtekst oogsten. Bijzonderheid van WDE Pro is aangepaste extractie van gestructureerde gegevens. Dit snelle en multithreaded programma werkt met behulp van een trefwoord in zoekmachines, door spidering een website of een lijst van URL's uit een bestand. U het ook toestaan om externe links van de originele pagina's te volgen, met de mogelijkheid om zo diep in de URL-paden te gaan als u nodig hebt en daadwerkelijk het hele internet te doorzoeken. Web Data Extractor is superieur voor het verzamelen van gestructureerde informatie en specifieke gegevenstypen met betrekking tot de zoekwoorden die u verstrekt door te zoeken via meerdere lagen websites.

versiegeschiedenis

  • Versie 3.10 geplaatst op 2020-01-06
    Aanzienlijk verbeterde parser van e-mailadressen; Gebruikersagentenlijst is bijgewerkt; Toegevoegd "Niet-geëxtraheerde URL's" en "Enhanced Human factor" opties in Connection voor nog effectiever werken met doelwebsites; Toegevoegde opties "Controleer elke X minutes" en "Renew after it has read Y number of links" in Proxy Servers for more effective work with proxies; Veel verbeteringen zijn aangebracht volgens onze klanten reviews!
  • Versie 3.9 geplaatst op 2018-12-30
    Lijst van zoekmachines is vrijgesproken van verouderde / gebroken links. Dit stelde ons in staat om de snelheid van de software te verhogen in de zoekmachines modus; Aanzienlijk verbeterde e-mailadressen parser, met name voor JS (JavaScript) verborgen e-mails;Verbeterde optie om eigen proxyservers te importeren uit CSV-bestanden;Verbeterd werken met HTTPS-websites;Verbeterde prestaties bij het werken met grote URL-lijsten;Verbeterde "Cookie Capture"-optie; Diverse kleine correcties/verbeteringen volgens feedback van klanten
  • Versie 3.8 geplaatst op 2017-12-29
    Added ability to load and extra informatie from PDF files; Added ability to load the license file directly from the UI form, when the trial period of using the program expired. Als alternatief kan het licentiebestand worden geüpload vanuit het formulier Opties -> Over als de proefperiode nog niet is verlopen; Aanzienlijk verbeterd werk via de proxyservers; Parser van gecodeerde JS-e-mails is verbeterd; Het contextmenu-item "Url" opnieuw starten; is toegevoegd aan de "Bad URL's" lijst;Verbeterd werken met de interne datarepository van de software; Toegevoegd de mogelijkheid om sessies te verwijderen, samen met al zijn gegevens en de service bestanden, ook software automatisch comprimeren van de interne repository van het programma om de vereiste schijfruimte te verminderen; Toegevoegd "Initial Referrer" tekstveld in UI. Sommige websites kunnen verschillende informatie weergeven, afhankelijk van van welke externe site ze afkomstig zijn. Met het veld "Initial Referrer" u het webadres van een dergelijke site opgeven; We hebben ook verschillende kleine wijzigingen en verbeteringen aangebracht op basis van feedback van onze klanten
  • Versie 3.7 geplaatst op 2017-02-28
    Improved work of "Search Engines" mode;Improved "Remove HTML Tags" and "Page must contain the following text toex extract data" filters; Toegevoegd "Gebruik land IP filter" filter waarmee resultaten van servers die geen verband houden (door geolocatie) uit te sluiten met het land geselecteerd in "Search Engines optie; Aanzienlijk verbeterde e-mailparser en Custom Builder parser; Algemene verbeteringen in de detectie en extractie van gegevens; We hebben ook verschillende kleine wijzigingen en verbeteringen aangebracht op basis van feedback van onze klanten
  • Versie 3.6 geplaatst op 2016-08-22
    Toegevoegd selectievakje "Get redirected URL" op de "Custom Data Editor" formulier om url's (bijvoorbeeld websiteadressen) te extraheren die via een omleiding worden gepresenteerd; Selectievakje "Niet-reagerende proxy's markeren zoals inactief automatisch". Als tijdens de sessie proxy server bepaald als slecht (niet werkt), wordt het automatisch gemarkeerd als inactief, en de plaats niet gebruikt in de sessie; Added new option "Use single line merge" to merge into a single string. U bijvoorbeeld t-shirtkleuren exporteren zoals: "T-Shirt", "Zwart, Geel, Rood, Groen; Aanzienlijk verbeterd laden van openbare proxy servers van het internet; "Human Factor" optie is verbeterd; Verbeterde een parser van gesloten door JS e-mailadressen; Verbeterde optie van het passeren van Google-captcha bij het zoeken naar gegevens via Google; We hebben ook verschillende kleine wijzigingen en verbeteringen aangebracht op basis van feedback van onze klanten
  • Versie 2.0 geplaatst op 2012-08-29
    Herwerkte het algoritme voor het bepalen van de diepte van de scan, Programma duurzaamheid aan de fysieke schade van de database wordt toegevoegd, Verbeterde streams controle, die een positieve invloed op de algehele prestaties heeft, Verbeterd werken met een grote lijst van zoekwoorden in "Search Engines" modus;

Programmadetails