Arch Search Engine 1.15

Licentie: Gratis ‎Bestandsgrootte: 31.07 MB
‎Gebruikersbeoordeling: 3.5/5 - ‎2 ‎Stemmen

Arch is een open source extensie van Apache Nutch (een populaire, zeer schaalbare algemene doel zoekmachine) voor intranet zoeken. Niet blij met uw corporate zoekmachine? Niet verwonderlijk, zeer weinig mensen zijn. Voor zover wij weten, zijn er geen intranet engines die zo goed werken als de wereldwijde zoekopdracht op het web van Google. Er is een fundamentele reden voor: de algoritmen die door Google op het wereldwijde web (of iets dergelijks) worden gebruikt, werken lang niet zo goed op intranetten bij gebrek aan statistische gegevens. Arch (eindelijk!) lost dit probleem. Het maakt gebruik van een nieuwe methode om hoge precisie zoekresultaten die geweldig werkt te leveren. Geloof je het niet? Blinde test evaluatie tools zijn opgenomen. U Arch implementeren en de prestaties vergelijken met uw huidige zoekmachine en/of Google (op het openbare deel van uw site) met behulp van een blinde testmethodologie. Naast de uitstekende zoekkwaliteit heeft Arch veel functies die essentieel zijn voor bedrijfsomgevingen: - Beveiliging op documentniveau. Gebruikers kunnen alleen documenten vinden die ze mogen zien. - Goedkope indexupdates. Arch is in staat om indexen up-to-date te houden en te voorkomen dat regelmatige volledige site opnieuw krabbelen. - 24/7 availabilty. Er is altijd een werkende index beschikbaar, zelfs als een crawl mislukt. - Ondersteuning voor gelijktijdige indexering en zoeken van meerdere websites, met de mogelijkheid om elke site afzonderlijk te zoeken en te beheren, indien nodig. Dynamisch toevoegen en verwijderen van websites is eenvoudig. - Een automatisch gegenereerde sitemap. - Goedkope ondersteuning eenmaal geïmplementeerd. - Dual interface (PHP en Java) voor eenvoudige implementatie en aanpassing. - Faceted search "out of the box". - Een uitgebreide en uitbrekeerbare set parsers voor het ontleden van een verscheidenheid aan bestandsformaten: HTML, PHP, PDF, MS Office, Open Office, enz. - Een modulaire, op plugin gebaseerde architectuur die eenvoudig kan worden aangepast en uitgebreid. - De broncode is inbegrepen. - Hoge prestaties en schaalbaarheid. Arch kan draaien op computerclusters om zeer grote gegevenssets te indexeren.

versiegeschiedenis

  • Versie 1.15 geplaatst op 2019-05-17
    Geporteerd op Nutch 1.15
  • Versie 1.9.2 geplaatst op 2016-08-18
    Verbeterde documentparsing, geporteerd op Nutch 1.9.
  • Versie 1.2 geplaatst op 2010-09-17
    Geüpport naar Apache Nutch 1.2, een upgrade van de PDF-parser, toegevoegd test-en tuning tools, opgelost problemen gevonden in de bètaversie, ingeschakeld gebruik van computerclusters.

Programmadetails