OCR Test - Works offline 0.6.0

Licentie: Gratis ‎Bestandsgrootte: 10.49 MB
‎Gebruikersbeoordeling: 2.8/5 - ‎6 ‎Stemmen

Experimentele app voor optische tekenherkenning (OCR) Deze app is een experimentele app die ik enkele jaren geleden heb ontwikkeld die het gebruik van de Tesseract OCR-engine demonstreert om tekst te herkennen in beelden die door de apparaatcamera zijn vastgelegd. Deze app draait OCR op je apparaat – zonder je afbeeldingen te uploaden naar een server – en is geschikt voor het herkennen van individuele woorden of korte zinnen tekst, maar deze app is bedoeld voor hobbyisten en softwareontwikkelaars die geïnteresseerd zijn in OCR en niet voor een algemeen publiek. In tegenstelling tot de Mobile Vision API van Google kan deze app tekst herkennen die offline in niet-Latijnse lettertypen is afgedrukt. Om dit te bereiken, bevat deze app een ongewoon grote hoeveelheid trainingsgegevens voor meerdere talen. Deze trainingsgegevens worden opgeslagen op uw telefoon en deze app neemt veel meer ruimte in beslag dan gewone apps. Geen beeld pre-processing wordt uitgevoerd door deze app voor het overhandigen van gevangen beeldframes aan Tesseract, dus de app is niet afgestemd op een specifieke use case en, als gevolg daarvan, de herkenning nauwkeurigheid en snelheid is sterk afhankelijk van situationele factoren zoals perspectief, verlichting, en lettertype type. Broncode voor deze app is beschikbaar op GitHub (met kleine wijzigingen om rekening te houden met GitHub-bestandsgroottebeperkingen). De code voor deze app is een combinatie van open source camera-gerelateerde code van de ZXing barcode scanner project en open source optische karakter herkenning code van de Tesseract OCR project. TEKST VASTLEGGEN De standaard single-shot capture draait OCR op een momentopname die wordt vastgelegd wanneer u op de sluiterknop klikt, zoals een gewone foto. Wanneer het selectievakje 'continu voorvertoning' is ingeschakeld, toont de app een dynamische, real-time weergave van wat het apparaat direct naast de camerazoeker herkent. De continue preview-modus werkt het beste op een snel apparaat. DEZE APP GEBRUIKEN • Richt het apparaat op een klein gebied van tekst en raak de sluiterknop op het scherm aan om OCR te starten. • Stel de segmentatiemodus van de pagina in op 'enkel teken'. NAUWKEURIGHEID VAN DE ERKENNING • Verschillende factoren kunnen ervoor zorgen dat de OCR uitvalt: ongelijke verlichting, gestileerde tekst of tekst zonder voldoende contrast op de achtergrond. Probeer goede verlichting te hebben. • Houd het apparaat stabiel en zorg ervoor dat de afbeelding scherp is. • Als u een groot blok tekst of een heel document moet scannen, probeert u in plaats daarvan een app voor het scannen van documenten, zoals Tekstfee. Talen • Deze app ondersteunt meerdere talen/scripts die niet door Google Translate zijn herkend. • Ondersteunde talen voor OCR: Afrikaans Albanees Amharic Arabisch Assamees Azerbeidzjaanse Azerbeidzjaans (Cyrillisch) Baskisch Wit-Russisch Bengaals Bosnisch Bulgaars Birmese Catalaans Cebuano Cherokee Chinees (vereenvoudigd) Chinees (traditioneel) Kroatisch Tsjechisch Deens Nederlands Dzongkha Engels Engels, Midden (1100-1500) Esperanto Estisch Fins Frankische Frans Frans, Midden (ca. 1400-1600) Galicisch Georgisch Georgisch - Oud Duits Grieks, Oud (-1453) Grieks, Modern (1453-) Gujarati Haïtiaanse Hebreeuws Hindi Hongaars IJslands Indonesisch Inuktitut Iers Italiaans Italiaans - Oud Japans Javaans Kannada Kazachstaans Khmer Koreaans Koerdische Kirgizisch Lao Latijnse Lets Litouws Macedonische Maleis Malajalam Maltees Marathi Nepalees Noors Oriya Pashto Perzisch Pools Portugees Punjabi Roemeens Russisch Sanskriet Servisch Servisch (Latijn) Sinhala Slowaaks Sloveens Spaans Spaans - Oud Swahili Zweeds Syrisch Philipijns Tajik Tamil Telugu Thais Tibetaanse Tigrinya Turks Oekraïens Urdu Uyghur Oezbeeks Oezbeeks (Cyrillisch) Vietnamees Welsh Jiddisch SAMSUNG-APPARAATNOTITIES • Op Samsung Galaxy-apparaten moet u mogelijk lang op de menuknop drukken om voorkeuren in te stellen.

versiegeschiedenis

  • Versie 0.5.14 geplaatst op 2014-05-11
  • Versie 0.4.3 geplaatst op 2011-05-13
    Verschillende oplossingen en updates

Programmadetails