ISAKS - Dokumentenmanagement, sicherer Download von heise.de
  |  anmelden

Danke für Ihre Unterstützung.

OWS Facebook

Stichworte

Kategorien

 
     

OCR Erkennung für TIFF unter Windows 7 einschalten

Jul 15 2010

Um eingescannte Papierdokumente in Form einer TIFF Datei (Tagged Image File Format) maschinell auslesen zu können, nutzt man die “Optical Character Recognition” Technologie, kurz OCR. TIFF ist ein Bildformat, wird aber von diversen Fax-Programmen als Ablage-Format für eingehende Faxe benutzt. Microsoft hat dafür den TIFF-iFilter entwickelt und nutzt ihn in im Windows Server 2008 R2.

ISAKS nutzt ebenfalls die iFilter Technologie um Text aus Dateien zu extrahieren und bindet den OCR TIFF-iFilter in das Servermodul zur Indexierung ein. Damit ISAKS den Text eines Dokumentes im TIF Format verarbeiten kann, müssen nur zwei “Schalter” gesetzt werden:

 W7 Tif iFilter aktivieren

1. “Windows TIFF iFilter” in Windows Systemsteuerung einschalten. Den Punkt finden Sie unter Systemsteuerung/Programme/Programme und Funktionen/Windows-Funktionen aktivieren oder deaktivieren (siehe Bild)

 iFilter im Server aktivieren

2. TIFF iFilter im ISAKS – Servermanager für die Extension “.TIF “ in der Spalte Fulltext “mittels iFilter” auswählen und die Änderungen bestätigen.

 

Automatisch werden jetzt alle Bilder im TIF Format mit OCR behandelt und gefundener Text sofort indiziert.

weitere Informationen zum Microsoft iFilter: http://technet.microsoft.com/de-de/library/dd834685.aspx