Dienstag, 5. Mai 2015

JAWS-Tipp: die Bildschirmtexterkennung

In diesem Beitrag möchte ich eine kleine Einführung in die seit JAWS 13 verfügbare Bildschirmtexterkennung "Convenient OCR" geben, in der deutschen Hilfe etwas holprig mit "Geeignete Texterkennung" übersetzt, und in die neue Texterkennung für ganze PDF-Dateien, die Freedom Scientific mit JAWS 16 bereitgestellt hat. Diese Funktion kann im Alltag eine große Hilfe sein und bietet interessante Anwendungsmöglichkeiten, auch wenn Freedom Scientific sicherlich noch Raum für Verbesserungen gelassen hat.

Bevor ich zur Bedienung dieser Funktion komme, hier schon mal ein kleiner Vorgeschmack auf das, was man mit Bildschirmtexterkennung so alles anstellen kann:

  • All die lustigen und informativen Textgrafiken auf Facebook, Twitter und anderen Webseiten lesen
  • Grafische Navigationsschaltflächen auf Webseiten und in Programmen lesen und beschriften
  • DVD-Menüs bedienen
  • Screenshots lesen
  • PDF-Dateien mit rein grafischem Inhalt lesen (beispielsweise gescannte Dokumente)
  • und mit etwas Glück kann man vielleicht auch den abfotografierten Zettel an der Haustür lesen (bei mir war es letztens die Terminankündigung des Schornsteinfegers)


Die Funktionsweise


Die Bildschirmtexterkennung wurde ursprünglich entwickelt, um grafische Navigationsmenüs, allen voran die Menüs von DVDs, bedienbar zu machen. Es geht also primär darum, grafisch dargestellten Text auf dem Bildschirm lesbar und navigierbar zu machen. Dementsprechend hängt die Bildschirmtexterkennung auch direkt mit dem JAWS-Cursor zusammen. Darin liegt auch eine besondere Herausforderung: man muss die gewünschte Grafik vollständig auf den Bildschirm bekommen, um sie komplett lesen zu können. Da ist mir schon einige Male nichts anderes übrig geblieben, als die Grafik abzuspeichern und anschließend mit der Windows Fotoanzeige aufzurufen. Diese skaliert die Grafik nämlich im Regelfall auf die Bildschirmgröße.

Eine Ausnahme stellt die mit JAWS 16 eingeführte Erkennung von grafischen PDF-Dokumenten dar. Während früher nur der aktuell auf dem Bildschirm dargestellte Text gelesen werden konnte, kann JAWS 16 jetzt das gesamte Dokument verarbeiten und im virtuellen Betrachter darstellen. Letztere Option steht für die anderen Erkennungsarten leider bisher nicht zur Verfügung.


Die Bedienung


Aufgerufen wird die Bildschirmtexterkennung mit JAWS-Taste und Leertaste, gefolgt von O. Danach drückt man eine weitere Taste, um die gwünschte Art der Texterkennung aufzurufen:

  • c Aktuell fokussiertes Objekt
  • w Aktuelles Fenster
  • s Gesamter Bildschirm
  • d Aktuell geöffnetes PDF-dokument
  • q Bricht die aktuelle Texterkennung ab
  • ? Hilfe aufrufen - spricht eine Liste der Optionen

Anschließend wird die Texterkennung durchgeführt und, außer bei der Erkennung von PDF-Dokumenten, der JAWS Cursor aktiviert. Mit diesem kann man dann das Ergebnis lesen. Ggf. sollte man dazu noch den JAWS-Cursor zum (virtuellen) PC Cursor ziehen. Schaltet man auf einen anderen Cursor um oder wechselt in ein anderes Fenster, so gehen die Ergebnisse der Texterkennung verloren. Auch hier beweist JAWS mal wieder seine chronische Allergie gegen Fensterwechsel, aber irgendwann gewöhnt man sich ja an fast alles.

Und natürlich kann man das Ergebnis der Texterkennung auch auf der Braillezeile lesen, was für meinen Geschmack eine deutlich strukturiertere Vorgehensweise als beim Arbeiten mit dem JAWS-Cursor ermöglicht.


Texterkennung für PDF-Dokumente


Führt man dagegen eine Texterkennung für ein PDF-Dokukment durch, so öffnet sich nach deren Abschluss der virtuelle Betrachter, in dem man dann nach Herzenslust mit dem virtuellen Cursor herumnavigieren kann, Schnellnavigation eingeschlossen. Dabei werden nicht nur Grafiken im PDF-Dokument erkannt, sondern das Dokument ans Ganzes. Ein interessanter Nebeneffekt ist, dass das OCR-Ergebnis manchmal vesser navigierbar ist als das eigentliche PDF. So hat bei mir kürzlich eine lesbare, aber schlecht navigierbare Anleitung mit Bildschirmtexterkennung plötzlich ihre Tabellen wiederbekommen, was das Zurechtfinden deutlich erleichtert hat.

Falls beim Start der Texterkennung von Adobe Reader ein Kennwort für das Dokument abgefragt wird, so hat der Ersteller das Drucken des Dokumentes gesperrt. Solche Schutzmaßnahmen findet man an den absurdesten Stellen, so z.B. bei Veröffentlichungen des Bundesgesetzblattes. In einem solchen Fall hilft es nur, das PDF abzuspeichern und dann den technisch völlig wirkungslosen Schutz mittels entsprechender Tools zu entfernen. Ich nutze dazu einen kleinen Ghostscript-Aufruf, der das PDF in ein PDF umwandelt und dabei auch gleich sämtliche Schutzmechanismen, darunter auch den für Screenreader tötlichen Schutz vor Kopieren des Inhaltes, entfernt.


Einstellungsmöglichkeiten


Viel gibt es nicht zu konfigurieren, aber zumindest die primäre und die sekundäre Erkennungssprache kösst sich in der JAWS Einstellungsverwaltung einstellen, und das sowohl systemweit als auch je Anwendung.


Kleiner Trick zum Abschluss: grafische Schaltflächen beschriften


Nur nochmal zur Erinnerung: hat man erstmal die Bedeutung einer grafischen Schaltfläche mittels Bildschirmtexterkennung ermittelt, so kann man diese natürlich auch beschriften. Dazu geht man auf das zu beschriftende Element und drückt JAWS-Taste Strg Tab. Das funktioniert im Regelfall auch mit dem Element, auf das der JAWS-Cursor zeigt. Falls es hier Probleme gibt, z.B. weil ein anderes Element die Schaltfläche überlagert, so kann man das gewünschte Element zunächst mit dem JAWS-Cursor ansteuern und seine Bildschirmposition ermitteln (Alt Entf auf dem Nummernblock). Anschließend wechselt man auf den PC-Cursor, sucht das passende Element anhand dieser Position heraus und beschriftet es.

Keine Kommentare:

Kommentar veröffentlichen