Technische Details zu den KI-unterstützten Prüfungen

Hintergrund

Wann ist ein PDF-Dokument barrierefrei? Diese Frage ist gar nicht so leicht zu beantworten. Das Dokument muss dazu nicht weniger als 31 Prüfungen mit insgesamt 137 Bedingungen bestehen. Diese Prüfungen sind im so genannten Matterhorn-Protokoll detailliert aufgelistet. Es ist der Prüfkatalog für die Barrierefreiheit von PDFs.

Von den 136 Bedingungen des Protokolls erfordern 41 menschliches Urteilsvermögen. Eine "klassische" Software kann beispielsweise nicht erkennen, ob ein Absatz zu einem Titel oder zum Lauftext gehört (ob also ein H- oder ein P-Tag korrekt wäre). Alle PDF-Prüftools scheitern bisher an diesem Problem.

PAC 2026 enthält Funktionen mit künstlicher Intelligenz (KI). Mit diesen neuen Funktionen kann PAC einen Teil jener Prüfpunkte des Matterhorn-Protokolls abdecken, die bisher menschliches Urteil erforderten. Damit reduziert PAC 2026 den manuellen Prüfaufwand erheblich und erleichtert insbesondere Einsteigerinnen und Einsteigern den Zugang zur professionellen PDF/UA-Prüfung.

Funktionsweise

Die KI, welche in PAC 2026 eingebaut ist, wurde anhand von vielen barrierefreien PDFs trainiert. Sie hat anhand dieser Dokumente gelernt, wie verschiedene Bereiche semantisch korrekt getaggt werden.

Semantische Bereiche (Strukturelemente)

Die KI-unterstützten Prüfungen erkennen folgende semantischen Bereiche eines Dokuments:

  • Lauftext (P)
  • Überschrift (H)
  • Listen (L)
  • Tabellen (Table)
  • Bilder und Grafiken (Figure)
  • Inhaltsverzeichnisse (TOC)
  • Bildunterschriften (Caption)
  • Fußnoten und Anmerkungen (Note)