Tagged PDF
PDF balisé (Structure PDF accessible)
Un PDF enrichi de balises structurelles qui définissent l'ordre de lecture logique, les titres, les paragraphes, les listes, les tableaux et le texte alternatif des images, le rendant accessible aux technologies d'assistance comme les lecteurs d'écran.
Détail technique
Les PDF balisés contiennent un arbre de structure enraciné dans les entrées /MarkInfo et /StructTreeRoot du catalogue du document. Les éléments de structure (/StructElem) mappent vers des éléments HTML sémantiques : /P (paragraphe), /H1-H6 (titres), /Table, /TR, /TD, /Figure (avec texte alternatif /Alt) et /L (liste). Le contenu marqué dans les flux de page relie les opérateurs graphiques aux nœuds de structure. Le PDF/UA (ISO 14289) définit les exigences d'accessibilité au-delà du balisage de base.
Exemple
```javascript
// Tagged PDF: PDF manipulation example
import { PDFDocument } from 'pdf-lib';
const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```