🍋
Menu
PDF

Tagged PDF

Тегированный PDF (доступная структура PDF)

PDF, дополненный структурными тегами, которые определяют логический порядок чтения, заголовки, абзацы, таблицы и альтернативный текст, делая документ доступным для программ чтения с экрана и вспомогательных технологий.

Техническая деталь

Тегированные PDF содержат дерево структуры, основанное на записях /MarkInfo и /StructTreeRoot каталога документа. Стандартные типы структуры включают /Document, /Part, /Sect, /H1-H6, /P, /Table, /TR, /TD, /Figure, /Span и /Link. Каждый структурный элемент связан с отмеченным содержимым в потоке страницы через MCID (идентификаторы отмеченного содержимого). PDF/UA (ISO 14289) требует полной разметки тегами, альтернативного текста для изображений и правильного порядка чтения для полного соответствия требованиям доступности.

Пример

```javascript
// Tagged PDF: PDF manipulation example
import { PDFDocument } from 'pdf-lib';

const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```

Связанные форматы

Связанные инструменты

Связанные термины