Структура документа

Формализацией и стандартизацией структуры документов интенсивно занимались в 1985-1989 годах, когда совместными усилиями международных организаций по стандартизации (ISO, CCITT, ЕСМА) был разработан ряд стандартов на архитектуру документов и форматы обмена, на язык разметки структуры, на передачу, доступ и манипуляции. В настоящее время многое из тех наработок потеряло свою актуальность, однако, мы считаем необходимым и полезным изложить здесь основные концепции структуры, выработанные на заре эры электронных документов.
Как это достаточно ясно из вышеизложенного, следует различать логическую структуру (разделы, связи, атрибуты) и структуру представления документа (страницы, строки, шрифты, выделенность). Для решения проблемы мобильности1 структурированной электронной документации используются унифицированные средства разметки документов. Здесь традиционным инструментом является SGML - стандартизированный язык обобщенной разметки документов.
Стандарт ISO 8879, Information Processing - Text and Office Systems -Standard Generalized Markup Language SGML - предлагает метаязык для создания языков обобщенной разметки документов. Стандарт создавался в следующих целях:
• добиться независимости структуры документа от стиля его представления;
• обеспечить независимость от форматирующей системы;
• предоставить возможность многофункциональной обработки документа: форматирование всего документа, выборка фрагментов текста и ключевых слов, выборка из документа информации о заголовке, авторах и аннотации.