Структура документа

При использовании SGML предполагается, что текст состоит из логических частей, называемых элементами, которые с помощью разметки помечаются в тексте. Обычно элемент ограничен начальной и конечной метками. Важно, что ни названия меток, ни их структура не определяются и не фиксируются в стандарте SGML. В рамках стандарта можно определять произвольную разметку. SGML также не определяет способ интерпретации документов, поэтому в конкретных системах для использования SGML необходим прикладной процессор, который обрабатывает структуру и содержание документа. В качестве прикладного процессора, как правило, используется преобразователь SGML-разметки в команды штатного текстового процессора конкретной системы. Использование SGML имеет определенные преимущества:
• при создании большого количества однотипных документов повышается производительность,
• при подготовке документов, которые должны иметь конкретный формат, обеспечивается всеобщее "выполнение" принятых стандартов,
• при постоянных модификациях документов с длинным жизненным циклом облегчается сопровождение,
• при работе с документом, содержащем информацию, которая должна обрабатываться различным образом, можно использовать только исходный файл и не переходить на специфические виды обработки, например, не извлекать рисунки,
• при передаче документов в другие системы упрощаются преобразования форматов представления различных частей документа.
Другой стандарт ISO 8613 parts 1-6, Information Processing - Text and Office Systems - Office Document Architecture (ODA) and Interchange Format (ODIF) предназначен для передачи и представления документов, ориентированных на делопроизводство - бланки, накладные, переписка, отчеты и т.п.
ODA имеет два основных назначения. Во-первых - это метод описания электронного представления документа, включая все входящие в него виды информации (текст, штриховая и растровая графика, таблицы). Такое структурное описание называется архитектурой документа. Второе назначение - представление содержания структурированной информации в виде, удобном для автоматизации обмена между текстовыми процессорами, рабочими станциями, лазерными принтерами и т.д. Кодирование ODA для обмена между такими устройствами осуществляется в последовательном формате ODIF, что удобно для использования в коммуникационных системах. В частности, здесь используется стандартный синтаксис, определенный для использования в архитектуре OSI.
Структура документа ODA. В описании документа по стандарту ODA выделяются следующие основные категории: логическая структура, форматирующая структура, содержание.
Логическая структура предназначена для представления произвольных иерархических видов организации информации. Например, рубрикация документа, включение в текст таблиц и рисунков. Причем в стандарте ODA обеспечены не конкретные понятия, а механизм для описания различных видов организации информации.