Понятия Workflow и Groupware
Из сравнения этих двух определений можно сделать вывод, что авторитетная коалиция WFMC говорит workflow, а подразумевает automation workflow. Отсюда становятся понятными гносеологические корни путаницы между документооборотом и workflow, но здесь нет ничего удивительного -документооборот надо понимать как document workflow. Workflow обобщает понятие автоматизированного документооборота.
Путаница между рассматриваемыми понятиями усиливается еще и по другой причине. Анализ деятельности многих неавтоматизированных учреждений показывает, что примерно половина времени уходит на собственно бизнес-процесс, а другая половина - на перемещение бумажных документов с места на место - от одного исполнителя к другому. Поэтому уже простое внедрение электронных документов может дать экономию во времени до 50%. Это означает, что автоматизированное перемещение документов - это уже частичная автоматизация бизнес-процессов, то есть workflow.
С другой стороны, документооборот является тоже бизнес-процессом, особенно для тех учреждений, где документы играют главенствующую роль (например, для тех, которые "производят документы" - это административные органы, издательства, информационные агентства и др.). Для таких учреждений workflow в чистом виде означает document workflow.
Вернемся к определению workflow. Оно будет не полным, если мы не рассмотрим его ключевые понятия. К ним относятся:
• activity - деятельность - набор событий, которые могут происходить с отдельным участником в единичный промежуток времени;
• commitment - обязательство - 1) состояние разума, согласно которому человек или организация придерживается определенной линии поведения; 2) соглашение или обещание делать что-либо в будущем;
• event - событие - что-либо происходящее в момент времени, оно возникает как некое изменение текущего состояния, оно не имеет длительности, в workflow событие означает передачу единицы работы;
• process - процесс - синоним workflow (рекурсия);
• role - роль - относится к группе подобных участников, имеющих одинаковую квалификацию и/или умение в определенной деятельности из сферы данного процесса (workflow);
• information object - информационный объект - это объект, который используется в рассматриваемом процессе, может быть электронным или материальным, в обоих случаях он представляет собой либо сырые данные, либо результат работы;
• trigger - триггер, присоединенное событие - предшествующее событие в последовательной паре событий процесса, трактуемое как причина последующего события этой пары;
• Workflow Management System - система управления процессом.
Полная система управления процессами (Workflow Management System) должна включать в себя следующие функции: графический дизайн, тестирование, моделирование, реализацию, измерение и оптимизацию любого бизнес-процесса с необходимой гибкостью для применения в произвольной организационной сложности.
Понятия Workflow и Groupware
Анализ отечественной литературы по системам управления документами показывает некоторую путаницу в понятиях и терминах. Как мы уже отмечали в предыдущем разделе, довольно часто путают такие понятия, как СУД, workflow и groupware. В этой путанице нет ничего удивительного, так как все передовые СУД имеют встроенные средства workflow, которые настолько повсеместно пронизывают СУД, что их легко принять за всю систему управления документами.
Для прояснения ситуации мы, по нашей старой доброй традиции, обратимся к классическим первоисточникам. Документ WFMC-TC-1011 "Workflow Management Coalition: Terminology & Glossary" гласит:
"Workflow - это полная или частичная автоматизация бизнес-процесса, при которой документы, информация или задания передаются от одного участника (бизнес-процесса) к другому для выполнения действий согласно набору руководящих правил."
Здесь следует сделать небольшое отступление. Конечно, буквальный перевод с английского workflow - поток работ, или процесс. Действительно, если мы обратимся к одной из наиболее авторитетных компаний в данном вопросе -Ultimus Business Workflow Automation [50], то мы найдем исчерпывающее и понятное прояснение ситуации. В великолепной коллекции официальных документов "A Library of Workflow White Papers" в явном виде определяется:
"Workflow - процесс - произвольное задание, выполняемое последовательно или параллельно двумя или более участниками рабочей группы с целью достижения общей цели."
Синонимами термина workflow являются: business process, business workflow. Поясним смысл различных слов в этом определении.
Произвольное задание - подразумевается, что понятие workflow относится к очень широкому спектру деловой активности.
Последовательно или параллельно - подразумевается, что отдельные шаги (этапы) в этом задании могут выполняться один за другим, или одновременно различными участниками, или в произвольной комбинации.
Двумя или более участниками - подразумевается, что если одна персона выполняет задание, то это не есть workflow. Понятие workflow - из сферы кооперативной работы - оно так называется, если задание "течет" от одного участника к другому.
Общая цель - индивидуальные участники workflow должны действовать во имя общей цели. Если они работают над независимыми проектами, то это не есть workflow.
Учреждение, делопроизводство, документоборот
В отечественной канцелярской практике довольно часто термины делопроизводство и документооборот рассматриваются как эквивалентные. Например, при обращении к известной поисковой машине AltaVista на русском языке с простым запросом "делопроизводство" + "документооборот", мы получили 43 документа, в которых документооборот встречается 49 раз, а делопроизводство - 50 раз.
С другой стороны, в таком серьезном документе, как "Инструкция по делопроизводству в Администрации Президента Российской Федерации" (Москва, 1993) термин документооборот вообще отсутствует, хотя приводится ряд конкретных схем прохождения различных документов по "коридорам власти".
Казалось бы, интуитивно, разница между "делопроизводством" и "документооборотом" очевидна, однако, только в одной статье специализированного выпуска журнала "Открытые системы" мы нашли более-менее внятное изложение различий между
"делопроизводством" - системой правил и организацией порядка работы с документами,
и "документооборотом" - схемой (регламентом) движения документов в своем жизненном цикле.
Нашему понятию "делопроизводство" больше всего соответствует ключевой термин глоссария DMA document management - полный набор процессов, людей, стандартов, инструментов и систем, имеющих своей целью эффективное использование документов.
По утверждению экспертов в области делопроизводства работа с документами в России до сих пор регламентируется рядом стандартов, которые относятся еще к советскому времени: ГОСТ 16487-83 - Делопроизводство и архивная деятельность; ГОСТ 6.38-90 - Система организации документооборота; ЕГСДОУ - Единая государственная система документооборота учреждений; Типовая инструкция по делопроизводству в министерствах и ведомствах Российской Федерации.
Эти документы определяют документооборот как составную динамичную часть делопроизводства. Мы тоже будем придерживаться этой точки зрения.
Как живой объект, каждый документ за время своего существования претерпевает определенные количественные и качественные изменения, независимо от выполнения над ним операций, т.е. он живет в постоянно меняющейся операционной обстановке функционирования как самого учреждения, так и внешней окружающей информационной среды.
Учреждение, делопроизводство, документоборот
Поскольку в данной монографии мы не касаемся конкретной деятельности учреждений, то нам важно понятие не собственно учреждения, а его информационной модели и организации. По определению DMA информационная модель учреждения в самом общем виде - это корпоративная пользовательская база данных, обычно функционирующая в среде локальных/региональных сетей (LAN/WAN), следовательно, включающая множество разнообразных групп, которые могут иметь различные потенциально несовместимые компьютерные системы.
Основным элементом любой организационной системы являются люди. По определению, корпорация - это группа людей, объединенных одной целью.
Поэтому в корпорации существенным является групповая (кооперативная) работа, коллективная подготовка документов и принятие коллегиальных решений.
Учрежденческая (корпоративная) система управления документами (СУД - EDMS - Enterprise Document Management System) должна обеспечивать требования кооперативной работы и управления документами независимо от какой-либо специфики применений. Поэтому часто с СУД (EDMS) связывают (а зачастую и путают) такие понятия, как groupware и workflow.
Следует обратить внимание, что понятие management в русском переводе означает не только управление, но и осторожное, бережное отношение, что здесь вполне уместно по смыслу. Однако, согласитесь "Корпоративная система бережного отношения к документам" звучит несколько неуклюже.
Основное функциональное назначение корпоративной системы управления документами - заботиться о технологической среде для документов, или различных классов информационных объектов, способной управлять методами доступа, версионностью, безопасностью и даже увеличивающейся сложностью отношений между этими объектами независимо от аппаратной платформы и независимо от сетевого и программного окружения. Главное достоинство такой системы заключается в создании и сохранении коллективного интеллекта или базы знаний учреждения, выраженного совокупностью взаимосвязанных документов.
Новые слова в области ЭД
Живые связи, интеллектуальные связи - связывание, это механизм, используемый интеллектуальным документом для отслеживания и мониториро-вания своих компонентов, который принимает две формы. Живые связи - это указатели на соответствующие файлы и их приложения. Используя живые связи, документ автоматически извлекает и воспроизводит на экране или принтере новейшую версию каждого своего компонента. С интеллектуальными связями уровень знаний, которыми наделяется документ, значительно выше. Интеллектуальные связи не только отслеживают последние версии компонентов документа, а и взаимоотношения между компонентами, так изменение одного компонента может автоматически изменить другой.
Самоуправляемый документ, самоходный документооборот. Тесная связь приложений технологии регламентирования хода работ (workflow) с регламентом движения электронных документов (документооборотом - document workflow) внутри учреждения обеспечивает другой уровень интеллекта документа, преобразуя документ в самоуправляемый объект. На документ ссылаются как на самоуправляемый объект тогда, когда в нем содержится не только информация и знания об этой информации (ссылки), но также и правила документооборота или знания о прохождении документом своего жизненного цикла. Документ включает знания, необходимые для прохождения своего обычного маршрута внутри организации, поддерживая сложившиеся правила учета и отслеживая такие моменты, как сроки исполнения и регламентные действия. Таким образом, документ становится самоорганизуемой сущностью и менеджером бизнес-процесса (самоходного документооборота), в котором он сам используется.
Информационные агенты, интеллектуальные агенты, агенты знаний.
Информационные агенты (называемые также интеллектуальными агентами или агентами знаний) делают документ самоосведомленным посредством анализа своего содержания и сравнения этого содержания с профилем пользователя или уровнем его интересов. Основываясь на запросах пользователей, информационные агенты динамически в реальном масштабе времени определяют, каким документам следует назначить маршрут и к каким индивидуумам их направить. Информационные агенты позволяют сместить ответственность за коммуникацию (то есть получение информации) от автора или менеджера к читателю или потребителю информации. Наиболее продвинутой (передовой) задачей интеллектуального агента является рафинирование информации, то есть получение сжатого содержания документа в виде автоматической аннотации.
Новые слова в области ЭД
Поскольку электронные документы порождаются, размножаются и распространяются не так, как их бумажные предшественники, в последнее время пришлось переосмыслить многие концепции, понятия и термины, касающиеся документов и делопроизводства. Delphi отмечает необычайную активность словотворчества в этой области, хотя многие новые слова представляют собой не более, чем технологический шум. Тем не менее, ряд новых терминов активно проникает в словарь языка деловой прозы. Чтобы управлять процессом появления новых слов в сфере электронных документов, исполнительный вице-президент Delphi Consulting Group Карл Фрапаоло призывает профессионалов самим начать активно пользоваться этой новой терминологией и способствовать ее внедрению в пользовательскую среду.
К этим новым понятиям относятся прежде всего интеллектуальные документы, живые документы и эволюционирующие документы. Они применяются, чтобы представить электронный документ как динамический источник информации.
Понятие интеллектуальный документ используется для того, чтобы подчеркнуть, что электронный документ это не просто компьютерное представление своего бумажного предшественника, а нечто большее, содержащее помимо статической информации еще и указатели (связи) на другие, возможно меняющиеся источники данных. Таким образом, документ становится эволюционирующей и интеллектуальной сущностью, способною самостоятельно и непрерывно поддерживать свою новизну и актуальность. Далее интеллектуальный документ облагораживается и становится пригодным для использования в трех различных, но не взаимоисключающих приложениях технологии: связывание (linking), регламентирование хода работ (workflow) и информационные (интеллектуальные) агенты.
Структура документа
Форматирующая структура служит для описания размещения документа на физическом носителе. Здесь появляются следующие понятия:
• группы взаимосвязанных страниц для представления конкретных разделов документа;
• отдельные страницы и блоки, размещаемые на страницах;
• текст, таблицы или рисунки, размещаемые в блоках.
Содержание представляет собственно информацию документа: буквенный текст, рисунки и т.п. Текущая версия ISO 8613 идентифицирует три вида содержания: символьный текст, растровая графика, геометрическая графика (линии, кривые, области). Там, где это возможно, для представления содержания используются существующие стандарты. Для символьного текста - это стандарт ISO 6937. Геометрическая и растровая графика базируется на стандарте ISO 8632 и рекомендациях CCITT T.6.
Дополнительные понятия стандарта ODA. Для создания механизмов реализации конкретных систем в стандарте ODA введены следующие понятия: внутриструктурные взаимосвязи, классы объектов, профиль документа.
Внутриструктурные взаимосвязи. Логическая и форматирующая структуры документа в стандарте ODA представляют иерархически связанные между собой наборы объектов. Каждый объект характеризуется набором свойств {атрибутов). Атрибуты, например, могут быть использованы для описания таких объектов логической структуры, как разделы документа, или представлять собой директивы форматирования типа "разместить раздел логической структуры, начиная с новой страницы".
Классы объектов введены в стандарт ODA для обобщенного описания фрагментов логической или форматирующих структур, неоднократно используемых в документе, что позволяет задавать повторяющиеся элементы только один раз.
Профиль документа. В стандарте ODA представлена возможность задавать свойства документа, которые относятся к документу в целом. Этот набор свойств называется профилем документа. В профиле могут быть указаны следующие данные: название, тема, номер версии, аннотация, ключевые слова, имена авторов и т.п. Профилем документа можно манипулировать, не обращаясь к самому документу, что позволяет быстро получить справочную информацию.
SGML - стандарт описания структуры документов. SGML является не только языком для спецификации разметки синтаксиса - с помощью SGML определяют структуру документа в так называемом определении типа документа (Document Type Definition - DTD). Большое влияние на развитие SGML было оказано инициативой CALS (Continuous Acquisition and Life-cycle Support) министерства обороны США. Документы, размеченные в стиле SGML, не являются окончательной формой документа, что отличает этот формат от других, и содержат только необходимую логическую информацию.
Структура документа
При использовании SGML предполагается, что текст состоит из логических частей, называемых элементами, которые с помощью разметки помечаются в тексте. Обычно элемент ограничен начальной и конечной метками. Важно, что ни названия меток, ни их структура не определяются и не фиксируются в стандарте SGML. В рамках стандарта можно определять произвольную разметку. SGML также не определяет способ интерпретации документов, поэтому в конкретных системах для использования SGML необходим прикладной процессор, который обрабатывает структуру и содержание документа. В качестве прикладного процессора, как правило, используется преобразователь SGML-разметки в команды штатного текстового процессора конкретной системы. Использование SGML имеет определенные преимущества:
• при создании большого количества однотипных документов повышается производительность,
• при подготовке документов, которые должны иметь конкретный формат, обеспечивается всеобщее "выполнение" принятых стандартов,
• при постоянных модификациях документов с длинным жизненным циклом облегчается сопровождение,
• при работе с документом, содержащем информацию, которая должна обрабатываться различным образом, можно использовать только исходный файл и не переходить на специфические виды обработки, например, не извлекать рисунки,
• при передаче документов в другие системы упрощаются преобразования форматов представления различных частей документа.
Другой стандарт ISO 8613 parts 1-6, Information Processing - Text and Office Systems - Office Document Architecture (ODA) and Interchange Format (ODIF) предназначен для передачи и представления документов, ориентированных на делопроизводство - бланки, накладные, переписка, отчеты и т.п.
ODA имеет два основных назначения. Во-первых - это метод описания электронного представления документа, включая все входящие в него виды информации (текст, штриховая и растровая графика, таблицы). Такое структурное описание называется архитектурой документа. Второе назначение - представление содержания структурированной информации в виде, удобном для автоматизации обмена между текстовыми процессорами, рабочими станциями, лазерными принтерами и т.д. Кодирование ODA для обмена между такими устройствами осуществляется в последовательном формате ODIF, что удобно для использования в коммуникационных системах. В частности, здесь используется стандартный синтаксис, определенный для использования в архитектуре OSI.
Структура документа ODA. В описании документа по стандарту ODA выделяются следующие основные категории: логическая структура, форматирующая структура, содержание.
Логическая структура предназначена для представления произвольных иерархических видов организации информации. Например, рубрикация документа, включение в текст таблиц и рисунков. Причем в стандарте ODA обеспечены не конкретные понятия, а механизм для описания различных видов организации информации.
Структура документа
Формализацией и стандартизацией структуры документов интенсивно занимались в 1985-1989 годах, когда совместными усилиями международных организаций по стандартизации (ISO, CCITT, ЕСМА) был разработан ряд стандартов на архитектуру документов и форматы обмена, на язык разметки структуры, на передачу, доступ и манипуляции. В настоящее время многое из тех наработок потеряло свою актуальность, однако, мы считаем необходимым и полезным изложить здесь основные концепции структуры, выработанные на заре эры электронных документов.
Как это достаточно ясно из вышеизложенного, следует различать логическую структуру (разделы, связи, атрибуты) и структуру представления документа (страницы, строки, шрифты, выделенность). Для решения проблемы мобильности1 структурированной электронной документации используются унифицированные средства разметки документов. Здесь традиционным инструментом является SGML - стандартизированный язык обобщенной разметки документов.
Стандарт ISO 8879, Information Processing - Text and Office Systems -Standard Generalized Markup Language SGML - предлагает метаязык для создания языков обобщенной разметки документов. Стандарт создавался в следующих целях:
• добиться независимости структуры документа от стиля его представления;
• обеспечить независимость от форматирующей системы;
• предоставить возможность многофункциональной обработки документа: форматирование всего документа, выборка фрагментов текста и ключевых слов, выборка из документа информации о заголовке, авторах и аннотации.
Документ
Однако, в последнее время в связи с эволюцией документов все перечисленные выше определения нуждаются в обобщении. Поэтому наиболее авторитетная в этой области информатики организация DMA приняла более общую формулировку:
"документ - это набор информации, который имеет отношение к выделенной теме или к родственным темам".
Последнее определение более общее в семантическом плане - оно освобождает нас от привязки к носителям и к реквизитам. На жаргоне DMA объект неструктурированных данных, здесь и далее называемый документом1, может принимать множество различных форм: это может быть закодированный текст; оцифрованные изображения бумажных документов; графика; выходные файлы САПР; оцифрованный звук; цифровое видео ... то есть любой тип неструктурированных данных, которые могут быть авторизованы, храниться в цифровой форме и воспроизводиться в виде, воспринимаемом человеком.
Документам, как живым и интеллектуальным объектам, присущи три основные сущности, за которые ответственны три различные технологические средства. Во-первых, это объекты хранения всевозможных данных от текста до графики, видео и звука. Во-вторых, это связи, которые собственно оживляют документы и придают им интеллектуальность. Третья сущность - это атрибуты и индексы, которые появляются в результате общения с интеллектуальными агентами.
Это, в некотором смысле, синтаксическая нотация документа. С ней также связано и понятие стиль документа - форма, проявляющаяся при воспроизведении документа, то есть при его обработке текстовым процессором. Форма задается как описание формата, включающее в себя геометрию расположения текста на листе (layout), употребление определенных шрифтов для определенных целей и способ представления различных типов данных.
Когда хотят подчеркнуть, что документ включает различные типы данных (текст, таблицы, графику, видео и т.п.), то говорят о составном документе (compound document). Динамическим продолжением составного документа является виртуальный документ, представляющий собой совокупность информационных объектов, создаваемую в результате взаимодействия пользователя с информационной системой, в общем случае, - Всемирной паутиной.
Здесь, естественно, возникает понятие структуры документа. Конечно же, по всем признакам документ является структурированным объектом, и, по нашему мнению, DMA намеренно называет его неструктурированным, последовательно проводя сдвиг парадигмы построения полнотекстовых баз данных хранения документов от СУБД к гибким и универсальным складам данных (Data Warehouse).