40. Ядро и окружение информационной системы. Элементарная семантическая
единица.
Прием и регистрация собираемой
первичной информации на входе информационной системы могут производиться
вручную, автоматизированным способом или автоматически. При ручном способе
фактографические данные об информационных объектах фиксируются на специальных
бланках и в журналах в установленной табличной форме, а поступающие документы
регистрируются и сохраняются в виде оригиналов или копий. При
автоматизированном способе регистрация осуществляется на машинном носителе
(например, винчестере ЭВМ) путем диалога оператора и компьютера. Автоматическая
регистрация выполняется без участия человека и предполагает прямое подключение
информационной системы к источнику.
Собранная таким образом информация
представляет собой первичные данные информационной системы. Эти данные подлежат
дальнейшей форматизации и обработке в пакетном или диалоговом режиме с целью
получения производных данных, используемых потребителями для принятия
управленческих или проектных решений или просто в целях ознакомления и
изучения, как это часто бывает в учебной практике. Хотя дидактика требует
закрепления знаний и выработки навыков непременно в активной форме, то есть
путем выполнения тех или иных проектов, тематических исследований, контрольных,
лабораторных и иных практических работ, а в дополнительном
образовании еще более свободного и индивидуализированного
творчества на основе исходной информации. Естественно, что все основные
результаты и этапные моменты такого практического воплощения знаний и
творчества должны учитываться и отражаться вместе с первородными данными в ИС,
в ряде случаев существенно видоизменяя и развивая первоначально полученную
информацию. В видении авторов настоящей публикации первоначальное такого рода
развитие и отражение регистрируется в информационном окружении ядра ИС, а уже
затем, по мере структурирования, отработки и возникновения противоречий с ранее
сформированным ядром ИС, деформирует, видоизменяет это ядро, вместе с тем
приспосабливаясь к форме, направленности и структуре избранного построения ядра
той или иной предметной области знаний.
При проектировании конкретной
информационной системы проблема выбора способа сбора информации при наличии
альтернатив и особенностей размещения этой информации в ядре и окружении ИС
должна решаться в контексте общей проблемы технико-экономического обоснования,
регламентов сферы обучения и изучения предметной области, включая требования
дидактики и с учетом возможностей и особенностей математической и технической
реализации в конкретно создаваемой ИС. Это связано с возможной зависимостью
затрат и возможностью на последующую обработку, хранение и использование
информации от формы ее представления, диктуемой избранным способом сбора.
Наиболее принципиальным шагом в
начале указанного выше процесса обозначения специальных терминов является
объявление о том, что есть информационный МОДУЛЬ ИС, то есть условно неделимая
релевантная по отношению к запросам пользователя ЭЛЕМЕНТАРНАЯ СЕМАНТИЧЕСКАЯ
ЕДИНИЦА (ЭСЕ) информации, наполняющей ИС. Это высказывание означает, что ЭСЕ
представляет собой завершенную семантическую (смысловую, содержательную)
контекстную конструкцию, вызываемую в результате поиска по различным атрибутам
или в результате тех или иных команд в виде отклика или отчета, но при условии,
что никакие действия пользователей ИС (гостей), приводящие к любым транзакциям
системы, не в состоянии вызвать изменений содержания, размера, расширения,
дробления, укрупнения этой ЭСЕ. Только администратор базы данных ИС (возможно и
модератор, если ему предоставлены такие полномочия) может внести указанные
изменения в состав и описание ЭСЕ – но это уже другая картина, связанная с
эмиссией – ремиссией или кластеризацией системы. В частном случае ЭСЕ может
отождествляться с файлом, например, в информационной системе OFIS WORD
Microsoft именно так организуется база данных. В общем же случае этого
тождества нет. Скорее, конструкция, идентифицируемая как обозначенный файл,
откликается множеством различных модулей, фрагментально копируемых из файла.
Так, например, происходит при выводе тех или иных строк, столбцов, таблиц из ИС
EXEL или с помощью браузеров фрагментов (отображений, отчетов) из файлов,
размеченных тэгами языка HTML.
Важной характеристикой конструкций
файлов и\или семантических единиц информации в контенте ИС является так
называемый КОЭФФИЦИЕНТ АКТИВНОСТИ КОНТЕНТА, характеризующий в долевом
отношении, какая часть информации от всего наполнения контента в байтовом
измерении может быть активно использована, отображена, читаема в результате
полноценного функционирования ИС. Здесь подразумевается, что часть заложенной в
ИС информации не выявляется и не работает активным образом, выполняя
специальные вспомогательные функции, а иногда является просто бесполезным
балластом, ухудшающим энтальпию и энтропию системы. Этот коэффициент следует
обязательно исследовать в проекте ИС.
Следует также задаться вопросом, одинаковый ли физический
смысл вкладывается в понятие семантических единиц информации на входе
информационной системы, в ней самой и на выходе ИС в результате откликов на
команды и запросы, адресованные системе.
На входе любой открытой системы,
условно рассматриваемой как некий черный ящик, имеется огромное, устремленное к
бесконечности, количество ЭСЕ. Эта масса блуждает в Интернете, других сетях и
источниках, слабо детерминирована, не определена, энтропия ее очень и очень
велика и быстро нарастает. Распределение вероятностей событий происходящих в
ней, безусловно, Гауссовское, то есть подчиняется нормальному закону. С точки
зрения аналитического и инженерного расчета проектируемых ИС эта масса из-за
своей неопределенности и огромности особого интереса не представляет.
Исключение, пожалуй, могут составить события на входе ИС локализованных
закрытых пространств (например, в локальных и узко корпоративных сетях), где
возможны разумные количественные ограничения.
Внутрисистемные (эндогенные) массивы
ЭСЕ ограничены в объемах, хорошо структурированы. С методической точки зрения
оценка событий по Гауссовскому закону распределений для них представляет
определенную, но вынужденную (для единообразия подходов к анализу) натяжку.
Зато энтропия внутри системы ограничена, в известной мере управляема, а потому
исследование событий, происходящих с ЭСЕ внутри самой системы и ее подсистемах есть
важная и продуктивная часть аналитических расчетов ИС еще на ранних стадиях
проекта (обычно, на ступени трансформации – см. ниже).
На выходе ИС (экзогенные проявления)
все ограничения, относящиеся к внутрисистемным оценкам, выражены еще заметнее в
силу малой энтальпии, ограниченной предельно достигаемой производительностью ИС
(и пропускной способностью каналов связи). Исследования особенностей
распределения событий на выходе интересно в аспекте оценок, отражающих степень
влияния этих событий на основные показатели и возможности самой системы. Для
более ясного прочтения хода и результатов таких исследований удобно
информационным модулям на выходе ИС присвоить иное наименование, чем ЭСЕ, не
изменяя заложенный в термин ЭСЕ физический смысл. Представляется вполне
уместным именовать элементарную семантическую единицу на выходе системы
ИНФОРМАЦИОННЫМ ФАНТОМОМ. Это, встречающееся
в специальной литературе понятие, неплохо иллюстрирует то
обстоятельство, что ЭСЕ на выходе ИС есть только отображение внутрисистемной
информации, а не ее перенос из системы, вызывающий изменения энтальпии и
энтропии самой ИС. Перенос же информации из системы, вызывающий удаление из нее
соответствующих ЭСЕ и в общем случае приводящий к изменению энтальпии и
энтропии системы составляет суть процесса ЭМИССИИ ИС. Загрузка в ИС
информационных модулей со входа системы, наоборот, вызывает РЕМИССИЮ ИС.