Концепция отражения утверждает, что информация есть знание, результат отражения, обозначение содержания, полученного из внешнего мира. Однако это не всякое знание, не всякое содержание отражения, а знание, выраженное в сообщении.
Не существует знания вообще. Знание — это локальное понятие, относящееся к конкретному человеку в определенное время. Отчужденное от конкретного носителя, превращенное в особую овеществленную и обобществленную форму, знание трансформируется в более общее понятие (категорию) — информацию. Следовательно, социальная информация — это форма представления знания.
Изобретение письменности открыло перед человечеством возможность осуществления двух противоположно направленных процессов: превращение знания в информацию и получение знания из информации. Книгопечатание, электро-, радио- и телесвязь увеличили эти возможности. Появление ЭВМ, средств передачи данных радикально меняет качественные и количественные характеристики этих процессов.
«Возникают вопросы, — пишет академик В. Г. Афанасьев, — можно ли неиспользуемые данные исключить из понятия «информация», тогда как и они могут храниться и передаваться? Обязательным ли является осмысливание информации, поскольку в ЭВМ информация перерабатывается, но не осмысливается? Для ответа на эти вопросы управленческая концепция информации вводит понятие «данные». Данные — это всякие сведения, сообщения, знания, которые хранятся, передаются, перерабатываются, но характер информации приобретают тогда, когда получают содержание и форму, пригодную для использования человеком». Следовательно, данные — это промежуточная форма представления знаний и информации.
Рассматривая различные трактовки понятия «информация», мы синтезировали новое понятие триады «знания — данные — информация». Совершенно очевидно, что эффективность процессов перехода «знание — данные», «информация — данные» и «знания — информация» зависит от эффективности их организации. Каковы организационные формы этих переходов?
Одной из форм организации данных являются базы данных. Под базой данных в настоящее время понимают организованную специальным образом совокупность данных, отображающую свойства и состояния конкретных объектов (и их отношений), принадлежащих некоторой «предметной области». Предметная область представляет собой часть «информационного пространства», отображающую информационные потребности некоторого ограниченного круга пользователей рассматриваемой базы данных. Под информационным пространством некоторого объекта или их множества понимается совокупность всех информационных компонентов этого объекта (или множества) независимо от способов и средств отображения этих компонентов.
Одна из важнейших характеристик информационного пространства — его структурированность, под которой понимается такое его свойство, при котором все содержание и особенности этого пространства представляются «информационными компонентами» и взаимосвязями между ними, выраженными в понятном виде.
В зависимости от степени структурированности выделяются следующие виды информационного пространства:
— неструктурированные (например, разговорная речь);
— слабо структурированные (например, письменность);
— структурированные (например, информационные системы);
— формализованные (для которых известны не только информационные компоненты и связи между ними, но и алгоритмы получения значений любого компонента, например технико-экономические показатели деятельности объекта);
— машиноструктурированные, для которых известны алгоритмы получения не только информационных компонентов, но и их структурных единиц.
Информационные компоненты объектов могут иметь различную природу — это документация (организационно-распределительная, экономическая, конструкторская и т. п.), отчеты о НИР, информация на машинных носителях, звуковая и видеоинформация, информация от датчиков и т. д.
Соответственно понятиям «информация» и «данные» в теории баз данных рассматриваются два различных аспекта: инфологический и да-талогический.
Инфологический аспект включает вопросы смыслового содержания информации независимо от способов ее представления и организации в памяти информационной системы и характеризует предметную область базы данных, то есть ту часть реального мира, информационные потребности которого реализуются конкретной базой данных.
Даталогический аспект включает вопросы представления и организации данных в памяти информационной системы и характеризует формы и методы представления информации посредством данных, правила смысловой интерпретации и преобразования данных.
При формировании данных в соответствии с целями информационной системы происходит абстрагирование от несущественных деталей описания тех или иных свойств предметной области. Переход от инфологического к даталогическому представлению предметной области (от ее инфологической к даталогической модели) представляет собой сложный процесс проектирования отображения: «описание предметной области» — «описание физического размещения данных в памяти информационной системы». На практике он представляет собой последовательность более простых, как правило, итеративных процессов проектирования менее сложных промежуточных отображений, представляющих собой информационные модели предметной области различного уровня абстрагирования.
Основными уровнями абстрагирования и представления данных в настоящее время принято считать внешний, концептуальный и внутренний. Поэтому при создании баз данных проектируются соответствующие внешние, концептуальные и внутренние модели. На внешнем уровне реализуются модели, ориентированные на отдельных пользователей, на концептуальном — на всех пользователей, на внутреннем — также на всех пользователей, но с учетом требований производительности и экономного использования ресурсов вычислительной среды.
Объектами моделирования в технологии баз данных служат «предметная область», «база данных» и «данные», поэтому в теории и технологии баз данных широко используются термины «модель предметной области», «модель базы данных», «модель данных». Анализ специальной литературы позволяет сделать вывод, что эти термины являются родовыми для группы терминов, обозначающих разновидность моделей соответствующего типа.
С середины 1960-х годов в рамках исследований проблем искусственного интеллекта начало развиваться новое направление, связанное с концепцией информации на основе отражения, которое впоследствии получило название «представление знаний». Интеллект организованных систем зависит от их способностей к обучению, которые заложены в систему. В одном случае эти способности состоят в простом запоминании информации, в другом — в умении приобретать навыки использования этой информации для решения задач, в третьем — формировать новое знание в процессе использования уже имеющегося и т. п. В интересах реализации двух последних видов способностей и развивается новое направление науки и техники — «представление знаний».
Совокупность средств информатики, обеспечивающих поддержку представления знаний, именуется банком знаний. Этот комплекс включает в себя базу знаний, программные и технические средства, обеспечивающие процессы формирования, использования и коррекции базы знаний, а также дедуктивные машины для логических выводов, систем и т. д.
Основными формами материализации, овеществления и обособления знаний, превращения их в информацию, а также обратной трансформации информации в знания являются книги, журналы, материалы конференций, совещаний, симпозиумов, конгрессов и других временных объединений специалистов; репринты и препринты; научно-техническая документация и проекты; кино-, теле- и видеофильмы; фонограммы; научно-технические отчеты и диссертации; патенты и т. д.
5.Статические законы движения информации
Если представить общественное информационное производство в виде множества взаимосвязанных информационных производств, то в нем можно наблюдать потоки документов и/или записей. Эти потоки формируются благодаря как фиксированным связям между отдельными информационными производствами, так и временным разовым связям, возникающим по мере необходимости. В первом случае информация распространяется по заранее установленному регламенту (контракт, кооперация, подписка и др.) и не требует многократного оформления запроса. В таких случаях принято считать, что действует постоянный запрос. Во втором случае для получения информации заинтересованное информационное производство должно отправить запрос другому производству, которое по своей технологии подготовит и отправит заказчику ответ в виде записи или документа либо массивов записей или документов.
Наблюдая процессы передачи информации, можно заметить, что между отдельными субъектами общественного информационного производства идет интенсивный обмен информацией, в то время как между другими его практически нет. В этом случае мы говорим о наличии или отсутствии у субъектов взаимного интереса. Из этого следует, что предложить общую меру интереса, применимую для каждого конкретного случая, очень трудно. Данный показатель зависит от многих факторов, то есть, по терминологии математики, он является функцией многих аргументов. Перечислить все эти факторы или аргументы не представляется возможным. Для наших целей достаточно рассмотреть зависимость показателя интереса от трех обобщенных факторов: информационного расстояния — R, информационной сложности — S и старения — Т.