Введение
Информатика – это техническая наука, систематизирующая приемы создания хранения, воспроизведения, обработки и передачи данных средствами вычислительной техники, а также принципы функционирования этих средств и методы управления ими.
Основной задачей информатики является систематизация приемов и методов работы с аппаратными и программными средствами вычислительной техники. Цель систематизации состоит в выделении, внедрении и развитии передовых, наиболее эффективных технологий, в автоматизации этапов работы с данными, а также в методическом обеспечении новых технологических исследований.
Кардинальным отличием информатики от других технических дисциплин является тот факт, что ее предметная область изменяется чрезвычайно динамично.
Единство законов обработки информации в системах различной природы является фундаментальной основой теории информационных процессов, определяющей ее общезначимость и специфичность. Объектом изучения этой теории является информация.
Информатика рассматривает информацию как связанные между собой сведения, данные, понятия, изменяющие наши представления о явлении или объекте окружающего мира. Наряду с информацией в информатике часто употребляется понятие данные.
Данные могут рассматриваться как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся. В том случае, если появляется возможность использовать эти данные для уменьшения неопределенности о чем-либо, данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.
Суть всех компьютерных программ состоит в том, что они описывают преобразование некоторых начальных данных в конечные. Какие-то данные программа может использовать как промежуточные. Прежде чем выполнить какие-либо операции, надо иметь объекты, к которым данные будут применяться, и четко представлять себе структуру объектов, которые будут получены.
Развитие вычислительной техники и программирования сопровождалось эволюцией представлений о роли данных и их организации. Одним из свойств компьютеров является способность хранить огромные объемы информации и данных, обеспечивать легкий доступ к ним. Решая конкретную задачу, необходимо выбрать множество данных, представляющих реальную ситуацию. Затем надлежит выбрать способ представления этой информации. Представление данных определяется исходя из средств и возможностей, допускаемых компьютером и его программным обеспечением.
Однако очень важную роль играют и свойства самих данных, операции, которые должны выполняться над ними. С развитием вычислительной техники и программирования, средства и возможности представления данных получили большое развитие и теперь позволяют использовать как простейшие неструктурированные данные, так и данные более сложных типов, полученные с помощью комбинации простейших данных.
В заключение следует отметить, что такие параметры информации, как содержательность, достаточность, устойчивость, доступность, актуальность, достоверность непосредственно влияют на качественную и количественную структуру компьютерных данных, а также на их дальнейшую обработку и конечные преобразования.
1. Данные, их структура и типы
Данныенесут в себе информациюо событиях, произошедших в материальном мире, так как они являются регистрацией сигналов, возникших в результате этих событий. Однако данные не тождественны информации.
Данные – диалектическая составная часть информации. Они представляют собой зарегистрированные сигналы. При этом физический метод регистрации может быть любым: механическое перемещение физических тел, изменение их формы или параметров качества поверхности, изменение электрических, магнитных, оптических характеристик, химического состава и характера химических связей, изменение состояния электронной системы и многое другое. В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов.
Работа с большими наборами данных автоматизируется проще, когда данные упорядочены,то есть образуют заданную структуру. Существует три основных типа структур данных: линейная, иерархическая и табличная.
a) Линейные структуры – это списки. Список –это простейшая структура данных, отличающаяся тем, что каждый элемент данных однозначно определяется своим номером в массиве. Проставляя номера на отдельных страницах рассыпанной книги, мы создаем структуру списка. При создании любой структуры данных надо решить два вопроса: как разделять элементы данных между собой и как разыскивать нужные элементы.
Таким образом, линейные структуры данных (списки) – это упорядоченные структуры, в которых адрес элемента однозначно определяется его номером.
б) Табличные структуры – это такие структуры, у которых элементы данных определяются адресом ячейки. Он состоит не из одного параметра, как в списках, а из нескольких.
При хранении табличных данных количество разделителей должно быть больше, чем для данных, имеющих структуру списка. Если нужно сохранить таблицу в виде длинной символьной строки, используют один символ-разделитель между элементами, принадлежащими одной строке, и другой разделитель для отделения строк.
Таким образом, табличные структуры данных (матрицы)– это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая искомый элемент.
Рисунок 1. Пример представления табличной структуры данных
в) Иерархические структуры данных – это структуры, которые содержат в себенерегулярные данные, которые трудно представить в виде списка или таблицы. В иерархической структуре адрес каждого элемента определяется путем доступа, ведущим от вершины структуры к данному элементу. Иерархические структуры данных по форме сложнее, чем линейные и табличные, но они не создают проблем с обновлением данных. Их легко развивать путем создания новых уровней.
Недостатком иерархических структур является относительная трудоемкость записи адреса элемента данных и сложность упорядочения.
Рисунок 2. Пример представления иерархической структуры данных
В современной информационной системе выделяются два основных типа данных, это простые (неструктурированные) и более сложные – структурированные.
a) Простые (неструктурированные) типы данных
В математике принято классифицировать величины в соответствии с их характеристиками. Различают целые, вещественные, комплексные и логические величины, представляющие собой отдельные значения, множества значений или множества множеств. Аналогично и в информатике.
Целые числа, используемые компьютером, имеют те же свойства, что и целые числа в арифметике. Все вычисления с ними выполняются абсолютно точно (не приближенно). Имеется только одно отличие в свойствах компьютерных целых чисел – ограниченность диапазона: для каждой компьютерной системы имеется самое большое допустимое в ней целое число и самое малое, отрицательное. Это свойство компьютерных чисел связано с особенностями их кодирования в ячейках памяти компьютера.
Над действительными (или вещественными) числами могут быть выполнены операции сложения, вычитания, умножения и деления, так же, как и над математическими действительными числами. Однако все операции над действительными числами выполняются с точностью, не превосходящей некоторого фиксированного значения, вследствие того, что представления чисел в памяти компьютера имеют ограниченную длину, зависящую от конкретного компьютера и используемой системы программирования.
Главным свойством литерных (символьных) данных является их упорядоченность, то есть свойство быть сравнимыми. Обычным признаком значения символьной или текстовой величины являются кавычки. Каждый символ имеет определенный числовой код (например, код символа латинской буквы 'А' в большинстве кодировок 63) и упорядочение происходит в соответствии с этими числовыми кодами. Как правило, имеются функции, позволяющие получить по символу его код и символ по коду.
К логическим данным, способным принимать значения «истина» или «ложь». Иногда можно использовать операции импликации («если»), эквиваленции («если и только если») и тому подобное.
б) Структурированные типы данных
Значительно большие возможности заключают в себе структурированные данные, по сравнению с простыми.
Структурированные типы данных классифицируют по следующим основным признакам: однородная – неоднородная, упорядоченная – неупорядоченная, прямой доступ – последовательный доступ, статическая – динамическая. Эти признаки противостоят друг другу лишь внутри пары, а вне этого могут сочетаться.
Структуру называют упорядоченной,если между ее элементами определен порядок следования. Наличие индекса в записи элементов структуры уже указывает на ее упорядоченность.
По способу доступа упорядоченные структуры бывают прямого и последовательного доступа. При прямом доступе каждый элемент структуры доступен пользователю в любой момент независимо от других элементов.
Если у структуры размер (длина, количество элементов) не может быть изменен по ходу действия, а фиксирован заранее, то такую структуру называют статической.
Программные средства информатики иногда позволяют не фиксировать размер структуры, а устанавливать его по ходу решения задачи и менять при необходимости, что бывает очень удобно. Такую структуру называютдинамической.
Самым традиционным и широко известным из структурированных типов данных является массив (иначе называемый регулярным типом) – однородная упорядоченная статическая структура прямого доступа.