«Данными называют факты, сведения, представленные в формализованном виде (закодированные), занесенные нате или иные носители и допускающие обработку с помощью специальных технических средств» [1].
Это определение можно отнести и к понятию «информация», т. е. являются ли понятия «данные» и «информация» синонимами или имеют различия, определить невозможно.
«Данные – это материальные объекты произвольной формы, выступающие в качестве средства представления информации. Преобразование и обработка данных позволяют извлечь информацию, т. е. данные служат исходным «сырьем» для получения информации. Фиксация информации в виде данных осуществляется с помощью конкретных средств общения на конкретном физическом носителе» [4].
Согласно данному определению данные, будучи средством представления информации, ею как таковой не являются, кроме того, из этого определения можно также сделать вывод, что фиксированные данные есть информация. Налицо явное противоречие.
«Сигналы, зарегистрированные на материальном носителе, называются данными. Данные несут информацию о событии, но не являются самой информацией, так как одни и те же данные могут восприниматься (отображаться или интерпретироваться) в сознании разных людей совершенно по-разному. Чтобы получить информацию, имея данные, необходимо к ним применить методы, которые преобразуют данные в понятия, воспринимаемые человеческим сознанием. Таким образом, можно считать, что информация – это продукт взаимодействия данных и адекватных методов» [5].
Данное определение также содержит противоречие: данные и несут информацию о событии (т. е. содержат в себе информацию), и не являются ею.
«Данные – формализованное представление сообщения о любых фактах, действиях, предположениях, которые могут быть описаны понятным для вычислительного устройства способом, т. е. данные представляются сигналами. Человек работает с данными, чтобы получить информацию. Поэтому неправильно отождествлять данные и информацию. Информация – это интерпретация данных. Компьютер собирает и обрабатывает данные, чтобы пользователь получил информацию» [6].
В понятие «информация» входит не только интерпретация данных, так как информация кроме рассмотрения ее на смысловом уровне может рассматриваться на вероятностном и прагматическом уровне.
«Данные – это особая форма представления информации. Под данными понимается информация, представленная обычно в цифровой форме или в каком-либо другом формализованном виде. Данные – это такой вид информации, который легко закодировать и передавать в форме дискретных электрических сигналов. Слова «данные» и «информация» кажутся синонимами. Тем не менее, в контекстах, относящихся к обработке данных в информационных системах, они имеют различные значения. Здесь под данными понимается то, что поступает на вход системы обработки. Информация – это то, что получается на выходе системы обработки данных, это переработанные данные» [3].
Это определение наиболее близко к разрешению этого противоречия. Однако и здесь оно присутствует, так как согласно приведенному выше определению, если информация – это то, что получается на выходе системы обработки, а данные – это то, что поступает на вход этой системы, то при подаче этой информации на вход другой системы обработки она автоматически переходит в данные.
По мнению автора данного учебного пособия, противоречие лежит в плоскости разных подходов к трактовке понятия информации и может быть устранено путем принятия определенных соглашений (правил).
Соглашение 1
При синтаксическом (вероятностном) подходе к определению этих понятий «информация» и «данные» – синонимы.
Соглашение 2
При семантическом (смысловом) подходе следует разделять входную информацию, поступающую на вход системы обработки информации в данный момент времени, и выходную информацию, и данные являются синонимом входной информации. Таким образом, подданными следует понимать входную информацию, поступающую на вход системы обработки информации в данный момент времени и определенным образом структурированную (т. е. представленную в форме, пригодной для ее передачи и обработки) в зависимости от целей, преследуемых системой передачи и обработки информации.
Соглашение 3
При прагматическом подходе данные и информацию не следует отождествлять и информация может рассматриваться как интерпретация данных.
6.2. Типы и структуры данных
Под типом данных (data type) понимается множество величин, объединенных определенными признаками и совокупностью допустимых преобразований.
Так, если в качестве объединяющего признака используется вид данных, то данные можно разделить на следующие типы:
• символьные;
• текстовые;
• звуковые;
• графические.
Например, в MS Excel выделяются три основных типа данных: число, текст и формула.
Если в качестве объединяющего признака использовать способ представления данных в вычислительных системах (алгоритмических языках программирования), то данные можно разделить на следующие типы:
• целочисленный – используется для представления целых чисел;
• вещественный – используется для представления чисел с плавающей запятой (точкой);
• строковый – используется для представления строки символов;
• логический – используется для представления логических значений «ложь» или «истина»;
• указательный – используется для ссылки на другой объект и т. д.
Например, в объектно-ориентированном языке программирования Visual Basic вводятся следующие типы данных: целочисленный тип обозначается Byte (целые числа от 0 до 255); Long (целые числа двойной длины); Integer (целые числа от -32768 до 32767); Single (вещественные числа одинарной точности с плавающей точкой); Double (вещественные числа двойной точности с плавающей точкой); String (текстовая строка); Boolean (логические значения, true – «истина» и false – «ложь»); Object (ссылка на другой объект).
Если в качестве объединяющего признака выбрать пригодность данных к решению задач управления, то данные можно разделить на данные, которые:
• используются при принятии решений;
• обычно непосредственно не используются при принятии решений, но накапливаются для возможного использования в определенных ситуациях;
• не используются при принятии решений и их использование не предусматривается, такие данные избыточные.
Таким образом, в зависимости от принятого классификационного признака данные можно разделять на типы.
Под структурой данных (data structure) понимается множество элементов данных, которые определенным образом объединены и упорядочены.
Для объединения данных применяют линейные, табличные, иерархические и сетевые структуры.
Линейная структура данных, называемая также списком, – это упорядоченная структура, в которой адрес элемента данных однозначно определяется его индексом (номером). Примером линейной структуры может быть список сотрудников коммерческой фирмы и т. д. В списках обычно новый элемент начинается с новой строки. Если элементы располагаются в строку, вводят разделительные знаки между элементами.
Табличная структура данных – это упорядоченная структура, в которой адрес элемента данных однозначно определяется двумя числами – номером строки и номером столбца, на пересечении которых находится ячейка с исходным элементом. Характерным примером такой организации данных являются данные, записанные в соответствующие ячейки программы MS Excel.
Иерархическая структура данных – это упорядоченная структура, в которой адрес каждого элемента определяется путем (маршрутом доступа), идущим от вершины структуры к данному элементу. В иерархической структуре элементы распределены по уровням. Каждый элемент более высокого уровня может состоять из элементов нижнего уровня, а элемент нижнего уровня может входить в состав только одного элемента более высокого уровня. Примером такой структуры является левая часть окна утилиты «Проводник» операционной системы Windows (рис. 6.1) или почтовые адреса.
Сетевая структура – структура, в которой элементы связаны между собой произвольным образом, например сетевая база данных.
Кроме приведенных выше существуют структуры данных, определяемые той или иной предметной областью. Например, в системах управления базами данных (СУБД) данные могут быть объединены и упорядочены в следующие структуры:
• реляционная;
• иерархическая;
• сетевая.
В математических и других дисциплинах могут использоваться такие структуры данных, как массив (структурированный тип данных, состоящий из некоторого числа элементов одного типа), запись (совокупность элементов данных разного типа), множество (тип данных, состоящий из однотипных неповторяющихся элементов) и т. д.