12. Дайте характеристику основным позиционным системам счисления.
13. В каких двух видах может быть представлена информация? Охарактеризуйте их и приведите примеры.
14. Что такое кодирование? Приведите примеры кодирования из жизни.
15. Что является основной единицей представления информации в ЭВМ?
16. Как кодируются различные виды информации в ЭВМ?
17. С помощью каких единиц измеряют информацию?
Глава 2
Структура хранения данных на внешних носителях информации
2.1. Единица хранения данных
При хранении данных решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ (если доступ не обеспечен, то это не хранение). Для обеспечения доступа необходимо, чтобы данные имели упорядоченную структуру. При этом образуются адресные данные. Без них нельзя получить доступ к нужным элементам данных, входящих в структуру.
Поскольку адресные данные тоже имеют размер и тоже подлежат хранению, хранить данные в виде мелких единиц, таких, как байты, неудобно. Их неудобно хранить и в более крупных единицах (килобайтах, мегабайтах и т. п.), поскольку частичное заполнение одной единицы хранения приводит к неэффективности хранения.
В качестве единицы хранения данных принят объект переменной длины, называемый файлом.
Файл – это последовательность произвольного числа байтов, обладающая уникальным собственным именем.
Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла.
Поскольку в определении файла нет ограничений на размер, можно представить себе файл, имеющий 0 байтов (пустой файл), и файл, имеющий любое число байтов.
В определении файла особое внимание уделяется имени. Оно фактически несет в себе адресные данные, без которых данные, хранящиеся в файле, не станут информацией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адресацией, имя файла может хранить и сведения о типе данных, заключенных в нем. Для автоматических средств работы с данными это важно, поскольку по имени файла они могут автоматически определить адекватный метод извлечения информации из файла.
Имя файла состоит из двух частей: собственно имени и расширения файла. Например:
Собственно имя файла может состоять из букв русского и английского алфавитов, цифр и специальных символов. При этом его длина не должна превышать 256 символов.
В зависимости от расширения все файлы делятся на две большие группы: исполняемые и неисполняемые.
Исполняемые файлы – это такие файлы, которые могут выполняться самостоятельно, т. е. не требуют каких-либо специальных программ для их запуска. Имеют следующие расширения:
– exe – готовый к исполнению файл (tetris.exe; winword.exe);
– com – файл операционной системы (command.com);
– sys – файл операционной системы (Io.sys);
– bat – командный файл операционной системы MS-DOS (autoexec.bat).
Неисполняемые файлы для запуска требуют установки специальных программ. Так, например, для того чтобы просмотреть текстовый документ, требуется наличие какого-либо текстового редактора. По расширению неисполняемого файла можно судить о типе данных, хранящихся в данном файле. Вот несколько примеров:
2.2. Файловая структура
Требование уникальности имени файла очевидно – без этого невозможно гарантировать однозначность доступа к данным. В средствах вычислительной техники требование уникальности имени обеспечивается автоматически – создать файл с именем, тождественным уже имеющемуся, не могут ни пользователь, ни автоматика.
Хранение файлов организуется в иерархической структуре, которая в данном случае называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки).
Каталоги (папки) – важные элементы иерархической структуры, необходимые для обеспечения удобного доступа к файлам, если файлов на носителе слишком много. Файлы объединяются в каталоги по любому общему признаку, заданному их создателем (по типу, по принадлежности, по назначению, по времени создания и т. п.). Каталоги низких уровней вкладываются в каталоги более высоких уровней и являются для них вложенными. Верхним уровнем вложенности иерархической структуры является корневой каталог диска.
Все современные операционные системы позволяют создавать каталоги. Правила присвоения имени каталогу ничем не отличаются от правил присвоения имени файлу, хотя негласно для каталогов не принято задавать расширения имен. Все промежуточные каталоги разделяются между собой обратной косой чертой (\). На рисунке 2.1 приведен пример иерархической структуры диска C:
2.3. Имена внешних носителей информации
Диски, на которых хранится информация в компьютере, имеют свои имена – каждый диск назван буквой латинского алфавита, а затем ставится двоеточие. Так, для дискет всегда отводятся буквы A: и B:. Логические диски винчестера именуются, начиная с буквы C:. После всех имен логических дисков следуют имена дисководов для компакт-дисков. Например, установлены: дисковод для дискет, винчестер, разбитый на 3 логических диска и дисковод для компакт-дисков. Определить буквы всех носителей информации. A: – дисковод для дискет;
C:, D:, E: – логические диски винчестера;
F: – дисковод для компакт-дисков.
Полное имя файла
Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путем доступа к нему. Понятно, что в этом случае на одном носителе не может быть двух файлов с тождественными полными именами.
Пример записи полного имени файла:
<имя носителя>\<имя каталога-1>\…\<имя каталога-М>\<собственное имя файла>
Вот пример записи двух файлов, имеющих одинаковое собственное имя и размещенных на одном носителе, но отличающихся путем доступа, то есть полным именем. Для наглядности имена каталогов (папок) напечатаны прописными буквами.
D: \Документы\Сведения о студентах\2004—05 учебный год\Результаты аттестации. doc
D: \Деканат\Аттестация студентов\Результаты аттестации. doc
2.4. Файловые системы
Все современные дисковые операционные системы обеспечивают создание файловой системы, предназначенной для хранения данных на дисках и обеспечения доступа к ним. Принцип организации файловой системы – табличный. Поверхность жесткого диска рассматривается как трехмерная матрица, измерениями которой являются номера поверхности, цилиндра и сектора. Под цилиндром понимается совокупность всех дорожек, принадлежащих разным поверхностям и находящихся на равном удалении от оси вращения. Физическая структура хранения данных представлена на рисунке 2.2.
Рисунок 2.2. Физическая структура хранения информации
Данные о том, в каком месте диска записан тот или иной файл, хранятся в системной области диска в специальных таблицах размещения файлов (FAT-таблицах). Поскольку нарушение FAT-таблицы приводит к невозможности воспользоваться данными, записанными на диске, к ней предъявляются особые требования надежности и она существует в двух экземплярах, идентичность которых регулярно контролируется средствами операционной системы.
Наименьшей физической единицей хранения информации является сектор. Размер сектора равен 512 байт. Поскольку размер FAТ-таблицы ограничен, то для дисков, размер которых превышает 32 Мбайта, обеспечить адресацию к каждому отдельному сектору не представляется возможным. В связи с этим группы секторов условно объединяются в кластеры. Кластер является наименьшей единицей адресации к информации. Размер кластера, в отличие от размера сектора, не фиксирован и зависит от емкости диска.