Запоминать местоположение данных именно в таком виде, особенно, когда информации много, было бы довольно неудобно. Поэтому данные, которые записываются на диск, принято объединять в именованные последовательности – файлы. При этом в первых секторах диска хранится информация о том, какому имени файла соответствует какой адрес физического расположения данных на диске.
Например, было бы неудобно запоминать, что программа-редактор текстов записана на дорожке 10, сектора 12 и 13 и для ее запуска нужно обратиться к этим секторам. Вместо этого файлу данной программы дается имя и назначаются соответствующие данные сектора, о чем делается запись в начале диска. При обращении к этому файлу по имени компьютер будет искать его в своем в списке и, найдя его, автоматически обратится к нужным секторам, чтобы считать с них данные.
Файлом может являться и программа, которую можно запустить, и текст, набранный пользователем, и оцифрованный звуковой фрагмент, и любая другая последовательность данных.
Обычно имя файла каким-либо образом указывает на его содержимое. Например, файл стандартной программы-редактора текстов Блокнот из операционных систем семейства Windows носит имя notepad. Таким образом, пользователю легче ориентироваться в записанных на диске данных.
Итак, пользователь указывает только имя файла, а конкретное место его расположения на диске определяет операционная система.
В некоторых старых операционных системах, например MS-DOS, имя файла может состоять не более чем из восьми символов. Среди них могут быть только латинские буквы и некоторые специальные символы (например, подчеркивание или восклицательный знак).
В современных системах имя файла может быть очень длинным – например, до 255 знаков в последних версиях Windows. При этом в имени файла могут использоваться разные символы, в том числе пробелы и даже кириллица. Однако лучше не увлекаться употреблением русских букв в названиях файлов. Во-первых, они могут не восприниматься некоторыми системами, а во-вторых – в некоторых аварийных ситуациях извлечь или даже спасти такие файлы значительно труднее, чем файлы, в именах которых использованы только латинские буквы, а иногда и вовсе невозможно.
Формат файлов
Когда пользователь начинает работу с каким-либо файлом, системе необходимо знать, в каком формате он записан и с помощью какой программы его нужно открывать. Например, если файл содержит обычный текст, то он может быть прочитан в любой текстовой программе (например, Блокнот). Если файл является звуковым фрагментом, то его можно открыть в программе-проигрывателе или в каком-нибудь звуковом редакторе.
Если, например, попробовать открыть текстовый файл в звуковом редакторе, то вы, скорее всего, увидите сообщение об ошибке (неверный формат файла). В случае открытия звукового файла в виде текста компьютер выведет на экран бессмысленный набор знаков.
Чтобы программы и операционные системы могли определить тип файла, к его имени часто добавляют расширение, состоящее из небольшого количества символов. В старых системах вроде MS-DOS оно ограничивалось тремя символами, и хотя в современных системах, в том числе в Windows XP, такого ограничения нет, большинство файлов все равно содержит трехбуквенные расширения. От имени файла расширение отделяется точкой.
Во многих современных системах и в Интернете принят ряд стандартных расширений имен файлов. Некоторые из них приведены в табл. 6.1.
Таблица 6.1. Расширения имен файлов
Конечно, в ней перечислены не все возможные расширения и типы файлов. Каждая вновь создаваемая программа может использовать как уже имеющийся стандартный тип для своих рабочих файлов, так и иметь свой собственный. Например, графический редактор Adobe Photoshop работает со стандартными форматами рисунков (BMP, JPG, TIF и пр.), но в то же время имеет свой собственный файловый формат (PSD). В музыкальной программе Cubase можно работать со стандартными MIDI-файлами (MID) или звуковыми файлами (WAV), однако чаще используется оригинальный формат (CPR).
Кроме того, поскольку программ существует очень много, возможна ситуация, когда две или более программы будут стараться использовать одинаковое расширение для файлов своего формата. Например, расширение MUS традиционно применяется для нотных файлов формата Finale, однако его же имеют и нотные файлы совершенно другого формата MusicTime.
Получив команду открыть файл (это обычно осуществляется с помощью двойного щелчка мыши на имени или значке этого файла), система прежде всего определяет тип данного файла (как правило, по его расширению). Если файл окажется программой, то его содержимое загружается в память и передается процессору для исполнения. Если же файл имеет другой известный тип, то система сначала открывает ту программу, которая работает с таким типом файлов, и затем открывает его из нее. Если тип файла системе неизвестен, то пользователю будет предложено выбрать рабочую программу самому (рис. 6.1).
Рис. 6.1. Выбор программы для открытия файла.
Каталоги
Пока количество файлов на диске не превышает двух десятков, запомнить, что означают их имена, и разобраться в них довольно легко. Однако обычно файлов гораздо больше, особенно на дисках большого объема. Например, в то время как автор пишет эти строки, на жестких дисках его компьютера расположено около 30 000 различных файлов. Зачем же нужно такое огромное их количество и как в файлах разобраться?
Современные программы (за весьма редким исключением) никогда не состоят из одного исполняемого файла. Как правило, для работы одной программы требуется несколько десятков, а порой и сотен вспомогательных файлов (например, система Windows XP состоит из почти 10 000 файлов). Чтобы упорядочить их, удобно все файлы, относящиеся к определенной программе, объединить в одну группу.
Кроме того, в одну группу логично объединить файлы конкретного пользователя (если за компьютером работает несколько человек), а также разделить их по типам, назначению (для работы, развлечения, детей и т. д.) и т. п.
Такие группы файлов создавать можно и даже нужно. Их принято называть каталогами, директориями или, в новой терминологии, папками (Folders). Все каталоги, как и файлы, имеют свои имена. Внешне имена каталогов ничем не отличаются от имен файлов, хотя обычно не имеют расширений (однако теоретически могут иметь их).
Итак, некоторые файлы (а иногда и все) располагаются внутри каталогов (папок). Внутри одного каталога также может находиться другой каталог, в нем еще один и т. д.
Чтобы открыть файл, кроме его имени и расширения, необходимо указать путь к нему. Путь (Path) состоит из имен всех каталогов, внутри которых файл расположен. В системах MS-DOS и Windows это выглядит так: в начале пути к файлу указывается буквенное имя диска (логического раздела), после которого всегда ставится двоеточие, а затем через обратную косую черту (\) перечисляются имена каталогов, в которых расположен данный файл. Например, если вы записали звуковой файл и назвали его MySound.wav, а затем поместили в каталог Sounds, который, в свою очередь, расположен в папке MyFiles на жестком диске D:, то полное имя файла (включающее путь) будет выглядеть следующим образом:
D: \MyFiles\Sounds\MySound.wav
Порой возникает ситуация, когда файлы (а точнее – целые логические диски), которые прекрасно видны в одной операционной системе, бесследно исчезают в другой. Как правило, это связано с тем, что иногда операционные системы могут использовать разные файловые системы.