С помощью
lseek
можно обращаться с файлами как с большими массивами, однако при этом время доступа к ним возрастает. Например, следующая функция читает любое число байтов из любого места в файле:
get(fd, pos, buf, n) /* read n bytes from position pos */
int fd, n;
long pos;
char *buf;
{
if (lseek(fd, pos, 0) == -1) /* get to pos */
return -1;
return read(fd, buf, n);
}
Упражнение 7.3
Модифицируйте
readslow
так, чтобы обрабатывать имя файла в качестве аргумента, если оно присутствует. Добавьте
-е
:
$ readslow -е
заставляет
readslow
искать конец входного потока, прежде чем начать чтение. Каковы функции
lseek
при работе с программным каналом?
Упражнение 7.4
Перепишите
efopen
из гл. 6, чтобы вызвать error.
7.2 Файловая система: каталоги
Наша следующая тема — как ориентироваться в иерархии каталогов. При этом мы будем использовать не новые системные вызовы, а лишь несколько старых в новом контексте. В качестве примера приведем функцию
spname
, которая пытается справиться с неверно написанными именами файлов. Функция
n = spname(name, newname);
ищет файл с именем, "достаточно близким" к name. Если такое имя найдено, оно копируется в
newname
. Значение n, возвращаемое
spname
, равно -1, если ничего достаточно близкого не найдено, 0 — при точном совпадении и 1, если была сделана коррекция.
Spname
является удобным дополнением к команде p: если вы пытаетесь печатать файл, но неверно написали имя,
p
спросит вас, не имели ли вы в виду что-либо другое:
$ p /urs/srx/ccmd/p/spnam.с
Очень плохое имя
"/usr/src/cmd/p/spname.с"? y
Предложенная коррекция принята
/* spname: возвращает верно написанное имя файла */
...
Пока мы пишем имя файла,
spname
пытается исправить каждую его составную часть, в которой несовпавшая буква была опущена, оказалась лишней, просто неверна или поменялась местами с другой буквой. Это удобное средство рассчитано на того, кто печатает не очень внимательно.
Прежде чем писать программу, уместно сделать короткий обзор структуры файловой системы. Каталог представляет собой файл, содержащий список имен файлов и указание, где они размещены. Место размещения определяется индексом в так называемой индексной таблице файлов. В записи индексной таблицы содержится вся информация о файле, кроме его имени. Строка каталога, таким образом, состоит из двух элементов — индекса файла и его имени. Точное описание можно найти в файле
<sys/dir.h>
:
$ cat /usr/include/sys/dir.h
#define DIRSIZ 14 /* максимальная длина имени файла */
struct direct /* структура строки каталога */
{
ino_t d_ino; /* номер индексного дескриптора */
char d_name[DIRSIZ]; /* имя файла */
};
$
"Тип"
ino_t
это
typedef
, описывающий индекс в индексной таблице. Он является коротким целым без знака (
unsigned short
) в версиях системы для PDP-11 и VAX и не должен включаться в программу, так как может быть иным на другой машине. Поэтому мы воспользуемся определением типа
typedef
. Полный набор "системных" типов находится в
<sys/types.h>
, который должен быть включен до
<sys/dir.h>
.
Действия
spname
достаточно прямолинейны, хотя и требуют выполнения нескольких граничных условий. Предположим, что имя файла
/d1/d2/f
. Основная идея состоит в следующем: отделить первую компоненту (
/
), найти в каталоге имя, близкое к следующей компоненте (
d1
), затем найти имя, близкое к
d2
, и т.д. до тех пор, пока не будет достигнуто полное совпадение для каждой составной части. Если на какой-то стадии в каталоге не окажется подходящего кандидата, поиск прекратится.
Мы разбили процесс на три функции. Сама
spname
выделяет компоненты пути и составляет из них имя файла, наилучшим образом совпадающее с исходным. Функция
mindist
ищет в данном каталоге файл с именем, ближайшим к составленному функцией
spname
. Функция
spdist
вычисляет "расстояние" между двумя именами.
/* spname: return correctly spelled filename */
/*
* spname(oldname, newname) char *oldname, *newname;
* returns -1 if no reasonable match to oldname,
* 0 if exact match,
*1 if corrected.
* stores corrected name in newname.
*/
#include <sys/types.h>
#include <sys/dir.h>
spname(oldname, newname)
char *oldname, *newname;
{
char *p, guess[DIRSIZ+1], best[DIRSIZ+1];
char *new = newname, *old = oldname;
for (;;) {
while (*old == '/') /* skip slashes */
*new++ = *old++;
*new = '\0';
if (*old == '\0') /* exact or corrected */
return strcmp(oldname, newname) != 0;