ТЕХНОЛОГИИ: Чистий Интернет
Автор: Александр Клименков
Сейчас понятия World Wide Web и Интернет являются практически синонимами. И тем, кто начал пользоваться Сетью в последние годы, невдомек, зачем перед адресом писать замысловатую строку «http://". Многие ее и не пишут, а сразу набирают адрес – и все работает. Я и сам так делаю, но помню времена, когда большая часть информации в Сети была текстовой, а картинки использовались только по делу и очень умеренно. Ни о каких flash-роликах, потоковом видео, mp3-файлах тогда и слыхом не слыхивали. Даже о протоколе FTP ныне знают немногие.
Классика
Взаимодействие браузера с серверами Gopher по простоте напоминает античность. За протоколом до сих пор закреплен 70-й порт TCP. После того как клиент соединился с сервером, он посылает строку, содержащую запрос на нужный документ, либо пустую строку для получения первой страницы сайта. Сервер отвечает и закрывает соединение.
Развитие технологий идет семимильными шагами. Сейчас, при непрерывно возрастающей пропускной способности каналов связи, вроде и странно говорить о «лишней» информации, которой наводнены страницы. Любой сайт, даже перегруженный баннерами и украшенный гениальным дизайном по самую крышу, грузится меньше чем за секунду. Казалось бы, грузи себе и читай. Но не секрет, что среди этой красоты с каждым годом все труднее отыскать нужную информацию.
Маленький несчастный текст статьи на новостных и информационных сайтах теряется и ужимается до узенькой колонки под натиском многочисленных баннеров, меню, ссылок и заголовков. При созерцании всего этого безобразия меня охватывает ностальгия, начинаешь вспоминать тот старый, текстовый Интернет. И понимаешь, что, с одной стороны, такая «примитивность» (по современным меркам) была продиктована скудными техническими возможностями каналов передачи информации, серверов и клиентов. Но с другой – она имела много полезных свойств, которые были утрачены или отринуты на пути стремительного прогресса технологий.
Но не все потеряно, сохранились еще на просторах Интернета оазисы спокойствия и простоты, в которых можно не опасаться назойливой рекламы, надоедливого дизайна и огромных рекламных баннеров. Тихое, гладкое озеро чистой информации, не испорченной городским смогом рекламных технологий. О таких оазисах, а точнее, о том, как их сотворить для себя своими руками, и хотелось бы поговорить в этой статье.
Gopher: немного истории
Кто сейчас помнит о протоколе Gopher? Разве что кучка энтузиастов да любители истории технологий. А в свое время он был широко распространен в Интернете и являлся предшественником World Wide Web. По некоторым данным , до 1995 года Gopher был самой динамично развивающейся технологией Интернета. Темпы роста числа соответствующих серверов опережали темпы роста серверов всех других типов. В 1993 году в мире было более полутора тысяч gopher-серверов.
Gopher фактически являлся системой распределенного поиска и передачи документов одновременно. Причем эти возможности реализовывались не как дополнительные сервисы-надстройки, подобно современным поисковым машинам, а были встроены в систему как ее базовые функции.
Представьте себе Сеть в виде гигантского виртуального диска, содержащего каталоги и файлы (все это называлось «gopher-пространство»). Причем расположены каталоги не хаотически и названы не как попало. Текстовая система ссылок позволяет быстро и без проблем находить нужную информацию.
С помощь специальной программы Veronica непосредственно в системе Gopher осуществлялся поиск с использованием специального языка запросов, построенного на ключевых словах. Напомню, что эта система работала не только задолго до появления современных поисковых систем, но и задолго до появления самого WWW.
Содержимое каждого каталога фактически описывается текстовым файлом, в котором каждая строка – это указатель либо на файл, либо на другой каталог. Строки могут иметь всего пять атрибутов:
• код типа строки или каталога;
• строка описания;
• путь к файлу в файловой системе на сервере;
• доменное имя сервера, на котором расположен файл;
• номер порта сервера.
Первый атрибут состоит из одного символа и определяет, является ли данная строка каталогом («1») или файлом. Если это файл, то код определяет его формат. На серверах Gopher можно хранить текстовые файлы, zip-архивы, html-документы, изображения в различных форматах (по умолчанию поддерживается GIF) и бинарные файлы. Кроме того, файл может являться ссылкой на поисковый или запасной сервер.
По информации Википедии , в настоящее время в Интернете насчитывается меньше сотни gopher-серверов. Большинство из них мертвы и не обновляются владельцами. Но кое-где еще теплится gopher-жизнь. Остались еще энтузиасты, которые поддерживают этот протокол, открывают новые серверы – скорее всего из любви к искусству, ведь технологии ушли далеко вперед. По меткому выражению автора той же статьи в Википедии: «Сегодня Gopher напоминает почти заброшенный уголок Интернета – можно, например, публиковать адреса электронной почты, не беспокоясь о спаме, и публиковать любую информацию, не заботясь об объемах трафика».
Что же делать жаждущим тишины и покоя? В Internet Explorer версий 5 и 6 для Windows поддержка Gopher отключена с июня 2002-го, с выходом патча, предназначавшегося для исправления уязвимости в обработчике протокола Gopher; однако ее можно вернуть, отредактировав реестр. В IE 7 Gopher не поддерживается вообще. Кстати, не исключено, что именно IE помог забить гвоздь в крышку гроба протокола: в этом браузере Gopher выглядит ужасно. Firefox полностью поддерживает Gopher. Для Opera требуется использовать специальный прокси-сервер.
Тем, кто заинтересовался этим протоколом, советую посетить страницу в англоязычной Википедии , которая содержит исчерпывающее количество ссылок и рекомендаций по работе с Gopher в условиях современного Интернета.
Собственные ленты
Существуют способы сломить упрямство владельцев сайтов с RSS, желающих заработать на рекламе и завлечь побольше посетителей. Один из них – создать свою новостную ленту. Я имею в виду не просто аггрегирование новостных лент с других сайтов, а создание ленты на основе контента сайта, на котором экспорт новостей либо не поддерживается, либо осуществляется в неудобном для вас формате.