Создатели WWW с самого начала понимали важность грамотной организации поиска информации в Сети, и первые специализированные поисковые сайты, получившие название поисковых служб, появились на Западе в 1994 г., а в нашей стране они начали работать двумя годами позже, в 1996 г.
Поисковые службы бывают двух видов: с ручным и автоматическим обновлением каталогов.
Поисковые службы с ручным обновлением каталогов называются рубрикаторами. Если хозяин сайта хочет, чтобы его сайт попал в каталог, он должен заполнить анкету на Web-странице рубрикатора, которую потом вручную проверит сотрудник сервера и занесет информацию в нужную рубрику базы данных.
Примером такой поисковой службы является сайт www.rambler.ru (рис. 3.112). Как видно, все Web-сайты, включенные в его базу данных, разбиты на категории, которые перечислены под заголовком Рейтинг Топ 100. Иногда пользоваться таким структурированным каталогом бывает довольно удобно. Например, вы занимаетесь поисками работы и хотите получить список всех сайтов Рунета, на которых публикуются объявления работодателей. Для этого достаточно найти пункт Работа и щелкнуть по нему левой кнопкой мыши. Откроется новое окно (рис. 3.113), в котором будут перечислены нужные сайты.
Обратите внимание, что сайты ранжированы по статистике посещаемости, то есть наиболее популярные сайты в списке идут первыми. После названия сайта идет его краткое описание, впрочем не страдающее полнотой информации. Название сайта – это гиперссылка, каждую из которых лучше открывать в новой вкладке, чтобы результаты поиска оставались неприкосновенными, ведь вам к ним нужно будет возвращаться, чтобы открыть новую ссылку. Создайте в Закладках папку Работа и поместите туда закладки сайтов, которые вы планируете посещать в дальнейшем. Практика показывает, что наиболее посещаемых и, следовательно, наиболее полезных с точки зрения поиска информации сайтов в каждой данной рубрике немного. Посмотрите, как снижается посещаемость хотя бы в первой десятке сайтов поиска работы: если у первого в списке 25,5 тыс. посетителей, то у десятого (его на картинке не видно) менее 4 тыс.
Рис. 3.112. Главное окно программы Rambler
Для интересующихся подробностями несколько определений.
Хост – это уникальная пара IP-адреса и IP-адреса прокси-сервера (если посетитель им пользуется). Уникальность сохраняется в течение одного дня, недели или календарного месяца – в зависимости от типа предоставляемой статистики. Новым считается уникальный хост, с которого еще не было зарегистрировано ни одного посещения с начала текущего календарного месяца.
Визит – это загрузка посетителем страницы сайта, на которой установлен счетчик.
Счетчиками называются крохотные программы, которые устанавливаются на Web-страницах и ведут подсчеты посещаемости.
Посетители – считаются по количеству файлов cookie, которые выдаются каждому посетителю. Если в браузере посетителя отключен прием cookie, то посетитель сайта не засчитывается.
Рис. 3.113. Результаты поиска
Наибольшее распространение в Интернете получил второй вид поисковых служб – С автоматическим обновлением каталогов. В основе каждой такой службы лежит использование программы-«паука», которая постоянно «ползает» по паутине Internet и автоматически собирает информацию о страницах. На самом деле таких «пауков» используют и Службы с ручным обновлением каталогов, только для решения другой задачи. Там они проверяют а не устарело ли содержимое сайтов, занесенных в базу. Если, например, какая-то вакансия закрывается, то ее податель удаляет ее с сайта, а ссылка на нее в базе останется, создавая и работодателям и соискателям кучу лишних проблем. Чтобы их не возникало, робот-«паук», обнаружив, что ссылка в базе никуда больше не ведет, удалит ее.
На практике большинство современных поисковых систем предоставляют пользователю оба варианта поиска – на выбор, но на практике гораздо чаще пользуются поисковой службой с автоматическим обновлением каталогов.
Для поиска информации в иноязычных (обычно англоязычных) сегментах Интернета обычно пользуются иностранными поисковыми системами, такими, например, как www.yahoo.com, www.altavista.com, www.hotbot.com, и другими, но они требуют знания английского языка.
В русском сегменте Интернета можно выделить четыре наиболее популярные поисковые системы:
• Яndex (www.yandex.ru);
• русский филиал международного проекта Google (www. google.ru);
• Апорт (www.aport.ru);
• Рамблер (www.rambler.ru).
Вы можете спросить: а зачем, собственно, четыре поисковика? Достаточно и одного... Это так и не так. Во-первых, каждая поисковая система имеет свои, фирменные алгоритмы работы, поэтому, если вы попробуете поискать одно и то же разными поисковиками, результаты получатся не полностью идентичными. Иногда это оказывается весьма полезным. Во-вторых, современные поисковые системы, как правило, входят в состав так называемых интернет-порталов, которые кроме поиска предоставляют множество других услуг. Например, Яndex предлагает бесплатные почтовые ящики, показывает сводку погоды, котировки Центробанка, телепрограмму, афишу кино и многое другое (рис. 3.114). Не все, однако, знают, что некоторое поисковые системы имеют «облегченное» окно, в котором размещены только те элементы, которые необходимы для поиска. У Яndex это www.ya.ru, а у Апорта – www.au.ru (рис. 3.115 и 3.116).
Рис. 3.114. Окно Яndex
Рис. 3.115. Окно Апорт-Лайт
Рис. 3.116. Окно облегченной версии Яndex
Главным элементом окна любой поисковой системы является специальное поле, куда нужно ввести запрос.
Запрос – это входное сообщение для поисковой системы, содержащее требование на выдачу информации.
Определение звучит внушительно и не очень-то понятно, но на самом деле все обстоит не так уж сложно. В самом простом случае запросом будет то, что вы хотите найти. Например, вы хотите с помощью поисковой системы Яndex узнать расстояние от Земли до Луны. Напишите в строке поиска расстояние до Луны и нажмите кнопку Найти. Через несколько секунд вы получите результат (рис. 3.117). Перейдя по первой же ссылке, на сайте www.astrolab.ru вы прочитаете, что «Луна движется вокруг Земли не по окружности, а по эллипсу, поэтому ее расстояние от Земли не остается постоянным. В среднем оно составляет 384 400 км». Задача решена. Просто, не правда ли?
Рис. 3.117. Результат поиска
На практике, однако, для поиска нужной информации нередко приходится перерыть буквально горы Web-страниц, и, чтобы сделать поиск наиболее эффективным, полезно научиться правильно составлять запросы. Американский писатель Роберт Шекли завершил свой рассказ «Верный вопрос» словами: «Чтобы правильно задать вопрос, нужно знать бo?льшую часть ответа». Это в полной мере относится к работе с поисковыми системами. Например, если вы в строке поиска напишете реферат по биологии, то Яndex выдаст вам ссылки более чем на 200 тысяч страниц. И что вы с ними будете делать? Значит, запрос должен быть максимально конкретным. С другой стороны, если вы попробуете найти «ихтиофауна реки Клязьма» (именно так как написано, в кавычках, скоро автор объяснит, зачем они нужны), вы получите нулевой результат: Искомая комбинация слов нигде не встречается. Значит, слишком детальные запросы тоже не годятся. Как же правильно составлять запросы? Давайте обсудим этот важный вопрос более подробно на примере поисковой системы Яndex.