Один из ведущих специалистов по автоматизированному поиску информации для целей конкурентной разведки в Интернете Андрей Масалович вообще считает, что наличие перечня последних найденных документов и информации о времени обновления базы – серьезное преимущество, благодаря которому многие специалисты все чаще выбирают Рамблер в качестве поисковика, с которого надо начинать работу по поиску в Интернете (сайт Андрея Масаловича www.tora-centre.ru/).
Кроме того, все, кому приходится заниматься поиском в Интернете профессионально, сходятся во мнении, что только использование нескольких поисковых машин может дать результат, претендующий на полноту ответа на вопрос – одна поисковая машина справиться с подобной задачей не способна. Связано такое положение вещей с тем, что, во-первых, поисковые роботы физически не успевают угнаться за стремительно растущим Интернетом, а во-вторых, с тем, что у разных поисковых машин разные алгоритмы обработки собранной информации, а значит, и разные результаты этой обработки. Наш опыт подтверждает правильность таких выводов.
В результате нет и не может быть полного совпадения результатов поиска в разных поисковых машинах, особенно когда речь идет о редком запросе.
–
ПРИМЕР
Поиск во всех трех системах точной фразы (фрагмента песни) «Дым, дым в твоих глазах» дал на момент написания статьи такие результаты.
Запрос: [“дым, дым в твоих глазах”]
Результат поиска.
Яндекс: страниц – 0.
Гугл: не найдено ни одного документа, соответствующего запросу “дым, дым в твоих глазах”.
Рамблер: Вы искали: “дым, дым в твоих глазах”, найдено сайтов: 1, документов: 1.
Результат этого поиска можно увидеть здесь: www.ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Dym_Dym_v_Glazakh.html
–
Это не значит, что Рамблер лучше всех. Это значит, что нельзя заранее знать, в какой поисковой системе и что именно удастся найти. В этом смысле показателен пример с поиском фразы, также фрагмента редкой песни: «Аэропорт аэропорт ночное зарево огней».
Итак, перейдем к рассмотрению работы с Рамблером. Основой для этого раздела послужили раздел «Помощь» Рамблера (www.rambler.ru/doc/help.shtml) и форма расширенного поиска (www.rambler.ru/cgi-bin/advanced.cgi?set=www).
Ресурсы, которые Рамблер индексирует. По утверждению самого Рамблера, он индексирует сайты, размещенные в следующих доменах первого уровня:
► Российская Федерация: .ru, .su;
► Украина: .ua;
► Белоруссия: .by
► Казахстан: .kz;
► Киргизия: .kg;
► Узбекистан: .uz;
► Грузия: .ge.
Сайты, находящиеся в других доменах, Рамблер, как он сам утверждает, игнорирует.
Для тех, кто хочет, чтобы сайт, расположенный в другой доменной зоне, был проиндексирован Рамблером, этот поисковик оставляет небольшую надежду на успех.
∆ Если Ваш сайт находится вне названных доменов (например, в зонах .com, .org, .net), но существенная часть сайта содержит русскоязычные материалы или, по Вашему мнению, он может представлять интерес для русскоязычной аудитории Рамблера, Вы можете отослать письмо на адрес [email protected] с просьбой включить Ваш сайт в число сканируемых, либо заполнить форму обратной связи. Наши сотрудники рассмотрят эту просьбу и примут решение о целесообразности такого включения[25].
Кроме того, Рамблер утверждает, что умеет извлекать гиперссылки из объектов Macromedia Flash, но не индексирует непосредственно сами тексты flash-объектов. Для таких технически продвинутых сайтов специалисты Рамблера советуют создавать HTML-копию.
Поддержка морфологии слов. Рамблер поддерживает морфологию слов по умолчанию. Отключение поддержки морфологии предусмотрено, но требует использования специального оператора – слово должно быть взято в кавычки. Мы сейчас не будем останавливаться на всех особенностях использования кавычек, а поговорим о них ниже. Наш эксперимент подтвердил, что Рамблер морфологию слов действительно поддерживает.
Скобки. Как и Яндекс, Рамблер позволяет использовать скобки для группировки слов и применения ко всем словам, расположенным в скобках, одного оператора, который пишется перед скобкой. Этим он ничем не отличается от Яндекса, поэтому подробнее мы применение скобок рассматривать не будем.
Транслитерация. Люди довольно часто делают опечатки при вводе текста и вместо русских букв печатают их английских «близнецов». Например, часто так происходит с буквой «с». Рамблер говорит, что старается исправлять такие опечатки, но не гарантирует результата. Эксперимент показал, что Рамблер действительно справляется с опечатками транслитерации, если их количество в слове невелико. Приведу часть результатов.
–
ПРИМЕР
Запрос 1 (все буквы русские): [“глОКлАя кУздРА”]
Результат поиска.
Вы искали: “глОКлАя кУздРА”, найдено сайтов: 9, документов: 37.
Запрос 2 (заглавные буквы – латинские): [“глOKлAя кYздPA”]
Результат поиска.
Не найдено ни одного документа, полностью соответствующего запросу
“”глOKлAя кYздPA””.
Запрос 3 (заглавные буквы – латинские): [“глOклая куздPа”]
Результат поиска.
Вы искали: “глOклая куздPа”, найдено сайтов: 9, документов: 37.
–
Чтобы не загружать читателя лишними примерами, скажем лишь, что при трех опечатках правильный поиск еще проводился, но после появления четвертой неправильно написанной буквы результат поиска стал нулевым. Рамблер в этом случае просто порекомендовал пользователям внимательнее относиться к вводу текста.
Регистр букв. Как правило, Рамблер не учитывает регистр, причем распространяет это правило не только на слова запроса, но и на операторы.
Действительно, запросы «глоклая куздра» и «ГлоКЛаЯ КУздРа» дали одинаковые результаты.
–
ПРИМЕР
Запрос 1: [“глоклая куздра”]
Результат поиска.
Вы искали: “глоклая куздра”, найдено сайтов: 12, документов: 44.
Запрос 2: [“ГлоКЛаЯ КУздРа”]
Результат поиска.
Вы искали: “ГлоКЛаЯ КУздРа”, найдено сайтов: 12, документов: 44.
–
Однако Рамблер сообщает, что он делает исключение из этого правила, если в запросе два и более слова подряд написаны с заглавной буквы. По его утверждению, он старается искать эти слова также с заглавной буквы. Таким образом, Рамблер пытается помочь тем, кто ищет имена собственные или географические названия.
В нашем эксперименте это не подтвердилось. Результаты за про са – как с заглавной, так и с прописной буквы – оказались одинаковыми, и в выдаче присутствовали как релевантные слова, написанные в обоих регистрах.