Литмир - Электронная Библиотека
Содержание  
A
A

Один из ведущих специалистов по автоматизированному поиску информации для целей конкурентной разведки в Интернете Андрей Масалович вообще считает, что наличие перечня последних найденных документов и информации о времени обновления базы – серьезное преимущество, благодаря которому многие специалисты все чаще выбирают Рамблер в качестве поисковика, с которого надо начинать работу по поиску в Интернете (сайт Андрея Масаловича www.tora-centre.ru/).

Кроме того, все, кому приходится заниматься поиском в Интернете профессионально, сходятся во мнении, что только использование нескольких поисковых машин может дать результат, претендующий на полноту ответа на вопрос – одна поисковая машина справиться с подобной задачей не способна. Связано такое положение вещей с тем, что, во-первых, поисковые роботы физически не успевают угнаться за стремительно растущим Интернетом, а во-вторых, с тем, что у разных поисковых машин разные алгоритмы обработки собранной информации, а значит, и разные результаты этой обработки. Наш опыт подтверждает правильность таких выводов.

В результате нет и не может быть полного совпадения результатов поиска в разных поисковых машинах, особенно когда речь идет о редком запросе.

ПРИМЕР

Поиск во всех трех системах точной фразы (фрагмента песни) «Дым, дым в твоих глазах» дал на момент написания статьи такие результаты.

Запрос: [“дым, дым в твоих глазах”]

Результат поиска.

Яндекс: страниц – 0.

Гугл: не найдено ни одного документа, соответствующего запросу “дым, дым в твоих глазах”.

Рамблер: Вы искали: “дым, дым в твоих глазах”, найдено сайтов: 1, документов: 1.

Результат этого поиска можно увидеть здесь: www.ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Dym_Dym_v_Glazakh.html

Это не значит, что Рамблер лучше всех. Это значит, что нельзя заранее знать, в какой поисковой системе и что именно удастся найти. В этом смысле показателен пример с поиском фразы, также фрагмента редкой песни: «Аэропорт аэропорт ночное зарево огней».

ПРИМЕР

Запрос: [“аэропорт аэропорт ночное зарево огней”]

Результат.

Яндекс: страниц – 133, сайтов – не менее 4 http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Yandex.html

Гугл: 1 – 6 из примерно 32 для “аэропорт аэропорт ночное зарево огней”.

http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Google.html

Рамблер: не найдено ни одного документа, полностью соответствующего запросу “аэропорт аэропорт ночное зарево огней”. http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Rambler.html

Итак, перейдем к рассмотрению работы с Рамблером. Основой для этого раздела послужили раздел «Помощь» Рамблера (www.rambler.ru/doc/help.shtml) и форма расширенного поиска (www.rambler.ru/cgi-bin/advanced.cgi?set=www).

Ресурсы, которые Рамблер индексирует. По утверждению самого Рамблера, он индексирует сайты, размещенные в следующих доменах первого уровня:

Российская Федерация: .ru, .su;

Украина: .ua;

Белоруссия: .by

Казахстан: .kz;

Киргизия: .kg;

Узбекистан: .uz;

Грузия: .ge.

Сайты, находящиеся в других доменах, Рамблер, как он сам утверждает, игнорирует.

Для тех, кто хочет, чтобы сайт, расположенный в другой доменной зоне, был проиндексирован Рамблером, этот поисковик оставляет небольшую надежду на успех.

Если Ваш сайт находится вне названных доменов (например, в зонах .com, .org, .net), но существенная часть сайта содержит русскоязычные материалы или, по Вашему мнению, он может представлять интерес для русскоязычной аудитории Рамблера, Вы можете отослать письмо на адрес [email protected] с просьбой включить Ваш сайт в число сканируемых, либо заполнить форму обратной связи. Наши сотрудники рассмотрят эту просьбу и примут решение о целесообразности такого включения[25].

Кроме того, Рамблер утверждает, что умеет извлекать гиперссылки из объектов Macromedia Flash, но не индексирует непосредственно сами тексты flash-объектов. Для таких технически продвинутых сайтов специалисты Рамблера советуют создавать HTML-копию.

Поддержка морфологии слов. Рамблер поддерживает морфологию слов по умолчанию. Отключение поддержки морфологии предусмотрено, но требует использования специального оператора – слово должно быть взято в кавычки. Мы сейчас не будем останавливаться на всех особенностях использования кавычек, а поговорим о них ниже. Наш эксперимент подтвердил, что Рамблер морфологию слов действительно поддерживает.

Скобки. Как и Яндекс, Рамблер позволяет использовать скобки для группировки слов и применения ко всем словам, расположенным в скобках, одного оператора, который пишется перед скобкой. Этим он ничем не отличается от Яндекса, поэтому подробнее мы применение скобок рассматривать не будем.

Транслитерация. Люди довольно часто делают опечатки при вводе текста и вместо русских букв печатают их английских «близнецов». Например, часто так происходит с буквой «с». Рамблер говорит, что старается исправлять такие опечатки, но не гарантирует результата. Эксперимент показал, что Рамблер действительно справляется с опечатками транслитерации, если их количество в слове невелико. Приведу часть результатов.

ПРИМЕР

Запрос 1 (все буквы русские): [“глОКлАя кУздРА”]

Результат поиска.

Вы искали: “глОКлАя кУздРА”, найдено сайтов: 9, документов: 37.

Запрос 2 (заглавные буквы – латинские): [“глOKлAя кYздPA”]

Результат поиска.

Не найдено ни одного документа, полностью соответствующего запросу

“”глOKлAя кYздPA””.

Запрос 3 (заглавные буквы – латинские): [“глOклая куздPа”]

Результат поиска.

Вы искали: “глOклая куздPа”, найдено сайтов: 9, документов: 37.

Чтобы не загружать читателя лишними примерами, скажем лишь, что при трех опечатках правильный поиск еще проводился, но после появления четвертой неправильно написанной буквы результат поиска стал нулевым. Рамблер в этом случае просто порекомендовал пользователям внимательнее относиться к вводу текста.

Регистр букв. Как правило, Рамблер не учитывает регистр, причем распространяет это правило не только на слова запроса, но и на операторы.

Действительно, запросы «глоклая куздра» и «ГлоКЛаЯ КУздРа» дали одинаковые результаты.

ПРИМЕР

Запрос 1: [“глоклая куздра”]

Результат поиска.

Вы искали: “глоклая куздра”, найдено сайтов: 12, документов: 44.

Запрос 2: [“ГлоКЛаЯ КУздРа”]

Результат поиска.

Вы искали: “ГлоКЛаЯ КУздРа”, найдено сайтов: 12, документов: 44.

Однако Рамблер сообщает, что он делает исключение из этого правила, если в запросе два и более слова подряд написаны с заглавной буквы. По его утверждению, он старается искать эти слова также с заглавной буквы. Таким образом, Рамблер пытается помочь тем, кто ищет имена собственные или географические названия.

В нашем эксперименте это не подтвердилось. Результаты за про са – как с заглавной, так и с прописной буквы – оказались одинаковыми, и в выдаче присутствовали как релевантные слова, написанные в обоих регистрах.

28
{"b":"95894","o":1}