Стемминг, а также вилдкард (wildcard).
Рамблер НЕ поддерживает ни стемминг, ни вилдкард.
Поиск с заданным расстоянием. Рамблер не очень качественно поддерживает поиск с расстоянием, несмотря на то что «Помощь» в Рамблере утверждает обратное.
Рамблер говорит о том, что в документе он производит поиск на расстоянии не более 40 слов друг от друга. Это, конечно, не поиск с расстоянием, а скорее ограничение расстояния, но по крайней мере прямо заявленное ограничение.
Однако при этом Рамблер утверждает, что уменьшить это расстояние в 40 слов можно. Запрос, при котором слова должны находиться рядом, в «Помощи» Рамблера выглядит так: [2, красная армия].
Интересно, что при проверке этого утверждения мы обнаружили, что Рамблер, похоже, является рекордсменом по числу сайтов, которые можно открыть в результатах запроса. Так, в случае с запросом про «красную армию» он показал более двух с половиной тысяч сайтов и был согласен показывать их и дальше, но мы прекратили этот эксперимент, результат которого можно увидеть по адресу: www.ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Three_Thousands_Sites.html
Еще нам показался необычным (и неудобным) способ перехода к следующей группе сайтов в результатах выдачи. Так, если в Яндексе можно уйти, например, на 20-ю страницу выдачи, после чего внизу страницы с результатами последней доступной для просмотра в группе страниц станет 30-й, то в Рамблере, для того чтобы эта 30-я страница стала видна, требуется сначала выбрать переход к следующей группе сайтов вверху страницы, под строкой с запросом, и только после этого можно выбрать последнюю страницу следующей группы сайтов и перейти на нее. Зачем переход организован в два приема – непонятно.
Однако вернемся к непосредственным результатам запроса [2, красная армия].
Согласно информации в хэлпе, Рамблер должен рассматривать цифру «2» как служебную информацию, говорящую о расстоянии между словами, и выдавать результаты, где слова «красная» и «армия» находятся рядом. Наше внимание привлекло то, что цифра «2», которая в запросе должна была играть роль элемента оператора, в выдаче обозначалась как релевантное запросу слово.
Чтобы не пролистывать результаты по «красной армии» до 47-тысячного сайта, мы попробовали испытать поиск с расстоянием, как он описан в разделе «Помощь», на другом запросе и не получил положительного результата. Для того чтобы провести такую работу, мы взяли за основу фразу из песни: «Майскими короткими ночами, отгремев, закончились бои».
–
ПРИМЕР
Запрос: [2,”майскими” “ночами” +отгремев]
Результат поиска.
Вы искали: 2,”майскими” “ночами” +отгремев, найдено сайтов: 48, документов: 293.
–
В выдачу попали документы, не содержащие слова запроса непосредственно рядом друг с другом, более того, цифра «2» опять оказалась рассмотрена в качестве части запроса: «Фотографии, рекомендованные автором Roman Mezenin :: Галерея :: Клуб Foto.ru… Портрет Комм. 6 / Рек. 2 Майскими короткими ночами / отгремев, закончились бои – 05.06.2005 – 26 Kb – http://www.club.foto.ru/gallery/photos/recommended… – Восстановить текст – Найти похожие – Рубрика: Фото. Морской интернет-клуб. Майскими короткими ночами, Отгремев, закончились бои. Где же вы теперь, друзья – однополчане, Боевые спутники мои? Страницы: 1 2 3 4 5 6 7. 18.10.2005 – 10 Kb – http://randewy.ru/pes/stol2.html – Восстановить текст – Найти похожие».
Остальные операторы Рамблера вынесены в «Форму расширенного поиска», расположенную по адресу: www.rambler.ru/cgi-bin/advanced.cgi?set=www
Поиск в заголовках страниц (<title>). Этот оператор, существующий в Яндексе и Гугле как самостоятельный, в Рамблере тоже есть, но в «Помощи» Рамблера он не указан, и найти его нам удалось только в «Форме расширенного поиска». Ссылка на форму расширенного поиска находится непосредственно справа от поисковой строки Рамблера.
Поиск ссылающихся страниц (link). Этот оператор также встретился нам только в «Форме расширенного поиска». Работоспособность его проверена – работает.
Язык документа. Принудительное назначение конкретного языка документа возможно в «Форме расширенного поиска». При этом Рамблер предлагает выбрать один из трех языков: русский, украинский и английский.
По умолчанию в поле выбора языка отмечен вариант «любой».
Формат документа. Выбор форматов, как и языков, по современным меркам не впечатляет. Предлагается HTML, Word (.doc) и Adobe Acrobat (.pdf).
Дата документа. Рамблер, подобно Яндексу, предлагает интересную возможность выбора даты в «Форме расширенного поиска», но если Яндекс, кроме конкретного диапазона с датами, предлагает выбрать, например, «последние 2 недели» или «последний год», то Рамблер позволяет провести выборку только в конкретном временном диапазоне.
Поиск на определенном сайте. Представлен строкой в «Форме расширенного поиска» с названием: «Искать документы только на следующих сайтах».
Таким образом, на наш взгляд, Рамблер представляет определенный интерес для поиска страниц, когда требуется полнота выборки, но чаще его роль – быть резервным местом для поиска информации, не найденной в Гугле или Яндексе.
Сам Рамблер, похоже, с этим смирился и не стремится менять ситуацию, о чем косвенно свидетельствует довольно бедный набор возможностей настройки запроса.
Однако порой он может быть весьма полезен, что доказано практикой.
Поиск с помощью языка операторов запросов поисковых систем как инструмент раскрутки блога
Чтобы блог пользовался успехом у читателей, он должен содержать полезные для них материалы – об этом мы уже говорили. Если вы выбрали в качестве контента не художественные рассказы собственного сочинения, а информацию о каких-то событиях, технических устройствах или жизни каких-либо сообществ, вряд ли надо стараться, чтобы все материалы в блоге были вашими авторскими. На наш взгляд, человеческое общество сильно не тем, что каждый его член заново изобретает колесо, а тем, что, познакомившись с изобретениями других людей, каждый привносит что-то свое, и за счет этого все продвигаются вперед.
Однако каждый из нас заинтересован в том, чтобы, во-первых, находить максимально полную информацию по вопросу, который его интересует, во-вторых, обнаруживать ее как можно быстрее, а в-третьих, тратить на это минимум времени.
С технической точки зрения эта проблема решена. Сегодня есть бесплатные или просто недорогие инструменты, которые позволяют автоматизировать поиск новых данных среди массива тематической информации. Однако выделение самого этого тематического массива по-прежнему представляет сложности. Более того, эти сложности постоянно увеличиваются, поскольку объем Интернета стремительно растет, а значит увеличивается и уровень информационного шума.
Если составить запрос, который позволяет отфильтровывать в Интернете нужную вам информацию, вы получите замечательный инструмент, позволяющий быстро наполнять ваш блог тематическим контентом.
Не забывайте только, пожалуйста, об авторских правах – Интернет значительно упростил сбор и размещение информации, поэтому и проблемы нарушения авторских прав обострились.
Практика показывает, что в большинстве случаев конфликт возникает из-за того, что люди просто забывают дать ссылку на источник.
Очень немногие ресурсы запрещают использовать их публикации. Да и то, как правило, они не делают запрет полным. Большинство подобных запретов идет от сетевых СМИ. Вот, например, выдержка из «Правил использования материалами газеты “Ведомости”», помещенных на сайте этого издания.