Зависимости между фразами. Мы рассмотрели способы установления зависимостей между отдельными словами, однако, помимо этого, можно определять зависимости между целыми фразами либо даже между зависимостями слов. Это несложно – достаточно взять отдельную фразу в круглые скобки.
В качестве примера рассмотрим такой запрос: мумие && (лечение | лечебный | болезни)—(цена | прайс | рубли | доллар | фирма | магазин). По данному запросу будут найдены все страницы, на которых присутствует слово мумие, а также одно из слов, символизирующих его лечебные качества. При этом на страницах не должно быть слов, связанных с покупкой этого предмета.
Изменение правил релевантности. Еще одной интересной особенностью поисковой системы «Яндекс» является возможность изменения релевантности отдельных слов в поисковом запросе.
Так, чтобы изменить вес отдельного слова, нужно поставить после него оператор :<вес>. Например, запрос поисковые механизмы:5 говорит о том, что на результирующих страницах более важно слово механизмы, а не слово поисковые.
Кроме того, поисковая система позволяет определить уровень нестрогого поиска (коэффициент «мягкости»). Иными словами, вы можете определить, будут ли в результаты поиска включаться страницы, которые содержат не все из тех слов, что вы указали в запросе (пассажи). Для этого предназначены запросы вида (слова через пробел)//<число от 1 до 100>. По умолчанию поиск ведется с коэффициентом мягкости, равным 6.
При коэффициенте мягкости, равном 50, количество найденных документов должно быть примерно равно среднему геометрическому чисел найденных документов при поиске всех возможных неполных пассажей. Подробнее о коэффициенте мягкости можно прочитать на странице http://company.yandex.ru/articles/romip2004.xml.
Команды поиска
Помимо обычных запросов, поисковая система «Яндекс» может обрабатывать и специальные, сформированные при помощи особых команд. Рассмотрим основные команды.
○ $title (искомые слова) – искать указанные слова только в заголовке страниц. Например, взгляните на такой сложный запрос: Максвелл << $title (биография).
○ $anchor (искомые слова) – выполнить поиск указанных слов только в именах страниц. Например, запрос $anchor (one style) отобразит только те страницы, в имени которых встречаются слова one и style.
○ #keywords=(искомые слова) – искать указанные слова только в ключевых словах страниц (то есть внутри тега <meta name="keywords" content=""> страницы).
○ #abstract=(искомые слова) – выполнить поиск указанных слов только в описании страниц (то есть внутри тега <meta name="description" content=""> страницы).
○ #image="название" – искать только изображения, имеющие указанное название.
○ #hint=(искомые слова) – искать только изображения, в подписях к которым встречаются указанные слова.
○ #url="имя сайта" – выполнить поиск только на данном сайте. Например, запрос поисковые системы #url = «www.onestyle.com.ua» отобразит все страницы сайта www.onestyle.com.ua, на которых встречается фраза поисковые системы.
○ host="имя сайта" – выполнить поиск только на данном сайте, а также на всех его зеркалах.
Помимо оператора host, можно использовать оператор rhost. Он аналогичен оператору host во всем, кроме записи имени сайта, – имя сайта при его использовании записывается в обратном порядке. Например, rhost="ru.yandex.*".
○ #link="имя сайта" – выполнить поиск ссылок на указанный сайт.
○ #mime="тип файла" – в качестве результатов поиска отображать только файлы с заданным расширением. Например, команда Vista #mime="doc" отобразит список всех файлов с расширением DOC, содержащих слово Vista. При поиске страниц с несколькими расширениями правильнее было бы использовать запрос следующего вида: (инструкция && микроволновая печь) << (mime="pdf" | mime="rtf"), то есть запретить ранжирование страниц результата запроса по расширениям.
Поисковая система «Яндекс» индексирует содержимое файлов со следующими расширениями: HTML, PDF (Adobe Portable Document Format), DOC (Microsoft Word), PPT (Microsoft PowerPoint), XLS (Microsoft Excel), RTF (Rich Text Format), SWF (Macromedia Flash).
○ lang="язык" – выполнить поиск только среди страниц, написанных на указанном языке. Например, вы можете искать на страницах со следующими языками: ru (русском), uk (украинском), be (белорусском), en (английском), fr (французском), de (немецком).
○ like="имя страницы" – искать на страницах, похожих на указанную.
○ domain="домен" – выполнить поиск на страницах, которые принадлежат данному домену. Например, Vista domain="ru".
○ date="ГГГГММДД" – искать на страницах, дата изменения которых удовлетворяет заданной дате. Помимо конкретного дня, года или месяца, можно указывать знак *. В этом случае день, год или месяц учитываться не будут.
Вместо знака = в данной команде можно использовать следующие знаки: >, <, >=, <=.
○ cat=(ID региона или темы) – выполнить поиск только среди страниц, зарегистрированных в «Яндекс. Каталоге», тематическая рубрика или регион которых совпадают с указанными.
Идентификатор региона можно получить, прибавив к коду региона смещение 11 000 000. Идентификатор тематической рубрики получается прибавлением к коду темы смещения 9 000 000.
Например, зяблик << cat=(11000051).
Настройка поиска
Вместо специальных команд поиска вы можете воспользоваться специальными формами для настройки и формирования запроса поиска. Таких форм всего две: это страница Расширенный поиск (http://www.yandex.ru/advanced.html) и Настройка результатов поиска (http://www.yandex.ru/cgi-bin/customize.pl).
Расширенный поиск. С помощью данной страницы можно определить следующие параметры поиска:
○ область поиска (везде либо только в заголовке страницы);
○ указать, будет ли использоваться механизм проверки морфологии (или будет выполнен поиск слова/фразы только в той форме, которую вы ввели);
○ задать, как будет интерпретироваться расположение искомых слов друг от друга (слова идут подряд; должны встречаться в одном предложении; должны находиться недалеко друг от друга; должны находиться на одной странице);
○ указать, на каких языках должны быть написаны страницы, отображаемые в результатах поиска;
○ дата изменения страниц, отображаемых в результатах поиска;
○ страница, на которую должны быть похожи файлы, отображаемые в результатах поиска;
○ страна, в которой должны находиться сайты, страницы которых будут выводиться в результатах поиска;
○ сайт, страницы которого будут отображаться в результатах поиска;
○ указать, файлы каких типов должны отображаться в качестве результатов поиска;
○ максимальное количество результатов, отображаемых на одной странице (но не больше 50).
Настройка результатов поиска. С помощью данной страницы можно настроить формат отображения результатов поиска (количество результатов на странице, будут ли выводиться пиктограммы сайтов и картинки, будет ли поисковая форма отображаться внизу страницы и т. д.), а также определить язык, на котором будет выполняться поиск страниц. Кроме того, на этой странице можно включить использование семейного фильтра (из результатов поиска будут исключаться все страницы, содержащие порнографию и материалы явно выраженного сексуального характера).
Другие проекты
Проекты. Помимо поиска в Интернете, портал «Яндекс» поддерживает работу ряда других проектов. Рассмотрим некоторые из них.
○ «Яндекс. WiFi» – список бесплатных точек беспроводного доступа, поддерживаемых «Яндексом».
○ «Рефераты» (http://referats.yandex.ru/) – довольно занимательный проект, который позволяет самостоятельно создать реферат по одной из предопределенных дисциплин путем нажатия всего нескольких кнопок.
○ «Кубки» – турниры по поиску в Интернете, придуманные «Яндексом».
○ «Яндекс. Директ» (http://direct.yandex.ru/) – размещение рекламы в результатах поиска.
○ «Яндекс. Почта» (http://mail.yandex.ru/) – мы уже рассматривали возможности данного почтового сервера.
○ «Яндекс. Деньги» (http://money.yandex.ru/) – одна из лучших на Российской территории платежных систем. О ее использовании и возможностях мы поговорим в гл. 6.
○ «Народ. Ру» (http://narod.yandex.ru/) – предоставляет бесплатный хостинг. Иными словами, с его помощью вы бесплатно сможете разместить в Интернете свою собственную страницу. Адрес созданной таким образом страницы будет иметь вид <ваше имя>.narod.ru. Приятной особенностью данного хостинга является то, что объем дискового пространства, которое вы можете использовать, неограничен.