1. Сначала создаются сами индексы. Для этого придется создать несколько областей индексирования, например одну область для поиска на локальном компьютере (на сервере), а остальные – для поиска на общих ресурсах компьютеров сети.
2. Потом на компьютере, где были созданы области индексирования, запускается сервер.
3. После этого любой компьютер сети может обратиться на определенный адрес и выполнить поиск слов при помощи созданных индексов.
Индексы мы создали, как же теперь запустить сервер? Для этого достаточно воспользоваться вкладкой Сервер программы. Проще всего нажать кнопку Запустить, расположенную на этой вкладке. В результате в поле Ссылка на поисковую страницу сервера отобразится адрес, который необходимо использовать на других компьютерах для доступа к запущенному серверу. Вы можете нажать кнопку Перейти, чтобы открыть поисковое окно сервера на локальном компьютере.
Кроме того, запустить сервер можно и без запуска самой программы Archivarius 3000. Для этого достаточно воспользоваться параметром – server файла программы Archivarius3000.exe либо просто найти в каталоге, в который была установлена программа, файл StartServer.bat. После запуска этого файла перед вами отобразится окно программы Archivarius 3000 в серверном режиме (рис. 5.17).
Рис. 5.17. Серверный режим работы программы Archivarius 3000
После того как вы запустили сервер, любой пользователь сможет выполнить поиск на основе индекса сервера. Для этого ему будет достаточно ввести в окне браузера адрес, который отображался в поле Ссылка на поисковую страницу сервера окна программы Archivarius 3000.
Например, если еще раз посмотреть на рис. 5.17, то можно заметить, что для подключения к серверу в моей сети нужно использовать адрес http://10.0.0.2:80/. После подключения к данному адресу откроется страница браузера, представленная на рис. 5.18.
Рис. 5.18. Страница для локального поиска в индексе сервера
Поиск информации в Интернете считается наиболее сложным типом поиска. Особенно сильно это чувствуется, если нужно найти что-то конкретное. Причина сложности заключается даже не в том, что в Интернете существуют миллиарды страниц, а вам нужно найти лишь одну из них, самую полезную. Причина сложности заключается в релевантности страниц.
Каждый веб-мастер хочет, чтобы его страница была самой посещаемой на просторах Интернета. Как правило, для реализации этой мечты необходимо только одно – чтобы на как можно большее количество запросов поисковые системы выдавали в первой десятке результатов адрес этой страницы. А как это можно сделать?
Создатели поисковых систем решили, что это можно сделать только постоянным трудом и как можно более качественным материалом на странице.
Однако это очень сложный и долгий путь, который не подходит для большинства веб-мастеров. Вместо этого они идут другим путем – пытаются создать такую страницу, которая бы удовлетворяла всем условиям поисковой системы и в результате появилась в первой десятке результатов. Для этого они вставляют в страницу как можно больше ключевых слов и пользуются другими методами, обманывающими поисковые системы.
В итоге получается такая ситуация, когда в результатах поисках находится множество вроде бы очень интересных и нужных страниц, а при открытии этих страниц выясняется, что там практически нет никакой нужной информации, кроме двух-трех известных всем предложений. Причем, как правило, эти предложения на всех страницах одинаковые. Иначе говоря, веб-мастер ничего не предпринимал, чтобы написать нужную вам статью, а просто взял все с какой-то другой страницы.
В общем, процесс поиска в Интернете – дело неоднозначное, положительный результат которого не гарантирован, и вам нужно сразу же готовиться к тому, что полной удовлетворенности от найденной в результате информации не будет.
Поисковые системы. Для поиска в Интернете предназначены специальные сайты, называемые поисковыми системами. Таких систем существует огромное множество. Все они делятся на два типа: поисковые системы для общего поиска и специализированные поисковые системы. Поисковые системы для общего поиска хранят сведения обо всех страницах Интернета, независимо от их содержания или назначения. Специализированные же поисковые системы собирают сведения лишь о тех сайтах и страницах, которые посвящены отдельному направлению развития человечества либо отдельному продукту. Например, существуют специализированные поисковые системы, которые содержат ссылки на описания различных медицинских препаратов.
Работа всех поисковых систем основана на так называемых поисковых роботах. Поисковым роботом называется сценарий, который индексирует содержимое страниц Интернета. Делается это очень просто: как только поисковый робот загружает какую-либо страницу, он по каким-то определенным правилам, которые знают лишь создатели конкретной поисковой системы, индексирует ее содержимое, выставляя ему уровни релевантности при поиске с помощью различных запросов. После того как он проиндексирует содержимое страницы, он ищет ссылки, которые есть на этой странице, и переходит по ним на другие страницы (предпочтение отдается тем ссылкам, по которым находятся еще никогда не индексированные роботом страницы). В результате получается, что, однажды запустив поискового робота (указав ему первый адрес для индексации), можно больше и не заботиться о нем.
ПРИМЕЧАНИЕ
Как правило, индексация содержимого тегов <SCRIPT> не выполняется.
Но что же такое релевантность? Релевантность – это процент соответствия страницы поисковому запросу. Правила, по которым определяется релевантность страницы, индивидуальны для каждой поисковой системы. Некоторые поисковые системы держат эти правила в секрете, некоторые же публикуют правила релевантности на своих сайтах.
В целом релевантность документа зависит от ряда факторов, в том числе от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т. д.
Теперь рассмотрим основные популярные поисковые системы, которые доступны русскоязычному пользователю.
Google
Дата создания: сентябрь 1998 года.
Адрес: http://www.google.com.ua (украинский сайт), http://www.google.ru (русский сайт), http://www.google.com/intl/xx-hacker/ (хакерский) и многие другие.
Данная поисковая система предназначена для поиска информации на любых языках, однако в первую очередь специализируется на поиске веб-страниц на английском языке.
Большинство старых и уважаемых поисковых систем со временем превращаются в настоящие порталы. Не миновало это и поисковую систему Google. Помимо поиска, она предоставляет следующие возможности.
○ Desktop – программа Google Desktop, которую мы уже рассматривали при описании программ для локального поиска.
○ «Блокнот» – позволяет быстро сохранять нужную информацию при просмотре веб-страниц.
○ «Картинки» – дает возможность поиска изображений в Интернете.
○ «Каталог» – позволяет выполнять поиск страниц по разделам каталога поисковой системы Google.
○ «Новости» – свежие новости из многочисленных источников.
○ «Панель инструментов» – позволяет установить в браузере панель инструментов для быстрого доступа к возможностям поисковой системы Google.
○ «Поиск по блогам» – позволяет выполнять поиск по блогам поисковой системы Google.
○ Blogger – с помощью данного проекта вы сами можете создать свой блог для изложения всех своих мыслей и переживаний.
○ Gmail – почтовая система, возможности которой мы уже рассматривали.
○ Picasa – позволяет организовывать, редактировать и размещать фотографии в сети.
○ Talk – дает возможность общаться в чате и звонить друзьям через Интернет.
○ «Группы» – различные форумы и списки рассылок поисковой системы Google.
○ «Документы» – позволяет создавать документы и вести совместные проекты.
○ «Календарь» – сетевой календарь. Доступ к данному календарю можете получить не только вы, но и ваши друзья. Иными словами, они всегда будут в курсе того, что вы делаете сегодня и где вас можно найти.
○ «Переводчик» – позволяет переводить веб-страницы.
○ Google Page Creator – дает возможность за считанные минуты создать и опубликовать в Интернете свою собственную страницу. Данный сервис доступен на странице http://pages.google.com.
Казалось бы, такое количество дополнительных возможностей должно было существенно ухудшить процесс поиска, повысив размер главной страницы поисковой системы до невероятных размеров. Однако это не так – основная страница сайта поисковой системы содержит лишь поле для поиска, а также ссылки на основные сервисы поисковой системы. Весь же список сервисов поисковой системы Google представлен на странице http://www.google.com.ua/intl/ru/options/.