Допустим, мы ввели в шаблон одной из поисковых машин запрос, состоящий из двух терминов. Алгоритм поисковой программы присвоит более высокий ранг тому документу, в котором эти термины используются следующим образом:
• включены в заголовок Web-страницы;
• содержатся в заголовках различного уровня в документе;
• расположены близко к началу документа;
• часто употребляются;
• расположены в тексте поблизости друг от друга.
Таковы критерии ранжирования. Какой документ окажется в списке отклика выше: тот, что содержит ключевое слово в заголовке, или тот, в котором оно встречается сто раз, но в поле обычного текста? От ответа на этот вопрос может напрямую зависеть число обращений на ваш узел через поисковую систему. Если добавить к этому, что правила игры, по которым работают поисковые машины, меняются постоянно и без широкого уведомления пользователей, то появление в Internet нового круга специалистов и направлений бизнеса – Search Engine Promotion (Продвижение в поисковых системах) и Search Engine Optimization, SEO (Оптимизация для поисковых систем) – кажется в порядке вещей.
Речь идет о поиске, при котором используются специальные методы и средства воздействия на работу автоматического индекса с целью получения высокого места в списке отклика по ключевым словам, наиболее ярко отражающим профиль узла. Успех применения таких методов базируется на знании принципов регистрации и использовании специального программного обеспечения. Постоянный мониторинг реальных запросов к поисковым системам позволяет отбирать именно те слова и словосочетания, которые привлекут внимание необходимого количества пользователей.
Подготовка к регистрации
Информация, которую запрашивают каталоги и поисковые системы при регистрации ресурса, практически одинакова. При этом поисковые машины обычно (хотя и не всегда) учитывают совсем немногое. Посмотрите на регистрационные формы, предлагаемые для заполнения, например, поисковыми системами Яndex и Апорт. Форма для регистрации поисковой системы Яndex, показанная на рис. 1.2, требует заполнения лишь одного поля: адреса ресурса.
Рис. 1.2. Форма для регистрации сайта в поисковой системе Яndex
Регистрация в поисковой машине Апорт намного сложнее и выполняется поэтапно. Если заявка, заполняемая на первом этапе, весьма проста (она представлена на рис. 1.3), то в дальнейшем предлагается заполнить довольно объемную форму (рис. 1.4), указать рубрику (рис. 1.5) и т. д.
Рис. 1.3. Форма первого этапа регистрации сайта в поисковой системе Апорт
Рис. 1.4. Форма второго этапа регистрации сайта в поисковой системе Апорт
Рис. 1.5. Форма третьего этапа регистрации сайта в поисковой системе Апорт
Вводить каждый раз при регистрации ресурса всю информацию – занятие достаточно долгое и утомительное. Ускорить процесс можно, если заранее составить краткий паспорт сайта, который может включать следующие сведения:
• название сайта;
• URL-адрес;
• описание сайта;
• ключевые слова;
• контактное лицо;
• электронный адрес регистратора.
Если имеются версии сайта на других языках, необходимо составить подобный паспорт для каждой из них.
Благодаря приведенной схеме можно заполнять поля в формах, используя обычные операции копирования и вставки, что значительно ускоряет работу.
Итак, остается лишь взять список поисковых систем и приступить к регистрации.
После выбора конкретной поисковой системы найдите в ней ссылку типа Добавить сайт, или Предложить ресурс, или Add URL. Отметим, что подчас приходится проявить недюжинную смекалку, чтобы отыскать такую надпись в некоторых каталогах и поисковых системах. Ну, а далее все просто – следуйте появляющимся на экране инструкциям, которые в разных системах немного отличаются друг от друга.
Адреса регистрационных форм
Яndex http://www.yandex.ru/addurl.html
Апорт http://www.aport.ru/addurl.php
Rambler http://www.rambler.ru/doc/add_site.shtml
Поиск@Mail.ru http://poisk.mail.ru/cgi-bin/add_url.cgi
UAport http://uaport.net/cgi-bin/add_new
Sesna http://uazone.net/go/addurl.cgi
META http://meta-ukraine.com/pages/addurl.asp
Uniarts http://www.armenian.com/links.html
www.KYRGYZSTAN.kg http://search.kyrgyzstan.kg/cgi-bin/search/add.cgi
DELFI (Латвия) http://rus.delfi.lv/directory/index.php?add=1
DELFI (Эстония) http://rus.delfi.ee/directory/index.php?add=1
AltaVista http://www.altavista.com/addurl/default
Excite https://secure.ah-ha.com/guaranteed_inclusion/teaser.aspx
HotBot http://insite.lycos.com/
Lycos http://insite.lycos.com/
Google http://www.google.com/addurl.html
Если после регистрации вы не увидели свой сайт в поисковой системе, не удивляйтесь. Из-за большой перегруженности робота поисковой машины ваш сайт может стоять в очереди от одного дня до двух недель.
В дальнейшем робот будет самостоятельно (автоматически) находить новые и измененные документы. И чем чаще будет меняться страница, тем чаще робот будет на нее заходить.
Особенности регистрации в поисковой системе Яndex
В поисковой машине Яndex допускается регистрация только русскоязычных сайтов.
Для добавления ресурса введите адрес его главной страницы в форму Яndex: Добавить сайт (http://www.yandex.ru/addurl.html) – остальные страницы Яndex найдет самостоятельно по ссылкам.
Робот работает со стандартными ссылками языка HTML (HREF, LINK и FRAME), то есть так, как работал бы пользователь с отключенной в браузере поддержкой Java и JavaScript. Если ссылки на страницы вашего сайта сделаны с помощью скриптов, надо добавить адреса этих страниц через форму Яndex: Добавить сайт.
Запрещения на индексацию отслеживаются системой Яndex обычным образом – через файл robots.txt, находящийся в корневом каталоге сервера.
Яndex контролирует намеренное злоупотребление ключевыми словами в заголовках, комментариях и тексте самого документа и при обнаружении подобных фактов снижает место документа на странице результатов. В случаях злостного использования таких приемов администрация Яndex может исключить документы и сайты из базы. Страницы со временем перенаправления на другие страницы, равным нулю, не подлежат индексированию.
Индексация одних и тех же документов, выдаваемых Web-серверами в разных кодировках, лишена особого смысла. При этом русские поисковые системы держат в базах документы только в одной из кодировок, другие рекомендуется исключать из индексирования. Если кодировки распределяются по портам сервером, на разных портах (серверах) следует выдавать разный robots.txt. Это значит, что во всех портах/серверах, кроме основного, должно быть написано:
disallow: /
Если кодировки выдаются, например, по директориям, необходимо сделать один файл robots.txt следующего содержания:
disallow: /alt
disallow: /mac
disallow: /koi
В уникальные заголовки документов, вкратце описывающие сайт и текущий документ, не следует включать более 20–25 слов. Слова в заголовках имеют больший вес, чем остальные.
Система учитывает описания и ключевые выражения, указанные в соответствующих метатэгах, а также подписи к картинкам в тэге ALT. Яndex работает только с текстами и не умеет распознавать графические изображения. Поэтому, если название выполнено средствами графики, стоит продублировать его в текстовом виде.
Чем длиннее документ, тем менее заметны в нем слова, заданные в запросе, и, следовательно, тем ниже будет находиться ваша страница в результатах поиска при прочих равных условиях. Поэтому старайтесь разбивать длинные документы на более короткие – это правило важно для любых поисковых систем.
При оформлении документов надо придерживаться следующих требований:
• не следует набирать слова в р а з р я д к у – система не воспримет их;
• без особой необходимости не стоит набирать слова ПРОПИСНЫМИ буквами, если только это не аббревиатура;
• точки и запятые не отделяются от слова пробелом, иначе Яndex определит их как отдельные слова. После них пробел ставится.
Проверять, проиндексирован ли ресурс, нужно не сразу, а через несколько дней после его добавления в базу Яndex. Обычно страницы появляются в поисковой базе в течение недели после их создания или изменения. Новые страницы, внесенные в базу самостоятельно с помощью механизма добавления ресурса, появятся быстрее.
Если Вы не находите свою страницу, проверьте с помощью формы Яndex: Добавить сайт, включена ли она в базу Яndex; другими словами, попробуйте добавить ее еще раз.
Если вы получите сообщение «Ваш URL … был только что внесен в нашу базу данных», это значит, что адрес вашего ресурса системе ранее не был известен. Теперь он добавлен и в ближайшее время будет проиндексирован.
Если поступило сообщение «Ваш URL … уже известен роботу Яndex. Данный ресурс будет проиндексирован в ближайшее время», подождите еще пару дней.
Сообщение «Ваш URL … уже проиндексирован. Вы можете посмотреть, какие страницы Вашего сайта проиндексированы в Яndex.Ru к настоящему времени» означает, что по имеющейся здесь же ссылке вы можете перейти ко всему списку документов вашего ресурса, проиндексированных в поисковой машине Яndex.