Если Вы не находите свою страницу, проверьте с помощью формы Яndex: Добавить сайт, включена ли она в базу Яndex; другими словами, попробуйте добавить ее еще раз.
Если вы получите сообщение «Ваш URL … был только что внесен в нашу базу данных», это значит, что адрес вашего ресурса системе ранее не был известен. Теперь он добавлен и в ближайшее время будет проиндексирован.
Если поступило сообщение «Ваш URL … уже известен роботу Яndex. Данный ресурс будет проиндексирован в ближайшее время», подождите еще пару дней.
Сообщение «Ваш URL … уже проиндексирован. Вы можете посмотреть, какие страницы Вашего сайта проиндексированы в Яndex.Ru к настоящему времени» означает, что по имеющейся здесь же ссылке вы можете перейти ко всему списку документов вашего ресурса, проиндексированных в поисковой машине Яndex.
В дальнейшем робот будет самостоятельно (автоматически) находить новые и измененные документы. Причем частота обхода конкретного сервера зависит от зафиксированной роботом частоты изменения его страниц.
Особенности регистрации в поисковой системе Апорт
Пополнение базы ресурсов Апорта происходит двумя путями.
Во-первых, при индексировании новых страниц проверяются все имеющиеся там ссылки; те, которые отвечают определенным требованиям, добавляются в базу ресурсов. В основном, конечно же, проверяется принадлежность к России и странам ближнего зарубежья. Ресурсы других доменов могут быть добавлены только вручную.
Во-вторых, любой пользователь может добавить ресурс вручную на странице, которая доступна по ссылке Добавить URL (http://www.aport.ru/addurl.php) почти с любой страницы Апорта. При указании ресурса вручную проверяется его наличие и корректность. Сразу после нажатия кнопки Добавить Апорт пытается получить корневую страницу ресурса и определяет, является ли страница русскоязычной. При этом простого использования кириллицы недостаточно: Апорт ищет закрепленные в языке русские слова. Если оба условия выполнены, то ресурс добавляется в базу и будет проиндексирован.
Прибегать к помощи страницы Добавить URL следует, если добавляемый ресурс – это сервер и есть вероятность, что он еще не известен Апорту, или если новый ресурс – это часть сервера и вы предполагаете, что на него нет ссылок с других страниц сервера.
Особенности регистрации в поисковой системе Rambler
Регистрационная анкета в поисковой системе Rambler находится по адресу http://www.rambler.ru/doc/add_site.shtml. Ее заполнение гарантирует, что, по крайней мере, эта анкета будет найдена при соответствующем поиске, и по ссылке с нее пользователь сможет попасть на ваш сайт. Рекомендуется также воспользоваться регистрацией в случае, если ваши страницы располагаются на зарубежных сайтах. Роботы сканируют ресурсы, находящиеся в странах ближнего зарубежья, и игнорируют остальные иностранные сайты.
Если ваш сайт находится за рубежом, но существенная его часть содержит русскоязычные материалы, или если он расположен в пределах ближнего зарубежья, но входит в иные домены первого уровня (.com, .org, .net и пр.), вы можете отослать письмо с просьбой включить сайт в число сканируемых. Сотрудники Rambler рассмотрят ее и примут решение о целесообразности такого включения.
Что не надо делать при регистрации
Не надо регистрировать ваш сайт в одной и той же поисковой системе слишком часто. Излишняя активность чревата не только отказом в очередной регистрации, но и удалением всех имеющихся в базе данных сведений о вашем ресурсе.
Вводите только те ключевые слова, которые соответствуют вашему сайту, и не используйте заведомо чужеродных.
Как управлять индексированием
На сегодняшний день разработчик Web-узла располагает скромным арсеналом технических средств, которые позволяют управлять роботами поисковых машин, занятых индексированием. Основных способов всего два: размещение файла со специальным именем robots.txt в корневом каталоге сервера и применение мета-тэгов в секции HEAD отдельного документа. Оба метода рассматривались выше. Еще раз подчеркнем, так как это очень важно, что метатэги, по возможности уникальные, следует применять в каждом документе.
Существует ряд простых правил, которых стоит придерживаться, если вы хотите, чтобы поисковые системы находили ваш ресурс.
На входных страницах сайта обязательно должен быть текст. Если вся информация представлена в виде графических файлов, весьма велика вероятность того, что ни одна поисковая система не найдет сайт. Правда, большинство поисковых машин индексирует текст, содержащийся в тэге ALT и в метатэгах, а также текст комментариев (<!– … ->), но не надо забывать о системах, которые этого не делают.
При этом намеренное злоупотребление ключевыми словами в заголовках, комментариях и тексте самого документа может быть расценено поисковой системой как попытка регистрации ресурса с несоответствующим содержанием. В качестве защитной меры система попросту не станет индексировать ваши страницы.
Кроме того, довольно трудно применить выбранное ключевое слово многократно в самом документе, не превратив его в нечто громоздкое и неуклюжее.
Очень важная часть страницы – заголовок, то есть ее титул, который расположен между тэгами <TITLE> и </TITLE>. Лучше сделать его информативным и внести в него ключевые слова. Возможно, имеет смысл использовать в заголовках, даже для полностью русскоязычных документов, английский язык. Оптимальная длина заголовка – не более 50 символов.
Очевидно, что заголовок следующего содержания, размещенный на странице index.htm, является неинформативным для поиска:
<TITLE>www.inotec.ru</TITLE>
Целесообразнее заменить его, например, таким:
<TITLE>Программы для бухгалтерского и складского учета</TITLE>
Заметим кстати, что текст этого заголовка, гораздо более наглядный, чем предыдущий вариант, будет оставаться и в закладках посетителей.
Многие поисковые системы для индексирования и построения списка ключевых слов используют первые по положению в документе 200–300 слов из текстов страниц Web-узла.
Чем длиннее документ, тем менее заметны в нем слова, заданные в запросе, и, следовательно, тем ниже будет ваша страница в результатах поиска. Поэтому старайтесь разбивать длинные документы на несколько коротких.
Индекс цитирования
Изначально индекс цитирования (CI, Citation Index) – это принятый в научном мире «показатель значимости» трудов какого-либо ученого. Величина индекса определяется количеством ссылок на этот труд (или автора) в работах других ученых.
Популярность сайта в Internet определяется числом ссылок на него. Таким образом, индекс цитирования здесь – это число внешних ссылок в сети Internet, которые ведут на сайт. Так, если 205 страниц с других доменов содержат ссылки на страницы вашего сайта, то ваш индекс цитирования – именно 205. В англоязычных источниках данному термину соответствуют названия Link popularity (Популярность ссылки), PageRank (Ранг страниц) – торговая марка Google.
Применительно к WWW индекс цитирования – это показатель популярности Web-страницы или Web-сайта среди создателей аналогичных «творений», то есть среди «писателей». Этим он принципиально отличается от счетчиков и рейтингов посещений Web-страниц или Web-сайтов, являющихся, по сути, показателями популярности среди «читателей».
Попутно отметим, что одна из проблем рейтингов – положительная обратная связь. Чем выше ресурс в рейтинге, тем больше посетителей обращаются к нему, и, соответственно, тем выше он поднимается в рейтинге.
Идея, оправдывающая применение индекса цитирования, проста: как правило, люди, создающие свой сайт в Internet, со вниманием и ответственностью относятся к его содержанию, а также к содержанию того, на что они ссылаются, и что тем самым рекомендуют своим посетителям.
Индекс цитирования не может быть увеличен ни за счет внутренних (с одних страниц ресурса на другие), ни за счет внешних ссылок, когда один и тот же ресурс имеет их несколько.
Разработчики поисковой машины Яndex ввели показатель индекса цитирования в свой каталог ресурсов (http://yaca.yandex.ru/), что было призвано обеспечить авторитетность расположения ресурсов в рубриках этой поисковой системы.
При определении величины индекса цитирования Яndex учитывает ссылки только с тех ресурсов, которые Яndex проиндексировал и которые содержатся в его поисковой базе, то есть только «русский» Internet. Это означает, что ссылки на русские ресурсы, например, из каталога Yahoo! не могут быть учтены при установке индекса цитирования Яndex.
С другой стороны, этот показатель можно определить для всех ресурсов, на которые кто-либо ссылался с сайтов, просканированных поисковой машиной Яndex, даже если это произошло всего один раз. Поэтому для каталога Yahoo! индекс цитирования Яndex определить можно, несмотря на то, что Yahoo! не проиндексирован в Яndex. Кстати, он для каталога Yahoo! довольно высок (на 23 октября 2004 года – 6300), поскольку Yahoo! весьма популярен в русской части Internet.