1.2 Поисковые системы и каталоги ГВС Интернет
Рассмотрим необходимость поисковых систем в Интернет.
В Сети огромное количество разнообразной информации, и если бы не поисковые системы, то, наверное, сложно было бы найти то, что действительно необходимо. Первоначальная задача раскрутки сайта состоит в регистрации на поисковых системах, чтобы пользователи, вводя ключевые слова, соответствующие теме нашего сайта в строке запроса, могли легко его найти. Однако и это не обязательно принесёт ожидаемый результат, т.к. в большинстве случаев, сайтов на такую же тему, что и наш, уже большое количество. Простая регистрация сайта, без соответствующей предварительной подготовки, в большинстве случаев является формальностью, и приток необходимых посетителей с поисковых серверов не будет ожидаемым. Однако, существуют технологии, позволяющие привлекать посетителей оттуда в достаточно большом количестве. Этот процесс называется веб-оптимизацией или SEO (сокр. от англ. Search Engine Optimization).
Сегодня не-американские и не-англоязычные сегменты всемирной паутины переживают подъем, благодаря массовому распространению компьютеров и удешевлению доступа к Интернету. Американская часть всех пользователей сети, составляющая когда-то более девяноста процентов, сегодня составляет менее четверти, в то время как количество не-англоязычных пользователей Интернета неуклонно растет.
Азиатско-Тихоокеанский регион занимает первое место по масштабам увеличения численности пользователей, но русскоговорящий Интернет демонстрирует не менее стремительные темпы развития.
Рассмотрим главные поисковые средства Рунета, их требования и особенности.
Яндекс
На сегодняшний день самой популярной русскоязычной поисковой системой является Яндекс (http://www.yandex.ru). Регистрация проводится по адресу http://yandex.ru/addurl.html. У Яндекса достаточно быстрый поисковый робот. Благодаря ему регистрируемая страница появится в поисковых результатах в течении 2-4 часов. Но это значит, что страница прошла лишь первичную индексацию. После полной индексации, она может исчезнуть из поисковых результатов, если поисковый робот сочтет ее за спам. Поэтому положение веб-страницы в результатах поиска нужно отслеживать до тех пор, пока не пройдет полная индексация. Кроме того, список результатов может меняться в зависимости от загруженности серверов. Поскольку база данных Яндекса имеет кластерную структуру и разнесена на несколько
Наиболее часто Яндекс индексирует документы средних размеров, насыщенные текстом (статьи и т.п.) с умеренной повторяемостью ключевых слов. Ключевые слова можно писать в описании, но вес слов в этом тэге ниже. Хорошо индексируются страницы созданные скриптами .cgi, .php. Это касается гостевых книг, форумов и т.п. Для индексации остальных (кроме главной) страниц сайта требуется примерно 2 недели.
Ключевые слова в мета-тэгах <keywords> и <description> не особенно эффективны в достижении хороших рейтинговых позиций. Здесь стоит употреблять слова, которые встретятся в тексте страницы.
Однако мета-тэг <description>, используется для выдачи описания страницы в результатах поиска. Это нужно учитывать при его составлении, так как, пользователь по этому описанию принимает решение посетить вас, или нет.
Для определения релевантности Яндекс использует Взвешенный Индекс Цитирования (Page Rank). Обычный Индекс Цитирования (Link Popularity) используется только при сортировке сайтов в каталоге Яндекса. Влияние на положение в результатах поиска оказывает ВИЦ.
Рамблер
По оценкам SpyLog Рамблер обрабатывает около 20% всех поисковых запросов Рунета. На Рамблере реализована интеллектуальная система, которая позволяет выдавать в результатах поиска слова, которые являются синонимами запроса. Еще одной функцией этой системы является выдача контекстной рекламы не только по конкретным ключевым словам, но и по фразам, которые тесно связаны с ними.
Регистрация анкета находится по адресу http://www.rambler.ru/doc/add_site_form.shtml. Однако на Рамблере нет возможности автоматически зарегистрировать сайт в доменах .com, .net, или .org. Если все же содержание сайта из этих зон имеет отношение к русскоязычному Интернету, то нужно отослать письмо на search.support@rambler-co.ru с просьбой проиндексировать сайт.
Рамблер (в отличие от других поисковиков) умеет извлекать гиперссылки из объектов Macromedia Flash. Если сайт имеет заставку или навигационные панели, выполненные с использованием этой технологии, Рамблер обработает их, найдет адреса всех страниц сайта и проиндексирует весь сайт. Однако, сами тексты flash-объектов не индексируются. Для сайтов, которые целиком состоят из flash-объектов, рекомендуется создать HTML-копию и зарегистрировать ее в поисковой машине.
Роботы Рамблера также справляются с конструкциями фреймов. Максимальный размер документа для роботов составляет 200 килобайт. Документы большего размера усекаются до указанной величины.
Апорт
Следующая по популярности – поисковая машина Апорт (http://www.aport.ru/). Регистрация сайта в Апорте производится со страницы http://www.aport.ru/addurl.asp. Эта страница доступна почти с любой страницы Апорта, например, с главной страницы. Добавлять в поисковую систему Апорт следует русскоязычные сайты, а также сайты имеющие непосредственное отношение к российскому Интернету. В случае отказа в автоматическом добавлении сайта можно обратиться с просьбой о добавлении сайта по addurl-nr@название.зона.
С момента добавления сайта в Апорт до момента его появления в поисковой базе проходит от двух-трех дней до двух недель.
При просмотре содержимого сервера для индексирования Апорт обязательно проверяет файл ROBOTS.TXT. Так что можно использовать его, чтобы ограничить «деятельность» Апорта на своем сервере. Апорт по умолчанию не индексирует динамические документы, в адресах которых встречается символ «?».
Для документов HTML, кроме основного текста документа индексируются также: заголовок документа <TITLE>, ключевые слова <KEYWORDS>, описания страниц <DESCRIPTION> и подписи к картинкам <ALT>. Кроме того, Апорт индексирует как принадлежащие документу гиперссылки, так и текст гиперссылок на этот документ с других страниц, находящихся, как внутри сайта, так и за его пределами.
Апорт предлагает несколько вариантов направленной рекламы http://www.aport.ru/adv, однако нет возможности купить более высокое место для своего сайта в результатах поиска.
Ключевые слова <KEYWORDS> не имеют определяющего значения при определении релевантности документа. Но разумное использование этого тэга рекомендуется.
В отличие от многих других поисковых систем, Апорт не применяет каких-либо специальных санкций к сайтам, пытающимся обмануть поисковую систему с помощью спама, однако добиться подобным способом желаемого результата не получится. Поэтому не рекомендовано писать невидимые тексты, вбивать сотни ключевых слов, не имеющих никакого отношения к содержанию документа и т.д.
Приведём перечень основных критериев, которые Апорт учитывает при сортировке сайтов:
«густота» ключевых слов,
расстояние между ключевыми словами в тексте документа,
место, где встречаются поисковые слова (заголовок, описание, мета-тэг и т.п.),
внешний вид шрифта, которым набраны ключевые слова (размер, жирность, цвет),
количество ссылок из Интернета на данный документ,
использование ключевого слова в тексте ссылок из Интернета на данный документ.
Окончательный процент соответствия документа запросу строится как некая функция от всех этих показателей.
Исследуя популярные поисковые системы Рунета, мы не могли оставить без внимания Google.com.ru (Google на русском).
Несмотря на то, что Google все еще отстает от русских поисковых машин по количеству пользователей, он становится все более и более популярным. Некоторые опросы общественного мнения указывают на 3-9% поискового трафика в Рунете, но большинство аналитиков полагают, что его доля в поиске русских сайтов составляет не менее 10%. Google применяет общие правила индексирования к любому веб-содержанию, независимо от того принадлежит ли доменное имя к Рунету или нет. Это является большим преимуществом перед русскими конкурентами, которые не так дружелюбны с веб-сайтами с доменным именем типа 'yoursite.com', 'yoursite.org', и т.д. и требуют от них подавать заявки на включение по электронной почте. Однако, скорее всего Google не будет иметь существенных претензий на лидерство в Рунете, пока не усовершенствует свой алгоритм на основе морфологии русского языка.
Мы охарактеризовали далеко не все поисковики Рунета, а только самые главные из них. Теперь рассмотрим популярные веб-каталоги.
Каталоги - это такие места, где пользователи могут находить нужные им сайты, точно также как они находят их с помощью поисковых серверов. Но есть существенные различия между каталогами и поисковыми серверами. В то время как поисковые машины принимают почти любые сайты, без требований к качеству, каталоги же, как правило, предъявляют требования к качеству и содержанию сайта. Исходя из этого, можно сделать вывод, что перед тем как регистрировать свой сайт в каталогах, необходимо убедиться, что он готов, или другими словами, качественно оптимизирован. В каталогах регистрируют, обычно, только главную страницу сайта (еще одно отличие от поисковиков).
Процедура правильной регистрации в каталогах достаточно проста. Все каталоги имеют древовидную структуру. То есть, существуют главные разделы, которые включают в себя подразделы и т.д. Необходимо найти тот раздел, который максимально подходит для темы регистрируемого сайта. Это часто проще всего сделать, введя в строку поиска ключевое слово по интересующей теме, и получить список сайтов, где будет указано из каких они разделов.