Смекни!
smekni.com

Определение семантического каталога и его задачи (стр. 1 из 2)

Андрей Иванов, «Ашманов и Партнеры»

Семантический каталог — это система выдачи осмысленных ответов на поисковые запросы пользователей. Семантика — раздел языкознания и логики, исследующий проблемы, связанные со смыслом, значением и интерпретацией лексических единиц. Слово «семантический» в применении к навигационному ресурсу подчеркивает, что для формирования ответа, прежде всего, важен смысл запроса. Семантический каталог, по проекту, является составной частью комплексного поискового сервиса, состоящего из индексирующей поисковой машины, тематического каталога и системы контекстной рекламы. Его задачи.

Обеспечить пользователям еще одну, принципиально новую возможность поиска — уточнение запроса при помощи выбора из предлагаемых готовых формулировок.

Поднять качество результатов поиска, выдаваемых поисковой машиной за счет добавления к ним ссылок из семантического каталога вплоть до полного вытеснения алгоритмических результатов, выдаваемых в ответ на нечеткие запросы.

Обеспечить дополнительный доход владельцам поискового портала.

Обеспечить создание сети, состоящей из большого количества специалистов (не являющихся штатными работниками поискового портала), которые будут постоянно следить за качеством поиска и предлагаемых в поисковой выдаче материалов, привлекать к участию в рекламных программах поискового портала новых рекламодателей и поддерживать постоянный приток денег от уже имеющихся клиентов.

Семантический каталог является системой, сводящей воедино ранее принципиально разные, разделяемые задачи поискового сервиса — обеспечение качества поиска и получение доходов от контекстной рекламы.

Фактически, это механизм контекстной рекламы, в котором главным критерием размещения рекламных материалов является их соответствие ожиданиям, которые пользователи предъявляют к результатам поиска.

Реклама и Информация

Любая гиперссылка является рекламой страницы, на которую она ведет. Это легко доказать для любого частного случая, которых тысячи. Обратное утверждение — «ссылка — не реклама» — доказать практически невозможно. Практикующееся сегодня смысловое разделение результатов, выдаваемых поисковой системой в ответ на запрос и привязанных к этому запросу, на «рекламу» и «информацию» — несостоятельно. Реальный критерий отличия: ссылки, за размещение которых поисковая система получила деньги — «реклама», бесплатные — «информация». Хотя и те, и другие являются результатом целенаправленных усилий владельцев сайтов по привлечению посетителей на свои ресурсы.

Принципы семантического каталога и механизм организации ответов в нем позволяют гармонично совместить эти два понятия, которые сегодня кажутся несовместимыми — Информацию и Рекламу.

Как ищут пользователи

Статистика поисковых запросов хорошо изучена. Она показывает, что почти 90% пользователей вводят в поисковики запросы, состоящие из одного или двух слов — «автомобиль», «работа» и т.п., т.е. заведомо нечеткие. Но целью каждого пользователя является не почитать «что-нибудь про автомобиль», «что-нибудь про работу» и т.п., а найти информацию, которая поможет решить проблему, актуальную в момент выполнения запроса.

Поисковая система в ответ на нечеткий запрос выдает адреса сайтов (страниц), релевантных запросу, и дальнейший поиск информации пользователь ведет уже, перейдя по одной из предложенных ссылок. Запрос «автомобиль» в конце поискового пути вполне может означать получение информации на тему вроде «ремонт автомобиля BMW». Большинство пользователей предпочитает искать по максимально «ленивой» схеме.

Как можно меньше задумываться над формулировкой запроса.

Как можно меньше набирать в поисковой форме.

Как можно меньше просматривать результатов поиска.

Как можно меньше щелкать по ссылкам в поиске нужной информации.

Но лень не избавляет пользователя от необходимости выполнять переходы по ссылкам на найденном c помощью поисковика сайте. Выбирая нужные ему меню (ссылки), пользователь уточняет область интересов своего поиска и доходит до конечной точки. Если необходимой информации не оказалось или она не удовлетворяет требованиям пользователя, он возвращается в поисковик, выбирает новый сайт, и снова проходит уточняющий путь по ссылкам.

Интерес пользователя в поиске как на первом, так и на втором сайте одинаков, но уточняющий путь пройден дважды, потому что начинается он от ссылки, выданной поисковой системой в ответ на нечеткий запрос. Если и на втором сайте не окажется нужной информации, пользователь в третий раз пойдет по тому же смысловому пути — как на очередном сайте «про автомобили» найти информацию о ремонте BMW. Либо будет вынужден переформулировать запрос. Семантический каталог позволяет перенести этот уточняющий тему путь с сайтов в поисковую систему. В таком случае, пользователь, один раз пройдя в поисковике по короткой цепочке уточняющих ссылок, получит набор ссылок на страницы, находящихся на разных сайтах. Но на каждой из предложенных страниц будет нужная пользователю конечная информация. Чем отличается этот «семантический путь» от путешествия по рубрикатору обычного тематического каталога, и каковы отличия семантического каталога от тематического?

Три «кита» семантического каталога

Семантический каталог опирается на три основных принципа.

Первый.

Любой желающий имеет возможность поставить ссылку на любую страницу в соответствие любому поисковому запросу. При этом аннотировать ссылку так, как считает нужным.

Владельцу сайта, рекламисту, веб-мастеру предоставляется право самостоятельно выбрать, в ответ на какие запросы пользователей он хочет показывать ссылки на страницы своего ресурса и оформить тексты этих ссылок наилучшим образом.

Любые права тесно связаны с обязанностями. В нашем случае обязанность того, кто ставит ссылку, — одна, это и второй принцип семантического каталога.

Ответ на поисковый запрос должен быть точным.

Ответ — это не только ссылка. Ответ состоит из двух частей:

описания (аннотации) ссылки в семантическом каталоге, которое показывается пользователю, задавшему соответствующий ответу запрос;

содержимого веб-страницы, на которую предлагается перейти пользователю.

Невозможно полностью формализовать понятие «точный ответ». Такие ответы возможны только для однозначных вопросов: «Назовите отчество отца великого русского поэта А. С. Пушкина?» — «Львович». Но 99,9% поисковых запросов неоднозначные, нечеткие. Такие запросы имеют несколько вариантов понимания, соответственно, несколько возможных ответов. Третий принцип семантического каталога.

Качество любого ответа оценивается, исходя из интересов пользователей.

Соответствие ответа смыслу запроса

Как решать вопрос, какой ответ «соответствует смыслу запроса», а какой «не соответствует»? Вопрос о смысле и значении — давняя головная боль философов (см. «Сумму технологии» Станислава Лема). Смысл невозможно однозначно формализовать, а значение невозможно точно оценить — все зависит от точки зрения оценивающего.

В нашем случае острота проблемы усиливается тем, что решения придется принимать не немногим философам-теоретикам, а десяткам, затем, сотням и, возможно, тысячам практиков, специалистов по Интернет-рекламе, действующим в интересах клиентов, но в условиях, что результаты их действий оценивают пользователи. Интернет дает возможность отойти от необходимости теоретической разработки строгих правил и в каждом конкретном случае пользоваться достаточно простым — опять же не формализуемым — алгоритмом оценки, который известен каждому и называется «здравый смысл».

Итак, у нас есть алгоритм оценки — здравый смысл, и есть точка опоры — пользователи. В качестве «соответствующего ответа» на произвольный запрос должен рассматриваться ответ, удовлетворяющий здравому смыслу пользователей, ищущих информацию. И «не соответствующий» запросу ответ — это ответ неадекватный. Какова связь между формулировкой запроса и ответом, ожидаемым пользователем? Чем руководствуются пользователи, выбирая ответы?

Ожидания пользователей

Выбирая ссылку, выданную в качестве ответа на нечеткий запрос, пользователь руководствуется одним из двух мотивов, которые мы можем назвать как

уточнение запроса в ответе,

обобщение запроса в ответе.

Уточнение запроса

Поиск, начинающийся с нечеткого запроса в поисковую систему, выглядит так.

Выбор ссылки из предлагаемых поисковиком результатов.

Уточняющий путь на сайте перехода.

Уточняющий путь происходит по навигационным ссылкам на сайте. Аналог уточняющего пути — поиск по рубрикатору тематического каталога. Т.е. одним из ожиданий пользователя от результатов поиска является быстрое нахождение нужной ему уточняющей ссылки, например, «Автомобили» — «Немецкие автомобили» — «BMW».

Обобщение запроса

Пользователь понимает, что он ищет сайты, на которых находится нужная ему информация. Поэтому вторым — альтернативным — мотивом выбора ссылки является утверждение, что на предлагаемом сайте есть большое количество информации по теме, определенной поисковым запросом — обобщение запроса, сведение воедино всех возможных вариантов его понимания. Оно обычно оформлено в виде заголовка ссылки, описания и/или сниппетов. Второе ожидание пользователя — найти в результатах поиска обобщающую ссылку, например, «Автомобили» — «Автомобильный портал», «Все об автомобилях».

Переходы по обобщающей и уточняющей ссылкам

Обобщающая ссылка — это прямое приглашение перейти на сайт и получить информацию, либо продолжить поиск, пользуясь навигационными инструментами сайта перехода. Уточняющая ссылка — фактически приглашение получить ответ на другой, более четкий запрос. Именно так должна быть организована информация в семантическом каталоге, все ответы делятся на обобщающие и уточняющие. Обобщающий ответ уводит пользователя из каталога, это внешняя ссылка, уточняющий ответ — это ссылка внутренняя, переход по ней покажет пользователю все ответы, сделанные на запрос, являющийся аннотацией уточняющей ссылки. Пример. Запрос «автомобили». Обобщающий ответ: «Auto.ru — автомобили в России | Информация по автомобилям всех марок с фотографиями и все, что связано с автомобилями». — ссылка на главную страницу сайта Auto.ru