Смекни!
smekni.com

Что такое спам - борьба со спамом (стр. 2 из 6)

Однако драматизировать ситуацию не стоит. По мнению уже упомянутого господина Бакстера, все вышеописанное – это всего лишь очередной раунд борьбы между злым спамерским гением и талантом честных программистов. Основная идея случайной последовательности слов – запутать и сбить с толку фильтрующую программу. Ведь многие из продвинутых программ-фильтров не имеют четкого набора ключевых слов и используют эвристические алгоритмы для того, чтобы определить, является ли поступившее на сервер письмо обычным почтовым отправлением или это подарок от желающего прорекламировать сомнительные услуги дельца. К примеру, разрабатываемое компанией Энтони Бакстера программное обеспечение использует для этого так называемый "Байесовский алгоритм", основанный на вероятностно-статистическом анализе текста каждого поступающего в почтовый ящик сообщения.

Любопытно, наверное, будет узнать, что метод назван "Байесовским" в честь английского священника Томаса Байеса, бывшего к тому же еще выдающимся математиком. Если говорить кратко, то преподобный Байес разработал формулу, которая позволяет достаточно точно рассчитывать вероятность некоторого предположения (гипотезы – по-научному), беря в учет как ранее известную информацию, так и данные новых наблюдений. К примеру, программы типа SpamBayes и SpamAssassin анализируют текст каждого послания и на основе прежних наблюдений и статистического разбора текущего текста делают предположение о характере поступившего письма.

Так вот, случайность или, точнее, неопределенность, преднамеренно вносимая спамерами в свои послания, сводит на нет все предыдущие наблюдения почтового фильтра, основанного на Байесовском алгоритме. В результате этого программа теряет возможность определять, "что такое хорошо и что такое плохо" при анализе письма. "Умный" Байесовский фильтр увязает в попытках отыскать смысл в нагромождении случайных слов и не может с требуемой достоверностью определить, относится ли послание к вредительским или пользователь, наоборот, жаждет его получить как можно скорее. Удивительно, но в такой ситуации сильнее оказываются более простые программы, которые попросту проверяют текст письма на наличие запрещенных слов и словосочетаний, которые чаще всего используются в спамерских посланиях, но редко присутствуют в письмах обычных пользователей (примеры известны каждому, кто успел приобщиться к спаму – viagra, Nigeria, free porn…).

Создатели умных программ, однако, не сдаются и используют различные приемы, позволяющие антиспамерским фильтрам "отделять зерна от плевел". К примеру, существует технология, позволяющая программным фильтрам быстро сравнивать набор слов в исследуемом тексте с набором слов в ранее полученных типичных рекламных письмах, о которых программа помнит по прежним своим исследованиям. "Случайный словесный шум", добавляемый в начало послания, сбивает с толку фильтр, который воспринимает письмо как абсолютно новый текст, не имеющий ничего общего с ранее полученным спамом. Фильтрующая программа ошибается – пользователь недоволен. Новый алгоритм, предложенный создателями "умных" программ, предполагает усовершенствовать традиционный подход. Известно, что каждый владелец почтового ящика имеет предпочтительные темы для переписки и, соответственно, формирует свой собственный набор предпочтительных слов, которые чаще всего встречаются в переписке с друзьями и знакомыми. Задача Байесовского фильтра состоит в том, чтобы определить набор любимых слов, которые присутствуют в большинстве почтовых посланий, получаемых владельцем почтового ящика. Поскольку набор этих слов уникален, то появление непривычных слов и выражений заставляет задуматься о том, что поступившее письмо – спам.

К слову сказать, бессмысленность набора слов, применимых для обмана почтового фильтра, сама по себе является признаком, по которому программа, использующая Байесовский алгоритм, может определить принадлежность письма к спаму. Дело в том, что программное обеспечение, которое применяют спамеры для подготовки "мусорной почты", использует стохастический (то есть случайный) алгоритм формирования маскирующего текста. За счет этого создается последовательность слов, обладающая признаками "белого шума", то есть случайного набора данных. Используя лингво-статистический анализ, программа-фильтр может выявить наличие случайности в анализируемом тексте и идентифицировать его как "белый шум", то есть полную бессмыслицу. Ну а бессмысленность послания – явный признак того, что "в сети попалось" спамерское письмо. Так что, как говорится, на каждый яд свое противоядие найдется. Вот только поиски его иногда требуют слишком больших усилий…

Не всегда получение текстовых объявлений и прослушивание голосовой рекламы происходит против воли абонента. В Китае определенной популярностью пользуется специальный сервис: подписавшиеся на эту услугу абоненты имеют возможность несколько раз в день выслушивать рекламу по телефону.

Это явление хорошо знакомо всем пользователям электронной почты. Спам мутирует, приспосабливаясь к меняющимся условиям, и приобретает иммунитет к разнообразным фильтрам. Бороться с ним сложно, так как слишком велик риск «выплеснуть с водой ребенка» - порой вместе с мусором безвозвратно «фильтруется» и важное сообщение. Теперь с этим явлением все чаще приходится сталкиваться и владельцам мобильных телефонов. Навязчивая реклама на экране мобильника не просто раздражает - действительно важное сообщение может оказаться принятым с опозданием из-за забитой мусором памяти телефона. SMS-спам неоднозначен и труднее поддается категоризации: в зависимости от предпочтений абонента одно и то же сообщение может быть раздражающей рекламой или полезной информацией. Наконец, наши возможности «фильтровать SMS-базар» более чем ограничены – как правило, по принципу «принимаем или все, или ничего». Насколько актуальна эта проблема для России, и можно ли бороться с непрошеной рекламой?

Невеселые перспективы

Европа, США и Япония уже прошли через стихийное бедствие мобильного спама. Японский оператор DoCoMo был вынужден принять специальные меры – в месяц компания получала порядка 50 тысяч жалоб на телефонно-рекламный мусор. В США один из первых успешных судебных процессов состоялся больше года назад - оператор Verizon Wireless подала в суд на Acacia National Mortgage и добилась запрета на рассылку SMS-спама (Acacia разослала 170 тысяч SMS-сообщений абонентам Verizon в Колорадо и Аризоне). В Европе принимаются достаточно жесткие законы, регламентирующие использование SMS в качестве рекламного инструмента. Например, в Великобритании в середине сентября принят закон, требующий запрашивать у пользователей разрешения на рассылку рекламных сообщений на мобильные телефоны. Штрафные санкции в размере от 5 тысяч фунтов начнут применяться с 11 декабря – гуманные законодатели отмерили компаниям-спамерам три месяца срока на освоение альтернативных способов рекламы. Рекламные сюрпризы уже не ограничиваются просто текстом: один раз я «собственноушно» прослушал 10-секундный рекламный ролик о новой коллекции одёжки в некоем бутике. Каким образом запись оказалась в ящике голосовой почты - понятия не имею. SMS-сообщения в формате flash назойливы – автоматически выводятся на экран, а с ростом популярности MMS нас вполне могут заставить смотреть "рекламные паузы" не только на экране телевизора. Еще одна потенциальная беда – так называемые "SMS-вирусы". Известны случаи, когда специальным образом отформатированный SMS-текст вызывает «зависание» телефона при попытке открыть сообщение. В России мобильный спам пока всерьез не принимают – дай бог найти управу на «классический» email-мусор.

Естественные ограничители SMS-спама

В определенном смысле нам всем повезло: стремление операторов не упустить свой доход в данном конкретном случае пошло на пользу абонентам сотовых сетей. Краеугольный камень любого спамерского бизнеса – минимальные расходы на доставку. Иначе вся затея (массовая рассылка) теряет финансовый смысл. Например, в принципе никто не мешает (технический аспект не затрагиваем) разослать всем московским абонентам SMS-рекламу стирального порошка. Стоимость мероприятия по стандартным расценкам – порядка 450 тысяч долларов. Это ж вся

Москва должна вдруг засиять чистотой, чтобы такая массовая рассылка себя окупила!

Полтора-два года назад отправить десяток или пару сотен SMS-сообщений в сеть любого российского GSM-оператора не составляло особого труда и не требовало даже минимальных «инвестиций» - десятки специальных компьютерных программ, Интернет-порталы и специализированные сайты… Неудивительно, что на дисплеях мобильников появилась реклама. Сегодня бесплатно SMS-спам особо не порассылаешь, операторы заботливо перекрывают шлюзы и даже жестко ограничивают отправку SMS со своих сайтов. Лимитируется частота отправки и количество сообщений с одного IP-адреса, Билайн для борьбы с «роботзированными» отправителями использует меняющийся графический код.

Цивилизованный спам

Не всегда получение текстовых объявлений и прослушивание голосовой рекламы происходит против воли абонента. В Китае определенной популярностью пользуется специальный сервис: подписавшиеся на эту услугу абоненты имеют возможность несколько раз в день выслушивать рекламу по телефону… за деньги! В конце каждого "рекламного ролика" абоненту сообщается о начисленной на его счет сумме. Похожие проекты существуют и в других странах. В Великобритании один из операторов начисляет своим абонентам "бонусные" минуты за прослушивание информации: выслушал рекламную сагу о пиве и подгузниках – можно бесплатно позвонить другу и договориться это самое пиво вместе употребить (не обязательно в подгузниках). Практикуется и бесплатная подписка на нужные абоненту информационные услуги в обмен на его согласие получать определенное количество рекламной информации. Новые и весьма перспективные технологии – локальная доставка информации с учетом местоположения пользователя. Например, в комплект поставки оборудования и ПО для организации микросоты (концертный зал, стадион, супермаркет) может входить программный модуль для передачи текстовых сообщений на зарегистрировавшиеся в этой микросоте телефоны. Такие решения уже давно работают в других странах, сообщая, например, покупателям торговых центров о всяких «спецпредложениях».