Как измерить качество речевой связи (стр. 1 из 2)

Питер Морриси

Передача речевой информации по IP-сетям, или IP-телефония (VoIP), предъявляет к сетевой инфраструктуре гораздо более жесткие требования, чем любое другое приложение. Степень доступности сети, потеря пакетов и временные задержки могут оказывать существенное влияние на качество речевой связи.

Чтобы исключить факторы негативного воздействия технических проблем в сети на качество связи, необходимо не только соответствующим образом спроектировать саму сеть, но и регулярно проводить мониторинг ее работы. Конечно, сама сеть передачи данных не является единственно возможным источником возникновения различных дефектов связи, проблемы могут также вызвать некачественные гарнитуры, непрофессионально сконфигурированные цифроаналоговые шлюзы и, наконец, тривиальное эхо из телефонной сети общего пользования (ТфОП). Поэтому вам придется выяснить, не оказывают ли эти компоненты отрицательное воздействие на работу речевых приложений.

Самым лучшим способом определения качества связи в сетях VoIP считается оценка его самими абонентами. Степень вредного воздействия шума, эха, задержек или помех от различных тоновых генераторов (warbling) на качество речевой связи определяется как интенсивностью этих факторов, так и тем, насколько они мешают разговаривать конкретным абонентам. Теоретически, для точной оценки степени этого воздействия следовало бы провести опрос достаточно большого числа абонентов, поскольку восприятие качества речевой связи всегда субъективно. Однако совершенно очевидно, что проведение таких регулярных опросов абонентов не представляется возможным.

Кроме того, нужно иметь в виду, что оценка степени удовлетворенности абонентов IP-телефонии качеством связи — дело достаточно сложное, в отличие, например, от подобной оценки качества услуги передачи данных, которое можно определить просто по скорости вывода на экран результатов тех или иных запросов (для этого достаточно лишь измерить время отклика системы). К счастью, появились новые средства контроля качества речевой связи, позволяющие делать это достаточно эффективно в автоматическом режиме.

Старый, добрый MOS

Официально рекомендуемым способом оценки качества IP- и других типов речевой связи является усредненная субъективная оценка MOS (Mean Opinion Score), алгоритм определения которой был разработана МСЭ-Т и последний раз корректировался в середине 90-х годов прошлого века. Алгоритм MOS, изложенный в спецификации МСЭ-Т Р.800, основан на пятибалльной шкале — от единицы (самое плохое качество связи) до пяти (самое хорошее качество). В соответствии с этим алгоритмом группа людей оценивает качество звучания тестовых речевых шаблонов, передаваемых через сеть. Эти оценки, конечно, субъективны. Как правило, самый большой балл, который можно получить по данной методике, равен 4,5. Рейтинг в 4,0 балла и выше рассматривается как очень высокий, соответствующий качеству ТфОП. Цифровые сеансы связи часто получают даже более высокие оценки.

Попытки автоматизировать процесс получения оценок MOS делались еще задолго до широкого распространения технологии VoIP. Один из таких алгоритмов, известный как PSQM (Perceptual Speech Quality Measure), был закреплен МСЭ-Т в спецификации Р.861. Однако PSQM, используемый в некоторых системах тестирования качества речевой связи, не слишком подходит для проверки VoIP-сетей, поскольку не учитывает, в частности, флуктуацию задержки (или джиттер), часто возникающую в IP-сетях. Между тем известно, что даже небольшая задержка между пакетами с речевой информацией вызывает изменения передаваемого речевого шаблона. В результате при сравнении отправленного и принятого шаблона может быть выставлена некорректная оценка качества речевой связи.

К счастью, современные программные средства, используемые для оценки качества речевой связи, выполняют свою работу максимально приближенно к тому, как это делает группа экспертов. Такие алгоритмы, как PSQM+, PESQ (Perceptual Evaluation of Speech Quality) и PAMS (Perceptual Analysis Measurement System), тоже предполагают передачу по VoIP-сети специальных речевых шаблонов и их последующий сравнительный анализ на приемной стороне сети. Алгоритм PESQ определен в стандарте МСЭ-Т Р.862.

Разработчики программного обеспечения MOS

Opticom (http://www.opticom.com) — разработчик алгоритмов контроля качества речи, а также портативных анализаторов Opera,

Psytechnics (httptf/www.psytechftics.com) — известна своими основанными на стандартах алгоритмами контроля качества речи и дополнительными продуктами типа Psyvoip.

Telchemy (http://wwwAekbemy.com) — разработчик программного обеспечения для контроля качества речи, используемого такими компаниями, как Acterna, Brix Networks, Finisar и др,

Насколько точны алгоритмы оценки качества связи

Если вы не уверены в том, что алгоритмы типа PESQ могут достаточно точно оценить качество речевой связи, попытайтесь оценить эффективность используемого вами инструментария. Если вы приобретаете программу, оценивающую значения MOS, обязательно попросите показать вам для сравнения результаты, полученные с помощью этой программы, и оценки MOS, выставленные реальными людьми (при использовании тех же самых шаблонов). Чем ближе MOS-оценки, полученные «ручным» и автоматизированным способами, тем точнее алгоритм.

«Тестируя алгоритм PESQ, мы постоянно сравнивали полученные с его помощью результаты с оценками экспертов», — рассказывает Майк Хол-лиер, директор по технологиям компании Psytechnics, которая принимала непосредственное участие в разработке PESQ. Этот алгоритм был предложен МСЭ-Т совместно компаниями Psytechnics, Opticom и SwissQual. Специалисты указанной международной организации сравнивали результаты измерения качества передачи речевой информации, полученные по алгоритму PESQ, с экспертными оценками, предоставленными компаниями AT&T и ВТ. Корреляция между двумя группами оценок, по словам Холлиера, составила 0,95 — очень хороший результат. И в декабре 2003 г. МСЭ-Т одобрил алгоритм PESQ в качестве стандарта. PESQ, который рассматривают в качестве преемника PSQM, более точно измеряет качество телефонной связи через IP-сети.

Вместе с тем недостатком PESQ и других новых алгоритмов является то, что они основываются на сравнении аудиопотоков на входе и выходе системы. Это так называемый мониторинг методом «активного тестирования». Но такой мониторинг, помимо того, что неизбежно добавляет трафик в сети, вызывает и ряд специфических проблем по организации тестирования. В частности, не всегда представляется возможность разместить измерительное оборудование на обоих концах канала связи. Предположим, вызов в вашу IP-сеть поступает из ТфОП, и вы не в состоянии проверить качество шлюза ТфОП, который может генерировать эхо и вызывать дополнительную задержку при перекодировании речевых сигналов.

Таким образом, алгоритмы «активного тестирования» позволяют эффективно проверить качество связи внутри вашей сети, но мониторинг любых вызовов, заканчивающихся вне ее, оказывается невозможным. Для решения этой проблемы была разработана спецификация Р.563, которая определяет алгоритм «пассивного мониторинга». Такой алгоритм тестирования не предполагает введение в сеть дополнительного трафика, и реализующее его программное обеспечение анализирует непосредственно передаваемые речевые потоки. При этом программа генерирует рейтинги MOS аналогично тому, как это делает группа экспертов.

Этот метод отличается от многих других тем, что для сравнения в нем не используются никакие специальные речевые шаблоны. Рейтинг качества, полученный с помощью Р.563, может быть с легкостью верифицирован группой экспертов, работающих параллельно. Корреляция между рейтингами Р.563 и рейтингами, выставляемыми реальными пользователями, обычно варьируется от 0,85 до 0,9. Конечно, алгоритм Р.563 не так точен, как PESQ, но при этом он достаточно эффективен.

ДРУГИЕ АЛГОРИТМЫ ОЦЕНКИ КАЧЕСТВА

Компания Psytechnics предложила еще один алгоритм оценки качества — Psyvoip. Он менее точен, чем Р.563, зато способен анализировать речевой поток в реальном времени в течение всего сеанса связи. Это очень интересный вариант, особенно учитывая то, что для анализа только одного звонка по методике MOS требуется достаточно большая процессорная мощность. Алгоритм Psyvoip для оценки качества связи использует статистические данные протокола RTP (Real Time Protocol). Он также обнаруживает проблемные IP-адреса, чтобы потом с помощью более сложных алгоритмов, типа PESQ, проводить дополнительное исследование.

Еще один способ анализа качества речевой связи основан на модели E-model (стандарт G.107), изначально разработанной с целью облегчить планирование инсталляций VoIP-систем. Компания Qovia и ряд других разработчиков усовершенствовали этот алгоритм и адаптировали его для пассивного мониторинга. По точности оценки этот метод уступает Р.563, зато его реализации не так дороги. Системы, основанные на E-model, целесообразно использовать для локализации проблем и последующего их исследования с помощью более дорогих и ресурсоемких алгоритмов.

Глоссарий

Active monitoring — метод оценки качества речевой связи, предполагающий посылку по сети специального контрольного речевого шаблона с последующим сравнением его на входе и на выходе системы и оценкой степени воздействия сети на этот шаблон. Иногда, этот метод называют мониторингом с вмешательством в работу сети (intrusive monitoring).

E-Model (МСЭ-Т G.107) — алгоритм, первоначально предназначавшийся для использования при планировке сети, был доработан некоторыми компаниями с целью применения в качестве недорогого инструментария пассивного мониторинга. Оценивает качество речевой связи с помощью R-фактора (по шкале от 0 до 100).

MOS (Mean Opinion Score) — алгоритм, закрепленный в спецификации МСЭ-Т Р.800, предполагает систематическую экспертную оценку качества голосовой связи группой пользователей по пятибалльной шкале. Оценки 4,0 и выше рассматриваются как соответствующие качеству связи в ТфОП.

PAMS (Perceptual Analysis Measurement System) — нестандар-тизованный алгоритм оценки качества голосовой связи, разработанный компанией British Telecom в 1998 г. Учитывает флуктуации задержек в cети VoIP.