стохастическое моделирование и прогноз загрязнения атмосферы с использованием нелинейной регрессии
А. Пашкова
ВВЕДЕНИЕ
2. МЕТОДОЛОГИЯ РЕШЕНИЯ
2.2 Алгоритм
2.4 Программа
3.1 Исходные данные
3.3 Преобразование предикторов
3.4 Построение регрессионного уравнения
3.5 Оценка эффективности прогностической схемы
3.6 Сравнительный анализ результатов
3.7 Результаты для других городов
ЛИТЕРАТУРА
Разработка методов прогнозирования загрязнения воздуха является одной из важнейших задач, возникающих в рамках проблематики охраны воздушного бассейна. Прогнозы и предупреждения о высоком уровне загрязнения воздуха служат основанием для проведения мероприятий по регулированию выбросов и уменьшению антропогенной нагрузки на окружающую среду в периоды неблагоприятных метеорологических условий.
Актуальность указанной тематики обусловлена тем, что в последние годы, несмотря на применяемые природоохранные меры, проблема чистоты атмосферы городов Российской Федерации не только не решена, но даже обострилась. Как следует из анализа результатов наблюдений, за последнее десятилетие в крупнейших (численностью более 500 тыс. жителей) городах России, высокий уровень загрязнения воздуха сохранился и, согласно прогнозу, такая тенденция будет иметь место в течение ряда лет. Сравнение средних за год концентраций примесей с национальными стандартами качества воздуха показало, что они превышают установленные нормативы предельно допустимых концентраций (ПДК). Максимальные концентрации, превышающие ПДК в десятки раз, регулярно регистрировались в большинстве (55-80%) крупнейших городов страны.
Проводимая в нашей стране природоохранная политика предусматривает необходимость регулирования (т.е. сокращения) выбросов в периоды неблагоприятных метеорологических условий (НМУ). Чтобы обеспечить практическую возможность такого сокращения, соответствующие органы управления, предприятия и др. должны быть оповещены заранее о необходимости своевременного сокращения выбросов вредных примесей.
В этой связи практический интерес представляют краткосрочные прогнозы - большей частью с заблаговременностью от 1 до 3 суток. Их внедрение при обеспечении регулирования выбросов позволяет в ближайшее время без значительных затрат улучшить состояние воздушного бассейна и предотвратить появление высоких уровней загрязнения воздуха.
Целью дипломной работы является разработка стохастической модели, которая позволяет производить краткосрочный прогноз абсолютных уровней загрязнения воздуха на территории городов методами регрессионного анализа. В соответствии с указанной целью в работе были поставлены следующие задачи:
- выбор метода и разработка статистической модели прогноза загрязнения;
- выбор вычислительных алгоритмов;
- программная реализация математической модели;
- построение соответствующие этой модели прогностических схем загрязнения воздуха по данным измерений и оценка их эффективности на основе данных, полученных в нескольких городах;
- проведение анализа результатов, полученных на основе прогностических схем.
Оперативные методы прогноза загрязнения воздуха изложены в действующем «Руководстве по прогнозу загрязнения воздуха» РД.52.04.306-92 [5] и внедрены во всех управлениях Росгидромета. Работы по прогнозированию загрязнения воздуха проводятся в 250 городах Российской Федерации, предупреждения его возможного роста передаются более чем на 5000 предприятий, на которых принимаются конкретные меры по снижению выбросов в неблагоприятные периоды.
Однако, методы прогноза, используемые в оперативной практике Росгидромета, не позволяют предсказывать наибольшие концентрации примесей, формирующиеся в воздухе отдельных районов промышленных городов. А ведь предотвращение появления высоких концентраций имеет существенное значение для решения проблемы защиты атмосферы от загрязнения в период НМУ.
Модель, разработанная в данной работе, не имеет подобных недостатков, так как позволяет прогнозировать не относительные характеристики загрязнения воздуха на территории городов, а их абсолютные уровни.
Основная задача данной работы ¾ краткосрочный прогноз максимальных концентраций загрязняющих примесей. Рабочая гипотеза состоит в том, что формирование опасного загрязнения воздуха на достаточно большой территории города обусловлено процессами рассеивания антропогенных выбросов, то есть, процессами, регулярно встречающихся при обычных технологических режимах работы промышленных источников или в суточном ходе изменения в интенсивности движения автотранспорта. Задача прогноза последствий аварийных выбросов вредных веществ в атмосферу вследствие нарушения технологических процессов на предприятиях в данной работе не рассматривается.
Количественной оценкой наибольшего загрязнения может служить максимальная (CМАХ) из измеренных за день концентраций на посту. Измеренные на каком-то конкретном посту концентрации значительно варьируются в течение суток за счет изменчивости:
- выбросов,
- «внешних» метеорологических условий,
- локальных флуктуаций концентраций, связанных с флуктуациями локальных метеопараметров, определяющих перенос и рассеивание примесей.
При переходе к дневным максимумам влияние локальных флуктуаций сильно уменьшается, уменьшается также роль систематических изменений выбросов в течение суток, так что связь с внешними метеорологическими условиями становится более устойчивой.
Решение основной задачи работы сводится к разработке метода прогноза максимальной за день концентрации в точке наблюдения. При такой постановки задачи необходимо выполнение следующего требования: разрабатываемый метод должен быть эффективным как для области часто наблюдаемых значений, так и для высоких квантилей (экстремумов) функции распределения CМ.
При наличии многолетних рядов наблюдения за загрязнением атмосферы для этой цели можно применить хорошо разработанный математический аппарат регрессионного анализа. Он позволяет на основе статистического анализа зависимостей между переменными прогнозировать одну из них, если известны значения других.
Воспользуемся для решения поставленной задачи методом регрессионного анализа с определенными преобразованиями - достаточно простым и удобным математическим аппаратом.
В рамках регрессионного анализа модель представляется в виде:
, (1)где СМАХ – предиктант (в нашем случае максимальная концентрация рассматриваемой примеси за сутки), xi – предикторы (в качестве предикторов используют различные метеорологические характеристики), а bi – коэффициенты регрессии, которые требуется оценить.
e¾ вектор ошибки (остатка). Предполагается, что e¾ независимая случайная величина, имеющая нормальное распределение N(0, s2).
Уравнение решается методом наименьших квадратов, т.е. из условия минимума среднего квадрата ошибок. После того как определены параметры bi, получаем прогностическое уравнение, которое отличается от исходного модельного уравнения тем, что не содержат случайной ошибки.
Успешное применение выбранного математического аппарата требует обеспечить выполнение следующих условий: двумерное (совместное) распределение плотности вероятности переменных (предиктанта с каждым из предикторов) подчиняется нормальному закону; форма связи между переменными должна быть близкой к линейной. При этом, однако, заранее известно, что экстремумы случайной величины обычно не распределены нормально, и что связи между предикторами и предиктантом могут оказаться нелинейными. Поэтому перед тем, как строить уравнение регрессии, необходимо преобразовать переменные таким образом, чтобы линеаризовать и нормализовать соответствующие связи.
После соответствующих преобразований переменных, включающих нормализацию предиктанта и предварительное исключение нелинейности связей, получаем рабочее уравнение:
, (2)Задача с преобразованными предикторами решается методом пошагового регрессионного анализа. Данный вид анализа позволяет включать в схему только те факторы, которые имеют значимую корреляцию с показателями загрязнения. Применение такого аппарата обусловлено тем, что нет никакой гарантии, что между используемыми предикторами отсутствует тесная корреляционная связь. Если же такая связь существует, то соответствующая система уравнений метода наименьших квадратов, используемая для определения коэффициентов в уравнении регрессии, оказывается плохо обусловленной, а ее решение может привести к накоплению вычислительных ошибок.
После того как определены параметры bi, получаем прогностическое уравнение. По этому уравнению рассчитываются прогностические значения максимальной концентрации загрязняющей примеси. Применимость этого уравнения проверяется его испытанием на независимой выборке.
Из значений СМАХ и СМАХПРОГ, полученных с использованием прогностических уравнений по зависимому и независимому рядам, формируется таблица результатов прогноза и рассчитываются статистические характеристики эффективности прогноза максимальной концентрации примеси.
Исходные данные для разработки стохастических моделей были предоставлены ГУ «ГГО» по таким городам, как Санкт-Петербург, Обнинск, Милан, Мадрид, Новосибирск и др.