Экологическая обстановка в мире требует всестороннего и повседневного анализа состояния окружающей среды. Только на основании точных количественных данных можно принимать решения о проведении необходимых мероприятий, предупреждающих ухудшение состояния окружающей среды.
В настоящее время при решении экологических задач отходят от вербального описания и основываются на математических моделях и информационных технологиях. Одним из наиболее сложных и трудоемких процессов является выявление закономерностей из имеющихся массивов данных. Он не всегда заканчивается успешно, поскольку данные содержат разнотипную, противоречивую и неполную информацию.
Цель работы являлось проведение исследования, направленного на выявление тренда и сезонной декомпозиции в экологических данных.
Содержательная постановка задачи
Результатом хозяйственной или иной деятельности человека становится воздействие на все компоненты окружающей среды, в том числе и на земельные ресурсы. Негативные изменения могут проявляться в их загрязнении, а конечном счете – в деградации. Одна из основных причин – отсутствие единой региональной системы сбора, вывоза, сортировки, использования, обезвреживания и размещения отходов различного происхождения.
Регионы сталкиваются с проблемами наличия несанкционированных свалок, необходимостью их ликвидации и последующей рекультивации загрязненных земель. На несанкционированных свалках встречаются трупы животных, медицинские отходы, содержащие биологические остатки (использованные шприцы с остатками крови и др.). Согласно ст. 1 Федерального закона от 24.06.1998 № 89-ФЗ «Об отходах производства и потребления» отходы производства и потребления – остатки сырья, материалов, полуфабрикатов, иных изделий или продуктов, которые образовались в процессе производства или потребления, а также товары (продукция), утратившие свои потребительские свойства.
Для исследования степени воздействия на окружающую среду отходы принято классифицировать по классам опасности. Критерии отнесения отходов к классам опасности утверждены Приказом Министерства природных ресурсов Российской Федерации от 15.06.2001 № 511 «Об утверждении критериев отнесения опасных отходов к классу опасности для окружающей природной среды». Класс опасности отходов устанавливается по степени возможного вредного воздействия на окружающую природную среду (ОПС) при непосредственном или опосредованном воздействии опасного отхода на нее.
На санкционированные объекты размещения отходов запрещается прием, захоронение, обезвреживание химически и эпидемически опасных отходов; твердых, пастообразных и жидких отходов, которые содержат токсичные вещества (1–2 классов опасности); горючих и взрывоопасных ингредиентов; отходов радиоактивных веществ; трупы павших животных и конфискатов боен мясопереработки; отходов лечебных учреждений; сбор вторичного сырья; размещение приемных пунктов вторичного сырья от учреждений и населения.
Также остро стоит проблема захоронения отходов, образующихся в малых населенных пунктах области, т.к. строительство полноценного полигона требует больших финансовых затрат и не по силам бюджетам сельских поселений.
Обзор методов и моделей анализа временных рядов
В основу исследования взяты данные 1998–2013 гг. по обращению с отходами производства и потребления на территории Томской области. Исходные данные содержат такие характеристика, как общее количество: образованных отходов; отходов, поступивших от сторонних предприятий; переданных в переработку или во вторичное использование; отходов, которое осталось на следующий год на свалке; обезвреженных в текущем году; отходов, вывозимое на полигон.
Временной ряд включает в себя два обязательных элемента – отметку времени и значение показателя ряда [2].
В настоящее время существует множество моделей прогнозирования временных рядов: регрессионные и авторегрессионные модели, нейросетевые модели, модели экспоненциального сглаживания, модели на базе цепей Маркова, классификационные модели и др. Наиболее популярными и широко используемыми являются классы авторегрессионных и нейросетевых моделей [4]:
1. Авторегрессионные модели. В основу таких моделей заложено предположение о том, что значение процесса Z(t) линейно зависит от некоторого количества предыдущих значений того же процесса Z(t-1),…,Z(t-p). В этой модели текущее значение процесса выражается как конечная линейная совокупность предыдущих значений процесса и импульса, который называется «белым шумом»,
(1)
Формула (1) описывает процесс авторегрессии порядка p, здесь C – вещественная константа, φ1,..,φp – коэффициенты, εt – ошибка модели. Для определения φi и C используют метод наименьших квадратов [2] или метод максимального правдоподобия [3].
Другой тип модели имеет большое значение в описании временных рядов и часто используется совместно с авторегрессией называется моделью скользящего среднего порядка q и описывается уравнением
(2)
где q – порядок скользящего среднего, εt – ошибка прогнозирования.
Важными достоинствами данного класса моделей являются их простота и прозрачность моделирования. На сегодняшний день данный класс моделей является одним из наиболее популярных [2], а потому в открытом доступе легко найти примеры применения авторегрессионных моделей для решения задач прогнозирования временных рядов различных предметных областей.
Недостатками данного класса моделей являются: большое число параметров модели, идентификация которых неоднозначна и ресурсоемка [3]; низкая адаптивность моделей, а также линейность и, как следствие, отсутствие способности моделирования нелинейных процессов, часто встречающихся на практике [8].
2. Другой популярной моделью является модель на основе искусственных нейронных сетей [5]. Нейронные сети состоят из нейронов (рис. 1).
Рис. 1. Нелинейная модель нейрона
Модель нейрона можно описать парой уравнений
где Z(t – 1),..., Z(t – m) – входные сигналы; ω1,...,ωm – синаптические веса нейрона; p – порог; φ(U(t)) – функция активации.
При помощи нейронных сетей возможно моделирование нелинейной зависимости будущего значения временного ряда от его фактических значений и от значений внешних факторов. Нелинейная зависимость определяется структурой сети и функцией активации.
Основным достоинством нейросетевых моделей является нелинейность, т.е. способность устанавливать нелинейные зависимости между будущими и фактическими значениями процессов. Другими важными достоинствами являются: адаптивность, масштабируемость (параллельная структура ANN ускоряет вычисления) и единообразие их анализа и проектирования [4].
При этом недостатками ANN являются отсутствие прозрачности моделирования; сложность выбора архитектуры, высокие требования к непротиворечивости обучающей выборки; сложность выбора алгоритма обучения и ресурсоемкость процесса их обучения [4].
Одной из популярных современных тенденций является создание комбинированных моделей и методов. Подобный подход дает возможность компенсировать недостатки одних моделей при помощи других, и направлен на повышение точности, как одного из главных критериев эффективности модели.
Математическая модель
Для анализа экологических данных использована система, которая позволяет выявить закономерности временного изменения экологических показателей. Она включает такие сервисы, как
● выявление наличия сезонности;
● выделение трендов во временных рядах;
● определение сезонной декомпозиции.
Рассмотрим подробнее каждый.
Выявление наличия сезонности
Оценка наличия сезонных ритмов во временных рядах осуществлялась на основе функции автокорреляции и её графического представления – коррелограммы. При помощи анализа коррелограммы можно выявить структуру ряда. Последовательность коэффициентов автокорреляции со смещениями 1, 2, 3 и т.д. называют автокорреляционной функцией, значения которой находятся в диапазоне [– 1; 1]. Автокорреляционную функцию целесообразно использовать для выделения во временном ряде наличия трендовой и сезонной компонент.
Выделение трендов во временных рядах
Выявление наличия неслучайной составляющей сводилось к проверке гипотезы о неизменности среднего значения ряда с использованием критерия серий. При его использовании определяется медиана ряда, и образуются «серии» из плюсов и минусов по следующему правилу:
Элементы временного ряда, равные ymed ,
в полученной последовательности не учитываются. Под «серией» понимается последовательность подряд идущих плюсов или подряд идущих минусов. Наличие
неслучайной составляющей во временном ряде определяется из условия:
где v(n) – общее число серий, Kmax – длина наибольшей серии, [ ] – целая часть от числа [1].
Для построения тренда использовались два метода: скользящих средних и экспоненциального сглаживания [1].
Метод скользящих средних заключается в следующем:
1) определяется количество наблюдений, входящих в интервал сглаживания;
2) вычисляется среднее значение наблюдений в интервале сглаживания по формуле:
где m – количество наблюдений, входящих в интервал сглаживания. И так до тех пор, пока в интервал сглаживания не войдет последнее значение временного ряда.
В методе экспоненциального сглаживания каждое сглаженное значение рассчитывается путем сочетания предыдущего сглаженного значения и текущего значения временного ряда. В этом случае текущее значение временного ряда взвешивается с учётом сглаживающей константы:
где St – текущее сглаженное значение; yt – текущее значение временного ряда; St-1 – предыдущее сглаженное значение; α – сглаживающая константа, значение которой варьируется в диапазоне от 0 до 1.
Результаты исследования
В результате анализа экологических данных были получены следующие результаты, представленные на рис. 2–3. В результате исследования временных рядов на наличие периодичности и сезонности получено, что данные не являются периодичными и не содержат сезонности. Полученные результаты можно объяснить особенностью структуры данных.
Отсутствие в результатах проведенного исследования сезонности и периодичности свидетельствует о том, что основную массу отходов на исследуемых территориях составляют бытовые отходы (отходы потребления). Потребление населением товаров и услуг, в результате которых образуются отходы (упаковка, пластиковые бутылки, полиэтилен и др.) постоянны в течение года.
Рис. 2. Коррелограмма (нет сезонной составляющей)
Рис. 3. Исходный ряд
Что касается отходов производства, то отсутствие сезонности и периодичности может свидетельствовать о более-менее постоянном процессе производства на территории Томской области, т.е. сфера производства, развитая на территории области, в целом работает в круглогодичном режиме, без особых сезонных изменений.
Хотя здесь необходимо отметить тот факт, что отчетность по отходам собирается ежегодно, 1 раз в год, а не поквартально или помесячно, что так же может отражаться на результатах исследования.
Заключение
Отсутствие единой региональной системы сбора, вывоза, сортировки, использования, обезвреживания и размещения отходов различного происхождения, имеет значительные долгосрочные последствия для здоровья населения, экономики и окружающей среды. Поэтому важно содействовать экологически рациональному обращению с отходами и развивать программы их удаления, для чего необходимо проводить точные математические расчеты, на основании которых можно принимать решения о проведении защитных мероприятий по предупреждению ухудшения окружающей среды.