Scientific journal
International Journal of Applied and fundamental research
ISSN 1996-3955
ИФ РИНЦ = 0,556

ADVANTAGES AND DISADVANTAGES OF ARTIFICIAL NEURAL NETWORKS VERSUS CLASSICAL APPROACHES IN INDUSTRIAL ENVIRONMENTAL MONITORING

Anantchenko I.V. 1, 2, 3 Barankov K.A. 2 Mikhailidi A.A. 2
1 Saint-Petersburg National Research University of Information Technologies
2 Saint Petersburg State Technological Institute (Technical University)
3 Baltic State Technical University “VOENMEH” named after D.F. Ustinov
In conditions of increasing anthropogenic load and stricter requirements of environmental legislation, the use of intelligent systems capable of effectively predicting and controlling polluting emissions into the environment is in demand. The paper provides a comparative analysis of the effectiveness of two approaches to monitoring and forecasting industrial pollutant emissions: traditional statistical methods such as linear regression, the LASSO feature selection method and statistical control maps, as well as modern machine learning algorithms, including a multilayer perceptron, recurrent neural networks with long-term short-term memory and hybrid architectures combining convolutional and recurrent elements. The purpose of the study is to identify the advantages and limitations of each approach, identify the conditions for their greatest effectiveness, and justify the feasibility of using hybrid models. The objects of the study are emissions of pollutants into atmospheric air (carbon monoxide, nitrogen oxides, suspended particles up to 2.5 micrometers in size) and into aquatic environments (chemical oxygen consumption, petroleum products, heavy metals). Synthetic data was used to simulate real technological processes, taking into account weather, production and operational factors. It is shown that neural network models have an advantage in accuracy and sensitivity to anomalies, while classical methods remain stable with limited data and easy to interpret. The expediency of using hybrid approaches combining the advantages of both methodologies is substantiated.
emission monitoring
neural networks
ecology
regression analysis

Введение

Промышленная деятельность – один из ключевых источников загрязнения окружающей среды, оказывающий значительное воздействие как на атмосферный воздух, так и на водные ресурсы. Согласно последним оценкам, выбросы угарного газа, окислов азота, мелкодисперсных частиц и различных химических соединений с промышленных объектов продолжают расти, несмотря на ужесточение нормативных требований [1; 2]. Эффективный мониторинг этих выбросов становится необходимым не только для соблюдения санитарных норм и технических регламентов, но и в рамках общей стратегии устойчивого развития и промышленной безопасности [3; 4].

Классические методы экологического контроля – включая линейную регрессию, методы наименьших квадратов, контрольные карты Шухарта и CUSUM – широко применяются на производстве в силу своей простоты, понятности и возможности оперативной интерпретации результатов [5; 6]. Однако такие подходы часто демонстрируют ограниченную эффективность при работе с нелинейными зависимостями, шумами в данных, а также при необходимости учитывать множество переменных одновременно [7].

С развитием технологий обработки данных и вычислительных мощностей в сферу экологического мониторинга активно внедряются методы искусственного интеллекта. Особенно перспективным направлением считается использование искусственных нейронных сетей, таких как многослойный перцептрон, рекуррентные сети с долгой краткосрочной памятью, а также гибридные архитектуры, сочетающие свёрточную и временную обработку сигналов [3; 8; 9]. Они позволяют выявлять сложные причинно-следственные связи между производственными параметрами и уровнями загрязнения, а также предсказывать потенциальные превышения нормативов задолго до их фактического наступления [4; 10].

Таким образом, сравнительный анализ классических и нейросетевых методов в задачах мониторинга выбросов в воздух и воду представляет собой актуальное научно-прикладное направление. Выполненное исследование позволяет определить границы применимости разных моделей и обосновать целесообразность перехода к гибридным интеллектуальным системам контроля в промышленной экологии.

Цель работы – определить и сравнить эффективность классических статистических методов и современных моделей искусственного интеллекта при мониторинге и прогнозировании выбросов загрязняющих веществ в промышленных условиях, а также выявить оптимальные сценарии их применения в зависимости от объёма и структуры данных.

Материалы и методы исследования

Исследование проводилось на основе синтетически сгенерированных данных, моделирующих поведение системы контроля промышленных выбросов на условном объекте тяжёлой промышленности. Временной интервал составил 90 суток, временная дискретность – 1 час, что обеспечило объём данных в 2160 точек на каждый параметр.

Основное внимание уделено показателям загрязнения воздуха (CO, NOₓ, PM) и воды (химическое потребление кислорода (ХПК), нефтепродукты, тяжёлые металлы) [11]. В рамках исследования модели сравниваются по точности, устойчивости к шуму, требуемому объёму данных и способности выявлять превышения установленных предельно допустимых концентраций (ПДК).

Выбросы разделены на две категории:

• Атмосферные загрязнители:

• CO (угарный газ),

• NOₓ (окислы азота),

• PM2.5 (взвешенные частицы ≤2.5 мкм).

• Водные загрязнители:

• химическое потребление кислорода (ХПК),

• нефтепродукты,

• ионы тяжёлых металлов (свинец, ртуть).

Дополнительно учитывались условия окружающей среды и технологические параметры: температура, влажность, производственная нагрузка, режим работы оборудования.

Данные анализировались с использованием двух принципиально разных подходов: классических статистических методов и современных нейросетевых архитектур.

1. Классические методы

• Множественная линейная регрессия

Позволяет оценивать влияние входных параметров на загрязнение, при условии линейной зависимости. Применяется для базового контроля.

• LASSO-регрессия

Регуляризованный метод с автоматическим исключением нерелевантных факторов. Устойчив к мультиколлинеарности.

• Пороговый контроль (ПДК)

Простая логика превышения граничных значений, закреплённых в нормативных документах.

• Контрольные карты Шухарта и CUSUM

Применяются для выявления статистических сдвигов во времени [8; 9].

2. Искусственные нейронные сети (ИНС)

• Многослойный перцептрон (MLP)

Использован с двумя скрытыми слоями по 128 нейронов, ReLU-активация, оптимизатор Adam. Архитектура справляется с базовыми нелинейными зависимостями.

• Рекуррентная нейронная сеть LSTM

Применялась для учёта временной структуры загрязнений, позволяет анализировать задержки и периодические колебания выбросов.

• Гибрид CNN-LSTM

Сочетает свёрточные фильтры (выделение пространственных признаков) и LSTM-блоки. Применяется при наличии взаимосвязанных параметров, таких как погодные и производственные условия [11; 12].

Однако важно отметить:

• простые модели требуют меньше данных и вычислений;

• нейросети чувствительны к переобучению и шуму;

• классические методы более прозрачны для инженеров и регуляторов.

Каждая модель проходила обучение, валидацию и тестирование по стандартной схеме:

• обучающая выборка – 70%,

• валидационная – 15%,

• тестовая – 15%.

Оценка качества осуществлялась с помощью следующих метрик:

• RMSE (среднеквадратичная ошибка) – наиболее чувствительна к пиковым выбросам;

• R² (коэффициент детерминации) – степень соответствия модели данным.

Результаты исследования и их обсуждение

В таблице показаны ключевые метрики моделей прогнозирования выбросов для наглядного их сравнения.

Для подробного анализа различий подходов были построены графики, представленные на рис. 1 и 2. На первом показана зависимость эффективности моделей от количества внесенных замеров, а на втором дано сравнение индекса совокупных потерь – объединённого показателя, учитывающего и ошибку прогноза (RMSE), и недостигнутую долю объяснённой дисперсии (1 – R²).

Результаты моделирования показали значительные различия в эффективности методов, особенно в условиях нелинейных связей между технологическими параметрами и уровнем загрязнений.

Сравнительная характеристика моделей прогнозирования выбросов

Метод

RMSE (CO), мг/м³

R² (CO)

Требуемый объём данных (набл.)

Линейная регрессия

0.38

0.73

500

LASSO-регрессия

0.35

0.75

600

MLP

0.25

0.85

1200

LSTM

0.21

0.92

1500

CNN-LSTM

0.19

0.94

1600

Примечание: составлено авторами на основе полученных данных в ходе исследования.

Рис. 1. Влияние объема данных на эффективность моделей Примечание: составлено авторами на основе полученных данных в ходе исследования

Рис. 2. Сравнение суммарной ошибки подходов Примечание: составлено авторами на основе полученных данных в ходе исследования

1. Точность прогнозов

Наиболее важным критерием в задачах экологического мониторинга является точность. Нейросетевые модели (особенно LSTM и CNN-LSTM) обеспечили наименьшие значения RMSE по всем ключевым загрязняющим веществам.

Такая высокая точность объясняется способностью ИНС улавливать сложные паттерны, включая нелинейные зависимости и временные лаги, что особенно полезно при мониторинге выбросов в реальном времени [13; 14].

2. Выявление пиков и предикция превышений ПДК

Классические модели часто сглаживали резкие выбросы, в то время как нейронные сети (особенно LSTM) успешно фиксировали их на этапе до наступления превышения. Это критично для раннего предупреждения аварийных ситуаций.

3. Устойчивость к объёму данных

Классические модели демонстрировали стабильные результаты даже при 500–600 наблюдениях, что делает их применимыми в условиях ограниченных данных (например, на малых предприятиях).

ИНС требовали от 1200 наблюдений для MLP и свыше 1500 для LSTM/CNN-LSTM – иначе модель склонна к переобучению или резкому снижению точности на тестовой выборке [15].

4. Интерпретируемость и объяснимость

Линейная и LASSO-регрессии легко визуализируются и обосновываются в технической документации. ИНС в свою очередь требуют применения дополнительных техник, таких как SHAP, Grad-CAM или LIME, для объяснения влияния входов на прогноз [5].

5. Проблемы переобучения и валидации

В случае отсутствия регуляризации нейронные сети демонстрировали переобучение:

• ошибка на обучающей выборке снижалась до RMSE = 0.10,

• но на валидационной – возрастала до RMSE = 0.35–0.40.

Внедрение Dropout (0.2–0.3), Batch Normalization и EarlyStopping позволило стабилизировать кривые потерь и повысить обобщающую способность модели [2; 10].

Заключение

В условиях ужесточения экологического законодательства и роста общественного внимания к промышленным выбросам задача повышения эффективности систем экологического мониторинга становится всё более актуальной. Выполненное исследование позволило выявить ключевые преимущества и ограничения классических и нейросетевых подходов к прогнозированию выбросов загрязняющих веществ в воздух и воду. На основании моделирования и сравнительного анализа можно сделать следующие выводы.

1. Нейросетевые модели (LSTM, CNN-LSTM) демонстрируют значительно более высокую точность (RMSE и R²) по сравнению с классическими методами, что делает их использование предпочтительным для задач, требующих чувствительности к сложным нелинейным и временным зависимостям, таких как прогноз краткосрочных выбросов, определение пиков и опережающая диагностика превышений ПДК.

2. Классические методы остаются востребованными благодаря своей устойчивости при небольшом объёме данных, простоте настройки и интерпретируемости результатов. Классические методы особенно эффективны на этапе первичного экологического аудита, а также в условиях ограниченных вычислительных ресурсов.

3. Для эффективной работы нейросетей необходимы:

• достаточный объём данных (1500 + наблюдений);

• механизмы регуляризации (Dropout, BatchNorm, EarlyStopping);

• валидационные процедуры для предотвращения переобучения;

• методы объяснимого ИИ для интеграции в существующие системы контроля.

4. Наилучшей практикой может стать гибридный подход, при котором:

• нейросети используются для предиктивной аналитики и прогнозирования,

• а классические модели – для документированной верификации, интерпретации и подтверждения прогнозов в отчётных системах.

Таким образом, выбор модели должен определяться конкретными условиями предприятия: доступностью и структурой данных, требованиями к интерпретируемости, вычислительными возможностями и конечной целью мониторинга (контроль, предсказание, предупреждение).

Интеграция ИНС в промышленную экологию – не только технологическое усовершенствование, но и шаг к более устойчивому и адаптивному экологическому управлению.