Научный журнал
Международный журнал прикладных и фундаментальных исследований
ISSN 1996-3955
ИФ РИНЦ = 0,593

ОЦЕНИВАНИЕ ФУНКЦИИ ПЛОТНОСТИ РАСПРЕДЕЛЕНИЯ С ИСПОЛЬЗОВАНИЕМ ВЕЙВЛЕТА МОРЛЕ

Исаева Е.В. 1
1 ФГБОУ ВО «Новосибирский государственный технический университет»
Для решения большинства задач, которые возникают в результате статистической обработки данных, требуется информация о виде распределения случайной величины. Решить вопрос об оценивании плотности вероятности распределения случайной величины можно разными методами, в том числе и методом, основанным на вейвлет-анализе. Использование вейвлетов позволяет разложить неизвестную функцию в ряд по некоторому конечному набору ортонормированных базисных функций. В качестве такого набора можно использовать систему функций, определённую на том же отрезке, что и область значений случайной величины. В рамках данной работы будет рассмотрена вейвлет-оценка плотности распределения случайной величины, построенная с помощью вейвлета Морле. Установлено, что материнский вейвлет Морле является ненормированным, а значит, система базисных функций, построенная с его помощью, так же не обладает данным свойством. Поэтому при построении вейвлет-оценки плотности распределения случайной величины с его помощью требуется ввести нормировочный множитель, который позволит нивелировать данный недостаток материнского вейвлета. Полученное в работе значение нормировочного множителя позволяет улучшить качество восстановления функции плотности. Исследовано влияние на качество вейвлет-оценки объема выборки и числа коэффициентов разложения функции в ряд в выражении для оценки плотности распределения. Установлено, что качество вейвлет-оценки существенно зависит от параметра сглаживания и существует его наилучшее значение. Для количественной оценки степени близости функции плотности распределения и её вейвлет-оценки была проведена проверка согласия по критерию хи квадрат, которая показала, что выбор данного вейвлета в качестве базового обеспечивает качественное восстановление функции плотности.
вейвлет-оценка
вейвлет-анализ
вейвлет Морле
параметр сглаживания
функция плотности
оценка функции плотности
критерий хи квадрат
случайная величина
вычислительный эксперимент
1. Добеши И. Десять лекций по вейвлетам. Ижевск: НИЦ «Регулярная и хаотическая динамика», 2001. 464 с.
2. Чуи К. Введение в вейвлеты. М.: Мир, 2001.412 с.
3. Hari Krishan Malhotra, Lalit Kumar Vashisht On scaling functions of non-uniform multiresolution analysis in L2(R). International Journal of Wavelets, Multiresolution and Information Processing. 2020. Vol. 18. No. 02. 14 p.
4. Emmanuel de Dieu N., Guy Martial N. Wavelet-based estimation in a semiparametric regression model. International Journal of Wavelets, Multiresolution and Information Processing. 2021. 30 p.
5. Тимофеев В.С., Исаева Е.В. Об оценивании функции плотности распределения случайной величины с использованием вейвлетов // Научный вестник Новосибирского государственного технического университета. 2019. № 4 (77). С. 71–84.
6. Timofeev V.S., Isaeva E.V. Estimating the distribution density function using a DOG wavelet. Journal of Physics: Conference Series. 2020. Vol. 1661. 6 p.
7. Тимофеев В.С., Исаева Е.В., Малышкина Е.Д., Слободчикова А.Э. Оценивание функции плотности распределения с использованием вейвлета Литлвуда – Пэли // Обработка информации и математическое моделирование: материалы Российской научно-технической конференции. 2020. С. 165–170.
8. Витязев В.В. Вейвлет-анализ временных рядов. СПб.: СПбГУ, 2001. 58 с.
9. Малашкевич И.А. Вейвлет-анализ сигналов: от теории к практике: учебное пособие. Йошкар-Ола: ПГТУ, 2016. 276 с.
10. Шестаков О.В. Вероятностно-статистические методы анализа и обработки сигналов на основе вейвлет-алгоритмов. М.: Аргамак-Медиа, 2016. 200 с.
11. Ивченко Г.И., Медведев Ю.И. Математическая статистика. М.: КД Либроком, 2019. 352 c

Статистическая обработка данных зачастую связана с исследованием свойств случайных величин, характеризующих те или иные особенности изучаемого объекта. Важной характеристикой, которая несет в себе максимально возможный объем полезной информации об изучаемых случайных величинах, является функция плотности распределения. Следовательно, задача восстановления функции плотности по имеющимся статистическим данным является очень актуальной. Существуют различные методы для ее решения, в частности метод, основанный на вейвлет-анализе [1, 2], который на сегодняшний день динамично развивается и широко применяется для аппроксимации различных функций [3, 4]. Ранее такой подход был реализован с использованием вейвлетов Хаара, DOG, «Мексиканская шляпа» и Литлвуда – Пэли [5–7], а проведенные исследования подтвердили его эффективность. В данной работе исследуются вейвлет-оценки функции плотности распределения, построенные на основе вейвлета Морле.

Для этого рассмотрим выборку Isa001.wmf, заданную на произвольном отрезке [c, d] , где Isa002.wmf. Выборка состоит из независимых значений случайной величины ξ. Отметим, что информации о функции плотности распределения f(t) случайной величины ξ не имеется. Необходимо построить вейвлет-оценку f̂n(t) плотности распределения на основе имеющихся данных.

Вейвлет-оценки функции плотности распределения

Вейвлет-оценка функции плотности распределения Isa004.wmf случайной величины, согласно [1, 2] может быть представлена в виде следующего ряда:

Isa005.wmf, (1)

где ψi(t) – ортонормированные базисные функции, N – параметр сглаживания (количество членов ряда), Isa006.wmf – коэффициенты разложения, которые выражаются следующим соотношением:

Isa007.wmf. (2)

Если подставить (2) в выражение (1), то получим вейвлет-оценку функции плотности распределения в следующем виде

Isa008.wmf, (3)

где Isaeva3.pdf.

В роли базисных функций ψi(t) можно выбрать предложенную в [1, 2] систему функций, которая ортонормирована на отрезке [0, 1] и определяется следующим образом:

Isaeva3.pdf, (4)

где ψ(t) – материнский вейвлет, k ≥ 0, 1 ≤ j ≤ 2k и i = 2k + j. Отметим, что выражение (4) выполняется для всех i > 1, а в случае i = 1 полагают, что ψ1(t) = 1 для всех t ∈ [0, 1], иначе ψ1(t) = 0.

Так как выбранная система базисных функций ψi(t) определена на отрезке [0, 1], необходимо выполнить переход к ортонормированной системе функций ψ̃i(t) заданной на отрезке [c, d], который соответствует области определения случайной величины ξ.

Согласно [5–7] переход от одной системы базисных функций к другой выражается следующим соотношением

Isa013.wmf. (5)

Тогда вейвлет-оценка функции плотности распределения f̂n(t) на произвольном отрезке [c, d] определяется выражением (3), где в качестве базисных функций используются функции Isa015.wmf.

Согласно определению ортонормированной системы функций [1, 2] система базисных функций ψi(t) должна удовлетворять двум условиям:

1) Isa016.wmf,

для всех i ≠ j;

2) Isaeva3.pdf.

Следовательно, из соотношения (4) и свойств нормы материнского вейвлета [2] получаем

Isaeva4.tif

Isaeva4.tif(6)

где Isa020.wmf.

Таким образом, выполнение этих условий семейством ψi(t) зависит от выбора порождающего их материнского вейвлета ψ(t). Если материнский вейвлет ортонормированный, то и система функций ψi(t) также будет являться ортонормированной.

Перейдем к исследованию вейвлет-оценки функции плотности (3), где в качестве материнского вейвлета выбран вейвлет Морле [8–10].

Оценивание функции плотности распределения с помощью материнского вейвлета Морле

Аналитическая запись материнского вейвлета Морле [8–10] определяется соотношением

Isa021.wmf. (7)

Тогда система функций (4) на отрезке [0, 1] выражается следующим образом:

Isa022.wmf, (8)

где i, k, j такие же, как в (4). Известно, что материнский вейвлет Морле является ортогональным [2, 8–10]. Покажем, что вейвлет Морле не является нормированным, как следствие, система функций (8) тоже.

Утверждение 1. Пусть Isa023.wmf – материнский вейвлет Морле, порождающий систему функций Isa024.wmf, которая принимает вид

Isaeva4.tif,

где k ≥ 0, 1 ≤ j ≤ 2k и i = 2k + j. Тогда для любых i, k, j Isa026.wmf

Доказательство.

Аналитическая запись материнского вейвлета Морле выражается соотношением

Isa027.wmf.

Тогда по определению нормы в L2(R) получаем

Isa028.wmf

Isaeva4.tif.

Поскольку для любых k ≥ 0, 1 ≤ j ≤ 2k, где i = 2k + j выполняется равенство (6), то норма Isa030.wmf. Утверждение доказано.

Отсюда следует, что базис (4) на основе материнского вейвлета Морле не нормирован: Isa031.wmf. В соответсвии с [2, 8] такая система базисных функций может быть использована для построения (3), если ввести нормировочный множитель Isa032.wmf.

Тогда система функций (8) становится ортонормированной и принимает вид

Isa033.wmf, (9)

где i, k, j аналогичны (4), Isa034.wmf.

С учетом (9) переход от отрезка [0, 1] к отрезку [c, d], который соответствует области определения наблюдаемой случайной величины, дает результат

Isa035.wmf, (10)

где i, k, j аналогичны (4), Isa036.wmf.

Тогда выражение (3), где в качестве базисных функций используются функции (10), является вейвлет-оценкой функции плотности распределения f̂n(t) на произвольной области определения [c, d] на основе материнского вейвлета Морле.

Исследование точности вейвлет-оценки на основе вейвлета Морле

С помощью серии вычислительных экспериментов была исследована точность вейвлет-оценки на основе материнского вейвлета Морле. Для этого были смоделированы выборки из независимых значений случайной величины ξ объемом n = 300; 500; 1000. Распределение случайной величины ξ соответствует стандартному нормальному закону. Для данных выборок было выполнено оценивание функции плотности распределения с помощью вейвлета Морле при изменении числа членов ряда N от 4 до 40. На рис. 1 представлены результаты оценивания функции плотности для выборки объемом n = 1000 при N = 5; 15; 25. Качество оценивания f(t) напрямую зависит от параметра сглаживания. Если количество членов ряда оказывается недостаточным, то вейвлет-оценка не соответствует исходной функции плотности распределения из-за существенного отклонения. Если количество членов ряда велико, то оценка функции f̂n(t) имеет дополнительные максимумы и минимумы, что никак не соответствует модельной плотности распределения. Как в первом, так и во втором случае восстановленная функция плотности достаточно сильно отличается от истинной. Таким образом, в ходе вычислительных экспериментов было получено наилучшее значение параметра сглаживания для вейвлета Морле N = 5. Результаты моделирования для выборок с меньшими объемами n = 300; 500 подтвердили приведенные выше выводы.

Найденное выше значение параметра сглаживания N = 5 было использовано для исследования точности восстановления функции плотности от объема выборки n. Для этого были построены вейвлет-оценки (3) на основе материнского вейвлета Морле для рассматриваемых ранее выборок объема n = 300; 500; 1000. На рис. 2 представлены полученные результаты.

Isaeva1.pdf

Рис. 1. Результаты оценивания функции плотности с помощью вейвлета Морле

Isaeva2.pdf

Рис. 2. Результаты оценивания функции плотности с помощью вейвлета Морле

Значение статистики χ2

n

T

Isa043.wmf

χ2

α ≤ 0,05

α ≤ 0,01

300

8

14,067

18,475

10.589

500

10

19,919

21,666

11.413

1000

11

18,307

23,209

11.884

Эти вычислительные эксперименты подтвердили предположение о том, что объем данной выборки влияет на точность восстановления функции плотности. Из рис. 2 видно, что выборки с наименьшим объемом имеют наибольшую величину отклонения истинной функции плотности распределения от её оценки.

Отметим, что подобные исследования вейвлет-оценок на основе вейвлет Морле проводились для выборок, состоящих из случайных величин, имеющих другие законы распределения, в частности рассматривалось гамма распределение и экспоненциальное с параметром λ = 2. Результаты моделирования также показали, что с увеличением объема выборки точность вейвлет-оценки повышается.

Поверка степени близости между истиной функцией плотности распределения и ее оценкой для 1000 выборок объема n = 300; 500; 1000 состоящих из множества независимых значений случайной величины ξ, была проведена по критерию χ2 [11]:

Isa039.wmf, (11)

где T – число интервалов, полученное с помощью формулы Стерджеса [11], ti – середина i-го интервала. В таблице приведены критические значения критерия Isa043.wmf при числе степеней свободы v = T – 1 для α ≤ 0,05 и α ≤ 0,01. Также в таблице представлены результаты, из которых видно, что значения величины χ2 намного меньше Isa043.wmf, что подтверждает близость вейвлет-оценки Isa042.wmf и теоретической функции плотности f(t).

Аналогичным образом была выполнена оценка степени близости Isa050.wmf и f(t) для случайных величин, имеющих другие законы распределения, а именно гамма распределение и экспоненциальное с параметром λ = 2. Результаты моделирования подтвердили работоспособность данного метода оценивания.

Заключение

В работе была рассмотрена оценка функции плотности распределения случайной величины на основе вейвлета Морле. Сформулировано и доказано утверждение о том, что данный материнский вейвлет является ненормированным, следовательно, и система базисных функций, построенная с его помощью. Получено значение нормировочного множителя, которое позволяет улучшить качество восстановления функции плотности. Установлено, что качество оценки функции плотности существенно зависит от параметра сглаживания и в ходе вычислительных экспериментов получено его наилучшее значение. Показано, что объем выборки оказывает влияние на качество восстановления функции плотности распределения. В частности, в случае малого объёма выборки наблюдается большее отклонение вейвлет-оценки плотности распределения от теоретической функции плотности. Поверка по критерию хи квадрат количественной степени близости между истиной функцией плотности распределения и ее оценкой показала, что выбор вейвлета Морле в роли базового обеспечивает качественное восстановление функции плотности.


Библиографическая ссылка

Исаева Е.В. ОЦЕНИВАНИЕ ФУНКЦИИ ПЛОТНОСТИ РАСПРЕДЕЛЕНИЯ С ИСПОЛЬЗОВАНИЕМ ВЕЙВЛЕТА МОРЛЕ // Международный журнал прикладных и фундаментальных исследований. – 2022. – № 2. – С. 22-27;
URL: https://applied-research.ru/ru/article/view?id=13353 (дата обращения: 21.11.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674