В [2] отмечалось, что интервальная выборочная оценка предпочтительнее точечной для описания частоты встречаемости изучаемой характеристики в генеральной совокупности. Но поскольку на практике исследования проводятся с использованием выборочных данных, проекция результатов на генеральную совокупность должна содержать определенный элемент неточности выборочной оценки. Доверительный интервал (ДИ) представляет собой меру точности оцениваемого параметра. Результаты исследований должны указываться вместе с их доверительным интервалом. В биомедицинских исследованиях чаще всего используются 95 доверительные интервалы. Данный доверительный интервал представляет собой область, в которую попадает истинное значение доли в 95 случаях. Другими словами, можно с 95 % надежностью сказать, что истинное значение частоты встречаемости признака в генеральной совокупности будет находиться в пределах 95 доверительного интервала.
В ряде пособий по статистике сообщается [1, 4, 7], что ошибку частоты можно рассчитывать с помощью формулы
,
где p – относительная частота встречаемости признака в выборке, N – количество наблюдений в выборке. Вследствие этого ДИ доли, например, доли умерших при резекции желудка, когда умирает 3 из 4 больных отличается от ДИ для случая, например, когда от данной операции умирает 30 из 40 пациентов. Ряд авторов считают целесообразнее представлять 95 доверительный интервал для частоты встречаемости признака в виде интервала от
до
.
Также в [4] рекомендуется при малых выборках заменять значение 1,96 на значение t для N–1 степеней свободы. Значение t находится по таблицам для t-распределения, имеющимся во многих пособиях по статистике. Именно этот способ подсчета ДИ доли положен в основу работы, представленной в данном сообщении программы.
Кроме этого метода расчета доверительного интервала доли, существует целый ряд других методов, достаточно широко описанных в специальной литературе. Каждый из них имеет свои положительные и отрицательные стороны. Они достаточно подробно рассмотрены в специальном сообщении А.М. Гржибовского [2], а также в [5, 6, 8, 9, 10] и здесь не обсуждаются.
В качестве практического примера приведем результаты подсчета доверительного интервала доли некоторыми из этих методов (табл. 1, рис. 1). Рассмотрим частный случай N=100, M=90 (то есть p=M/N=0,9) и 95 % ДИ. Здесь M – абсолютная частота встречаемости исследуемого признака, N – общее число испытаний.
Доверительный интервал частоты (доли), рассчитанный различными методами
Метод |
Нижний предел ДИ |
Верхний предел ДИ |
Ширина ДИ |
Функция Excel |
Метод Клоппера-Пирсона |
82,38 % |
95,10 % |
12,7 % |
FРАСПОБР |
Нормальная аппроксимация (Вальда) |
84,12 % |
95,88 % |
11,8 % |
НОРМСТОБР |
Метод Вилсона |
82,56 % |
94,48 % |
11,9 % |
НОРМСТОБР |
Пуассона хи-квадрат |
72,37 % |
110,63 % |
38,3 % |
ХИ2ОБР |
Откорректированный метод Вальда |
82,39 % |
94,65 % |
12,3 % |
НОРМСТОБР |
Из таблицы и графика видно, что наиболее узкий доверительный интервал (11,8 %) дает метод нормальной аппроксимации (Вальда), а наиболее широкий (38,3 %) – метод расчета, использующий распределение хи-квадрат. Последний также дает результат для верхней границы интервала, больший, чем 100 %, что, конечно, абсурдно с точки зрения здравого смысла. В последнем столбце таблицы представлены функции Excel, которые используются при определении границ интервала (все рассмотренные методы могут быть реализованы с помощью стандартных функций в редакторе таблиц Microsoft Windows Excel). Отметим также, что в литературе нет единства в отношении названий приведенных методов.
Расчетная часть программы. Как уже отмечалось, в основу программы Proportion Confidence Interval положена простая формула для расчета границ доверительного интервала
,
где величина t протабулирована и вшита в память настоящей программы.
Алгоритм работы программы. После запуска программа предлагает к заполнению два поля для параметров N и M. Пользователь заполняет эти поля с помощью всплывающей миниклавиатуры (рис. 2). Далее производится счет программы и открывается окно, в котором выдаются результаты подсчета: частота (доля), нижняя и верхняя граница доверительного интервала доли и его ширина (рис. 3). Если границы ДИ в результате расчета принимают отрицательные значения или превышают 1, то программа производит корректировку, присваивая им значения 0 или 1, соответственно. Предусмотрено представление результатов расчета в процентах (рис. 4).
Программа выполнена на базе операционной системы Android и может быть реализована с помощью планшетного компьютера или смартфона, работающих под управлением данной системы. Ранее мы уже сообщали об использовании этих популярных вычислительных средств при решении других статистических задач в медицинских исследованиях [3].
Рис. 1. Доверительный интервал частоты (доли), рассчитанный различными методами
Рис. 2. Окно программы Proportion Confidence Interval для ввода данных.
Рис. 3. Окно программы Proportion Confidence Interval с результатами расчета
Рис. 4. Окно программы Proportion Confidence Interval с результатами расчета в процентах
Как следует из рис. 2 и 3, результаты расчета ДИ представленной программой наиболее близки к полученным в программе Excel методом нормальной аппроксимации (Вальда) результатам: 84,06 и 84,12 – нижняя граница ДИ, 95,94 и 95,88 % – верхняя граница ДИ (табл. 1), что позволяет рекомендовать предложенную программу для использования.