Существует много споров о роли статистики в эпидемиологических исследованиях причинно-следственных связей. В эпидемиологии статистика — это, прежде всего, совокупность методов оценки данных, основанных на данных о популяциях людей (а также животных). В частности, статистика представляет собой метод количественной оценки и измерения неопределенных явлений. Все научные исследования, имеющие дело с недетерминированными, изменчивыми аспектами реальности, могли бы выиграть от статистической методологии. В эпидемиологии изменчивость присуща единице наблюдения — человек не является детерминированной сущностью. В то время как планы экспериментов могут быть улучшены с точки зрения лучшего соответствия предположениям статистики с точки зрения случайных вариаций, по этическим и практическим причинам этот подход не слишком распространен. Вместо этого эпидемиология занимается обсервационными исследованиями, которые связывают с ней как случайные, так и другие источники изменчивости.
Статистическая теория занимается тем, как контролировать неструктурированную изменчивость данных, чтобы делать обоснованные выводы из эмпирических наблюдений. Не имея никакого объяснения изменчивости поведения изучаемого явления, статистика принимает его как случайный— то есть несистематические отклонения от некоторого среднего состояния природы (см. критику этих предположений в Greenland 1990).
Наука опирается на эмпирические доказательства чтобы продемонстрировать, имеют ли его теоретические модели природных явлений какую-либо обоснованность. Действительно, методы, используемые статистической теорией, определяют степень, в которой наблюдения в реальном мире соответствуют представлению ученых о явлении в форме математической модели. Поэтому статистические методы, основанные на математике, должны быть тщательно отобраны; примеров «как врать со статистикой» предостаточно. Таким образом, эпидемиологи должны быть осведомлены о целесообразности методов, которые они применяют для измерения риска заболевания. В частности, требуется большая осторожность при интерпретации как статистически значимых, так и статистически незначимых результатов.
Первое значение слова статистика относится к любой суммарной величине, вычисленной по набору значений. Описательные индексы или статистические данные, такие как среднее арифметическое, медиана или мода, широко используются для обобщения информации в серии наблюдений. Исторически сложилось так, что эти сводные дескрипторы использовались в административных целях государствами, и поэтому они были названы статистика. В эпидемиологии статистические данные, которые обычно наблюдаются, вытекают из сравнений, присущих природе эпидемиологии, которая задает такие вопросы, как: «Подвержена ли одна группа населения большему риску заболевания, чем другая?» При проведении таких сравнений относительный риск является популярной мерой силы связи между индивидуальной характеристикой и вероятностью заболевания и чаще всего применяется в этиологических исследованиях; Атрибутивный риск также является мерой связи между индивидуальными характеристиками и возникновением заболевания, но он подчеркивает выигрыш в количестве случаев, спасенных благодаря вмешательству, которое устраняет рассматриваемый фактор - это в основном применяется в общественном здравоохранении и профилактической медицине.
Второе значение слова статистика относится к набору методов и лежащей в основе теории статистического вывода. Это особая форма индуктивной логики, которая определяет правила получения достоверного обобщения из определенного набора эмпирических наблюдений. Это обобщение будет верным при соблюдении некоторых допущений. Это второй способ, которым неграмотное использование статистики может ввести нас в заблуждение: в наблюдательной эпидемиологии очень трудно быть уверенным в предположениях, вытекающих из статистических методов. Следовательно, анализ чувствительности и робастные оценки должны сопровождать любой правильно проведенный анализ данных. Окончательные выводы также должны основываться на общих знаниях, и они не должны полагаться исключительно на результаты статистической проверки гипотез.
Определения
A статистическая единица элемент, над которым производятся эмпирические наблюдения. Это может быть человек, биологический образец или кусок сырья для анализа. Обычно статистические единицы выбираются исследователем самостоятельно, но иногда могут быть созданы более сложные планы. Например, в лонгитюдных исследованиях проводится ряд определений по совокупности лиц в течение определенного времени; статистические единицы в этом исследовании представляют собой набор определений, которые не являются независимыми, но структурированы их соответствующими связями с каждым изучаемым человеком. Отсутствие независимости или корреляции между статистическими единицами заслуживает особого внимания в статистическом анализе.
A переменная - индивидуальная характеристика, измеряемая на данной статистической единице. Ему следует противопоставить постоянная, фиксированная индивидуальная характеристика - например, в исследовании людей наличие головы или грудной клетки является константой, в то время как пол отдельного участника исследования является переменной.
Переменные оцениваются с использованием различных шкалы измерения. Первое различие проводится между качественными и количественными шкалами. Качественные переменные обеспечивают различные модальности or категории. Если каждую модальность нельзя ранжировать или упорядочить по отношению к другим — например, цвету волос или гендерным модальностям, — мы обозначаем переменную как номинальный. Если категории могут быть упорядочены — например, степень тяжести болезни — переменная называется порядковый. Когда переменная состоит из числового значения, мы говорим, что шкала является количественной. А дискретный масштаб означает, что переменная может принимать только некоторые определенные значения, например целые значения числа случаев заболевания. А (CIJ) шкала используется для тех мер, которые приводят к реальные числа. Говорят, что непрерывные шкалы интервал масштабируется, когда нулевое значение имеет чисто условное значение. То есть нулевое значение не означает нулевую величину — например, температура ноль градусов Цельсия не означает нулевую тепловую энергию. В этом случае имеют смысл только различия между значениями (это причина термина «интервальная» шкала). Действительное нулевое значение обозначает соотношение шкала. Для переменной, измеряемой по этой шкале, отношения значений также имеют смысл: действительно, двойное отношение означает удвоение количества. Например, сказать, что тело имеет температуру в два раза больше, чем второе тело, означает, что оно имеет в два раза больше тепловой энергии, чем второе тело, при условии, что температура измеряется по шкале отношений (например, в градусах Кельвина). Набор допустимых значений для данной переменной называется доменом переменной.
Статистические парадигмы
Статистика имеет дело со способом обобщения набора частных наблюдений. Этот набор эмпирических измерений называется образец. По выборке мы рассчитываем некоторую описательную статистику, чтобы обобщить собранную информацию.
Основная информация, которая обычно требуется для характеристики набора показателей, касается его центральной тенденции и его изменчивости. Выбор между несколькими альтернативами зависит от масштаба, используемого для измерения явления, и от целей, для которых рассчитывается статистика. В таблице 1 описаны различные меры центральной тенденции и изменчивости (или дисперсии), связанные с соответствующей шкалой измерения.
Таблица 1. Индексы центральной тенденции и дисперсии по шкале измерения
Шкала измерения |
||||
Качественный |
Количественный |
|||
Индексы |
Определение |
номинальный |
порядковый |
Интервал/соотношение |
Среднее арифметическое |
Сумма наблюдаемых значений, деленная на общее количество наблюдений |
|
|
x |
медиана |
Среднее значение наблюдаемого распределения |
|
x |
x |
режим |
Наиболее частое значение |
x |
x |
x |
Диапазон |
Самые низкие и самые высокие значения распределения |
|
x |
x |
дисперсия |
Сумма квадрата разницы каждого значения от среднего, деленная на общее количество наблюдений минус 1 |
|
|
x |
Рассчитываемая описательная статистика называется Оценки когда мы используем их в качестве заменителя аналогичного количества населения, из которого была отобрана выборка. Население, эквивалентное оценкам, представляет собой константы, называемые параметры. Оценки одного и того же параметра могут быть получены разными статистическими методами. Оценка должна быть достоверной и точной.
Парадигма популяционной выборки подразумевает, что валидность может быть обеспечена путем выбора выборки из популяции. Случайная или вероятностная выборка является обычной стратегией: если каждый член совокупности имеет одинаковую вероятность быть включенным в выборку, то в среднем наша выборка должна быть репрезентативной для совокупности, и, кроме того, любое отклонение от нашего ожидания может быть объясняется случайностью. Вероятность данного отклонения от нашего ожидания также может быть вычислена при условии, что была выполнена случайная выборка. Такого же рода рассуждения применимы и к оценкам, рассчитанным для нашей выборки в отношении параметров генеральной совокупности. Возьмем, например, среднее арифметическое из нашей выборки в качестве оценки среднего значения для генеральной совокупности. Любая разница, если она существует, между средним значением выборки и средним значением генеральной совокупности объясняется случайными колебаниями в процессе отбора членов, включенных в выборку. Мы можем вычислить вероятность любого значения этой разницы при условии, что выборка была выбрана случайным образом. Если отклонение между выборочной оценкой и параметром генеральной совокупности не может быть объяснено случайностью, говорят, что оценка пристрастный. План наблюдения или эксперимента обеспечивает достоверность оценок, а фундаментальной статистической парадигмой является случайная выборка.
В медицине применяется вторая парадигма, когда целью исследования является сравнение различных групп. Типичным примером является контролируемое клиническое исследование: набор пациентов со схожими характеристиками отбирается на основе заранее определенных критериев. На данном этапе не заботятся о репрезентативности. Каждый пациент, включенный в исследование, случайным образом распределяется в группу лечения, которая будет получать стандартную терапию плюс новый исследуемый препарат, или в контрольную группу, получающую стандартную терапию и плацебо. В этом плане случайное распределение пациентов по группам заменяет случайный выбор членов выборки. Оценка разницы между двумя группами может быть оценена статистически, поскольку при гипотезе об отсутствии эффективности нового препарата мы можем вычислить вероятность любой ненулевой разницы.
В эпидемиологии у нас нет возможности собрать случайно подвергшиеся и не подвергшиеся воздействию группы людей. В этом случае мы все еще можем использовать статистические методы, как если бы анализируемые группы были выбраны или распределены случайным образом. Правильность этого предположения в основном зависит от дизайна исследования. Этот момент особенно важен и подчеркивает важность дизайна эпидемиологического исследования по сравнению со статистическими методами в биомедицинских исследованиях.
Сигнал и шум
Термин случайная переменная относится к переменной, для которой определенная вероятность связана с каждым значением, которое она может принять. Теоретические модели распределения вероятности случайной величины являются популяционными моделями. Аналоги выборки представлены распределением частоты выборки. Это удобный способ сообщить набор данных; он состоит из декартовой плоскости с интересующей переменной по горизонтальной оси и частотой или относительной частотой по вертикальной оси. Графический дисплей позволяет нам легко увидеть, какие значения являются наиболее частыми и как распределение сосредоточено вокруг определенных центральных значений, таких как среднее арифметическое.
Для случайных величин и их вероятностных распределений мы используем термины параметры, среднее ожидаемое значение (вместо среднего арифметического) и дисперсия. Эти теоретические модели описывают изменчивость данного явления. В теории информации сигнал представлен центральной тенденцией (например, средним значением), а шум измеряется индексом дисперсии (например, дисперсией).
Чтобы проиллюстрировать статистический вывод, мы будем использовать биномиальную модель. В следующих разделах будут введены понятия точечных оценок и доверительных интервалов, проверок гипотез и вероятности ошибочных решений, а также мощности исследования.
Таблица 2. Возможные исходы биномиального эксперимента (да = 1, нет = 0) и их вероятности (n = 3)
работник |
Вероятность |
||
A |
B |
C |
|
0 |
0 |
0 |
|
1 |
0 |
0 |
|
0 |
1 |
0 |
|
0 |
0 |
1 |
|
0 |
1 |
1 |
|
1 |
0 |
1 |
|
1 |
1 |
0 |
|
1 |
1 |
1 |
|
Пример: биномиальное распределение
В биомедицинских исследованиях и эпидемиологии наиболее важной моделью стохастической изменчивости является биномиальное распределение. Он основан на том факте, что большинство явлений ведут себя как номинальные переменные только с двумя категориями: например, наличие/отсутствие болезни: жив/мертв или выздоровел/больен. В таких обстоятельствах нас интересует вероятность успеха, то есть интересующее нас событие (например, наличие болезни, выживание или выздоровление) и факторы или переменные, которые могут ее изменить. Давайте рассмотрим n = 3 рабочих, и предположим, что нас интересует вероятность p нарушения зрения (да/нет). Результатом нашего наблюдения могут быть возможные результаты в таблице 2.
Таблица 3. Возможные исходы биномиального эксперимента (да = 1, нет = 0) и их вероятности (n = 3)
Количество успехов |
Вероятность |
0 |
|
1 |
|
2 |
|
3 |
|
Вероятность любой из этих комбинаций событий легко получить, рассматривая p, (индивидуальную) вероятность успеха, постоянную для каждого субъекта и независимую от других результатов. Поскольку нас интересует общее количество успехов, а не конкретная упорядоченная последовательность, мы можем перестроить таблицу следующим образом (см. таблицу 3) и в общем случае выразить вероятность x успехов Р (х)
в котором x это количество успехов и обозначение x! обозначает факториал xт.е. x! = x× (x–1)×(x–2)…×1.
Когда мы рассматриваем событие «быть/не быть больным», индивидуальная вероятность, относится к состоянию, в котором предположительно находится субъект; в эпидемиологии эта вероятность называется «распространенность». Для оценки p мы используем выборочную пропорцию:
p = x/n
с дисперсией:
В гипотетической бесконечной серии повторяющихся образцов одинакового размера n, мы получим другие пропорции выборки p = x/n, с вероятностями, заданными биномиальной формулой. «Истинное» значение оценивается по каждой пропорции выборки, а доверительный интервал для p, то есть набор вероятных значений для p, с учетом наблюдаемых данных и заранее определенного уровня достоверности (скажем, 95%), оценивается из биномиального распределения как набор значений для p, который дает вероятность x больше заранее заданного значения (скажем, 2.5%). Для гипотетического эксперимента, в котором мы наблюдали x = 15 успехов в n = 30 попыток, предполагаемая вероятность успеха:
Таблица 4. Биномиальное распределение. Вероятности для различных значений для x = 15 успехов в n = 30 испытаниях
|
Вероятность |
0.200 |
0.0002 |
0.300 |
0.0116 |
0.334 |
0.025 |
0.400 |
0.078 |
0.500 |
0.144 |
0.600 |
0.078 |
0.666 |
0.025 |
0.700 |
0.0116 |
95% доверительный интервал для p, полученный из таблицы 4, составляет 0.334 – 0.666. Каждая запись в таблице показывает вероятность x = 15 успехов в n = 30 испытаний, рассчитанных по биномиальной формуле; например, для = 0.30, получаем из:
Что касается n большой и p близко к 0.5, мы можем использовать приближение, основанное на распределении Гаусса:
в котором za /2 обозначает значение стандартного распределения Гаусса для вероятности
P (|z| ³ za /2) = a/2;
1 – а – выбранный уровень достоверности. Для рассматриваемого примера = 15/30 = 0.5; n = 30 и из стандартной таблицы Гаусса z0.025 = 1.96. Доверительный интервал 95% дает набор значений 0.321–0.679, полученных путем замены p = 0.5, n = 30 и z0.025 = 1.96 в приведенное выше уравнение для распределения Гаусса. Обратите внимание, что эти значения близки к точным значениям, вычисленным ранее.
Статистические проверки гипотез включают в себя процедуру принятия решения о значении параметра совокупности. Предположим, что в предыдущем примере мы хотим рассмотреть предположение о повышенном риске нарушения зрения среди рабочих данного завода. Научная гипотеза, которую необходимо проверить нашими эмпирическими наблюдениями, заключается в том, что «существует повышенный риск нарушения зрения среди рабочих данного завода». Статистики демонстрируют такие гипотезы, фальсифицируя дополнительную гипотезу «отсутствует повышение риска нарушения зрения». Это следует за математической демонстрацией за абсурд и вместо проверки утверждения эмпирические данные используются только для его фальсификации. Статистическая гипотеза называется нулевая гипотеза. Второй шаг включает указание значения параметра этого распределения вероятностей, используемого для моделирования изменчивости наблюдений. В наших примерах, поскольку явление бинарное (т. е. наличие/отсутствие нарушения зрения), мы выбираем биномиальное распределение с параметром p, вероятностью нарушения зрения. Нулевая гипотеза утверждает, что = 0.25, скажем. Это значение выбирается из набора знаний по теме и априорных знаний об обычной распространенности нарушений зрения среди населения, не подвергающегося воздействию (т. е. неработающих). Предположим, что наши данные дали оценку
= 0.50, из 30 обследованных рабочих.
Можем ли мы отвергнуть нулевую гипотезу?
Если да, то в пользу чего альтернатива гипотеза?
Мы указываем альтернативную гипотезу в качестве кандидата, если данные диктуют отклонение нулевой гипотезы. Ненаправленные (двусторонние) альтернативные гипотезы утверждают, что параметр совокупности отличается от значения, указанного в нулевой гипотезе; направленные (односторонние) альтернативные гипотезы утверждают, что параметр совокупности больше (или меньше) нулевого значения.
Таблица 5. Биномиальное распределение. Вероятность успеха для = 0.25 в n = 30 испытаниях
X |
Вероятность |
Кумулятивная вероятность |
0 |
0.0002 |
0.0002 |
1 |
0.0018 |
0.0020 |
2 |
0.0086 |
0.0106 |
3 |
0.0269 |
0.0374 |
4 |
0.0604 |
0.0979 |
5 |
0.1047 |
0.2026 |
6 |
0.1455 |
0.3481 |
7 |
0.1662 |
0.5143 |
8 |
0.1593 |
0.6736 |
9 |
0.1298 |
0.8034 |
10 |
0.0909 |
0.8943 |
11 |
0.0551 |
0.9493 |
12 |
0.0291 |
0.9784 |
13 |
0.0134 |
0.9918 |
14 |
0.0054 |
0.9973 |
15 |
0.0019 |
0.9992 |
16 |
0.0006 |
0.9998 |
17 |
0.0002 |
1.0000 |
. |
. |
. |
30 |
0.0000 |
1.0000 |
При нулевой гипотезе мы можем рассчитать распределение вероятностей результатов нашего примера. Таблица 5 показывает, для = 0.25 и n = 30, вероятности (см. уравнение (1)) и кумулятивные вероятности:
Из этой таблицы получаем вероятность того, что x ³15 работников с нарушением зрения
P(x ³15) = 1 - П(Икс15) = 1- 0.9992= 0.0008
Это означает, что крайне маловероятно, что мы наблюдали бы 15 или более рабочих с нарушениями зрения, если бы они столкнулись с преобладанием болезни среди населения, не подвергавшегося воздействию. Таким образом, мы можем отклонить нулевую гипотезу и подтвердить, что в исследуемой популяции рабочих наблюдается более высокая распространенность нарушений зрения.
После появления n×p ³ 5 и n×(1-) ³ 5, мы можем использовать приближение Гаусса:
Из таблицы стандартного распределения Гаусса получаем:
P(|г|>2.95) = 0.0008
в близком соответствии с точными результатами. Из этого приближения мы можем видеть, что базовая структура статистической проверки гипотезы состоит из отношения сигнала к шуму. В нашем случае сигнал равен (p–), наблюдаемое отклонение от нулевой гипотезы, а шум — стандартное отклонение P:
Чем больше отношение, тем меньше вероятность нулевого значения.
Принимая решения о статистических гипотезах, мы можем допустить два вида ошибок: ошибка первого рода, отклонение нулевой гипотезы, когда она верна; или ошибка второго рода, принятие нулевой гипотезы, когда она ложна. Уровень вероятности или р-значение, — вероятность ошибки I рода, обозначаемая греческой буквой а. Это вычисляется из распределения вероятностей наблюдений при нулевой гипотезе. Принято заранее задавать уровень а-ошибки (например, 5%, 1%) и отвергать нулевую гипотезу, когда результат нашего наблюдения имеет вероятность, равную или меньшую, чем этот так называемый критический уровень.
Вероятность ошибки II рода обозначается греческой буквой β. Для его расчета необходимо указать в альтернативной гипотезе значение α проверяемого параметра (в нашем примере значение α для ). Общие альтернативные гипотезы (отличные от, больше, меньше) бесполезны. На практике интерес представляет значение β для набора альтернативных гипотез или его дополнение, которое называется статистической мощностью теста. Например, зафиксировав значение α-ошибки на уровне 5%, из таблицы 5 находим:
P(x ³12) <0.05
при нулевой гипотезе = 0.25. Если бы мы наблюдали хотя бы x = 12 успехов, мы отвергаем нулевую гипотезу. Соответствующие значения β и мощность для x = 12 приведены по таблице 6.
Таблица 6. Ошибка и мощность II рода для x = 12, n = 30, α = 0.05
|
β |
Запитан |
0.30 |
0.9155 |
0.0845 |
0.35 |
0.7802 |
0.2198 |
0.40 |
0.5785 |
0.4215 |
0.45 |
0.3592 |
0.6408 |
0.50 |
0.1808 |
0.8192 |
0.55 |
0.0714 |
0.9286 |
В этом случае наши данные не могут отличить больше нулевого значения 0.25, но меньше 0.50, потому что мощность исследования слишком мала (<80%) для этих значений
<0.50, то есть чувствительность нашего исследования составляет 8% для
= 0.3, 22% для
= 0.35,…, 64% для
= 0.45.
Единственный способ добиться более низкого β или более высокого уровня мощности — это увеличить размер исследования. Например, в таблице 7 мы сообщаем β и мощность для n = 40; как и ожидалось, мы должны быть в состоянии обнаружить значение больше 0.40.
Таблица 7. Ошибка и мощность II рода для x = 12, n = 40, α = 0.05
|
β |
Запитан |
0.30 |
0.5772 |
0.4228 |
0.35 |
0.3143 |
0.6857 |
0.40 |
0.1285 |
0.8715 |
0.45 |
0.0386 |
0.8614 |
0.50 |
0.0083 |
0.9917 |
0.55 |
0.0012 |
0.9988 |
Дизайн исследования основан на тщательном изучении набора альтернативных гипотез, которые заслуживают рассмотрения и гарантируют эффективность исследования, обеспечивающего достаточный размер выборки.
В эпидемиологической литературе подчеркивается актуальность предоставления надежных оценок риска. Поэтому более важно указать доверительные интервалы (либо 95 %, либо 90 %). p-ценность проверки гипотезы. Следуя такому же рассуждению, следует уделить внимание интерпретации результатов небольших исследований: из-за малой мощности даже промежуточные эффекты могут быть не обнаружены, и, с другой стороны, эффекты большой величины могут не воспроизводиться впоследствии.
Продвинутые методы
Степень сложности статистических методов, используемых в контексте медицины труда, за последние несколько лет возросла. Основные разработки можно найти в области статистического моделирования. Семейство негауссовых моделей Нелдера и Веддерберна (обобщенные линейные модели) внесло один из наиболее ярких вкладов в расширение знаний в таких областях, как профессиональная эпидемиология, где соответствующие переменные реакции являются бинарными (например, выживание/смерть) или подсчеты (например, количество несчастных случаев на производстве).
Это стало отправной точкой для широкого применения регрессионных моделей в качестве альтернативы более традиционным типам анализа, основанным на таблицах непредвиденных обстоятельств (простой и стратифицированный анализ). Пуассона, Кокса и логистическую регрессию теперь обычно используют для анализа лонгитюдных исследований и исследований случай-контроль соответственно. Эти модели являются аналогом линейной регрессии для категориальных переменных ответа и обладают элегантной особенностью, заключающейся в непосредственном обеспечении соответствующей эпидемиологической меры ассоциации. Например, коэффициенты регрессии Пуассона представляют собой логарифм отношений скоростей, а коэффициенты логистической регрессии представляют собой логарифм отношений шансов.
Взяв это за точку отсчета, дальнейшие разработки в области статистического моделирования пошли по двум основным направлениям: модели для повторяющихся категориальных измерений и модели, расширяющие обобщенные линейные модели (обобщенные аддитивные модели). В обоих случаях цели сосредоточены на повышении гибкости статистических инструментов для решения более сложных проблем, возникающих в реальности. Модели повторных измерений необходимы во многих профессиональных исследованиях, где единицы анализа находятся на субиндивидуальном уровне. Например:
- Изучение влияния условий труда на синдром запястного канала должно учитывать обе руки человека, которые не являются независимыми друг от друга.
- Анализ динамики загрязнителей окружающей среды и их влияния на дыхательную систему детей можно оценить с помощью чрезвычайно гибких моделей, поскольку трудно получить точную функциональную форму зависимости доза-реакция.
Параллельное и, вероятно, более быстрое развитие наблюдается в контексте байесовской статистики. Практический барьер использования байесовских методов рухнул после введения компьютерных методов. Процедуры Монте-Карло, такие как схемы выборки Гиббса, позволили нам избежать необходимости численного интегрирования для вычисления апостериорных распределений, что представляло собой наиболее сложную особенность байесовских методов. Число приложений байесовских моделей в реальных и сложных задачах находит все больше места в прикладных журналах. Например, географический анализ и экологические корреляции на уровне небольших территорий, а также модели прогнозирования СПИДа все чаще решаются с использованием байесовских подходов. Эти разработки приветствуются, поскольку они представляют собой не только увеличение числа альтернативных статистических решений, которые можно использовать при анализе эпидемиологических данных, но и потому, что байесовский подход можно считать более надежной стратегией.