Смотреть страницы где упоминается термин логарифмически-нормальное распределение. Смотреть страницы где упоминается термин логарифмически-нормальное распределение Связь с другими распределениями

Логарифмически нормальная функция распределения нашла широкое применение при анализе надежности объектов техники, биологии, экономики и др. Например, функцию успешно применяют для описания наработки до отказа подшипников, электронных приборов и других изделий.

Неотрицательные случайные значения некоторого параметра распределены логарифмически нормально, если его логарифм распределен нормально. Плотность распределения для различных значений σ приведена на рис. 4.3.

Рис. 4.3.

Плотность распределения описывается зависимостью

где М х и σ – параметры, оцениваемые по результатам п испытаний до отказа:

(4.4)

Для логарифмически нормального закона распределения функция надежности

(4.5)

Вероятность безотказной работы можно определить по таблицам для нормального распределения (см. табл. П6.1 приложения 6) в зависимости от значения квантиля

Математическое ожидание наработки до отказа

Среднее квадратическое отклонение и коэффициент вариации соответственно будут равны

Если v x 0,3, то полагают, что ν x = σ, при этом ошибка составляет не более 1%.

Часто применяют запись зависимостей для логарифмически нормального закона распределения в десятичных логарифмах. В соответствии с этим законом плотность распределения

Оценки параметров lg x 0 и σ определяют по результатам испытаний:

Математическое ожидание М х, среднее квадратическое отклонение σ x и коэффициент вариации ν x наработки до отказа соответственно равны

Пример 4.6

Определить вероятность безотказной работы редуктора в течение t = 103 ч, если ресурс распределен логарифмически нормально с параметрами lg t 0 = 3,6; σ = 0,3.

Решение

Найдем значение квантиля и определим вероятность безотказной работы:

Ответ: R (t ) = 0,0228.

Распределение Вейбулла

Функция распределения Вейбулла представляет собой двухпараметрическое распределение. Описываемый ею закон является универсальным, так как при соответствующих значениях параметров превращается в нормальное, экспоненциальное и другие виды распределений. Автор данного закона распределения В. Вейбулл использовал его при описании и анализе экспериментально наблюдавшихся разбросов усталостной прочности стали, пределов ее упругости. Закон Вейбулла удовлетворительно описывает наработку до отказа подшипников, элементов электронной аппаратуры, его используют для оценки надежности деталей и узлов машин, в том числе автомобилей, а также для оценки надежности машин в процессе их приработки. Плотность распределения описывается зависимостью

где α – параметр формы кривой распределения; λ – параметр масштаба кривой распределения.

График функции плотности распределения приведен на рис. 4.4.

Рис. 4.4.

Функция распределения Вейбулла

Функция надежности для этого закона распределения

Математическое ожидание случайной величины х равно

где Г(x ) – гамма-функция.

Для непрерывных значений х

Для целочисленных значений х гамма-функцию вычисляют по формуле

также верны формулы

Дисперсия случайной величины равна

Широкое применение при анализе и расчетах надежности изделий закона распределения Вейбулла объясняется тем, что этот закон, обобщая экспоненциальное распределение, содержит дополнительный параметр α.

Подбирая нужным образом параметры а и λ, можно получить лучшее соответствие расчетных значений опытным данным по сравнению с экспоненциальным законом, который является однопараметрическим (параметр λ).

Так, для изделий, у которых имеются скрытые дефекты, но которые длительное время не используются (а значит, медленнее стареют), опасность отказа имеет наибольшее значение в начальный период, а потом быстро падает. Функция надежности для такого изделия хорошо описывается законом Вейбулла с параметром α < 1.

Наоборот, если изделие хорошо контролируется при изготовлении и почти не имеет скрытых дефектов, но подвергается быстрому старению, то функция надежности описывается законом Вейбулла с параметром α > 1. При α = 3,3 распределение Вейбулла близко к нормальному.

Случайная величина называется логарифмически-нормально распределенной, если ее логарифм подчинен нормальному закону распределения.

Это означает, в частности, что значения логарифмически-нормальной случайной величины формируются под воздействием очень большого числа взаимно независимых факторов, причем воздействие каждого отдельного фактора «равномерно незначительно» и равновероятно по знаку. При этом в отличие от схемы формирования механизма нормального закона последовательный характер воздействия случайных факторов таков, что случайный прирост, вызываемый действием каждого следующего фактора, пропорционален уже достигнутому к этому моменту значению исследуемой величины (в этом случае говорят о мультипликативном характере воздействия фактора). Математически сказанное может быть формализовано следующим образом. Если - неслучайная компонента исследуемого признака (т. е. как бы «истинное» значение в идеализированной схеме, когда устранено влияние всех случайных факторов), - численное выражение эффектов воздействия упомянутых выше случайных факторов, то последовательно трансформированные действием этих факторов значения исследуемого признака будут:

Отсюда легко получить

где . Но правая часть (6.11) есть результат аддитивного действия множества случайных факторов, что при сделанных выше предположениях должно приводить, как мы знаем (см. п. 6.1.5, а также § 7.3, посвященный центральной предельной теореме), к нормальному распределению этой суммы.

В то же время, учитывая достаточную многочисленность числа случайных слагаемых (т. е. полагая ) и относительную незначительность воздействия каждого из них (т. е. полагая ), можно от суммы в левой части (6.11) перейти к интегралу

Это. и означает в конечном счете, что логарифм интересующей нас величины (уменьшенный на постоянную величину подчиняется нормальному закону с нулевым средним значением, т. е.

откуда дифференцированием по x левой и правой частей этого соотношения получаем

(правомерность использованного при вычислении тождества вытекает из строгой монотонности преобразования

Описанная схема формирования значений логарифмически-нормальной случайной величины оказывается характерной для многих конкретных физических и социально-экономических ситуаций (размеры и вес частиц, образующихся при дроблении; заработная плата работника; доход семьи; размеры космических образований; долговечность изделия, работающего в режиме износа и старения и др.; см., например, , , ).

Пример 6.1. В качестве случайной величины рассматривается душевой месячный доход (в долларах) семьи некоторой совокупности семей. Обследовано n=750 семей.

Таблица 6.1

Таблица 6.2

В табл. 6.1 и 6.2 приведены результаты группировки выборочных данных и их логарифмов соответственно (ширина интервала группирования равна 25 долларам). На рис. 6.1, а, б изображены гистограммы и плотности соответственно логарифмически-нормального и нормального законов распределения.

Рис. 6 1. Гистограмма и теоретическая (модельная) плотность, характеризующие распределение семей по среднедушевому месячному доходу (а) и по логарифму среднедушевого месячного дохода (б)

Ниже приводятся результаты вычисления основных числовых характеристик логарифмически-нормального распределения (в терминах параметров закона а и ):

Из этих выражений видно, что асимметрия и эксцесс логарифмически-нормального распределения всегда положительны (и тем ближе к нулю, чем ближе к нулю ), а мода, медиана и среднее выстраиваются как раз в том порядке, который мы видим на рис. 5.8, причем они будут стремиться к слиянию (а кривая плотности - к симметрии) по мере стремления к нулю величины При этом, хотя значения логарифмически-нормальной случайной величины образуются как «случайные искажения» некоторого «истинного значения» а, последнее в конечном счете выступает не в роли среднего значения, а в роли медианы.


Случайная переменная Y имеет логарифмически нормальное распределение с параметрами μ и σ, если случайная переменная X = lnY имеет нормальное распределение с теми же параметрами μ и σ. Зная характер связи между переменными X и Y, можем легко построить график плотности вероятности случайной переменной с логарифмически нормальным распределением (Рисунок 4.2).

Рисунок 4.2 – Кривые плотности логарифмически нормального распределения при различных значениях параметров μ и σ

Если случайная переменная X имеет функцию плотности вероятности, определяемую формулой (4.6), и если X = lnY, то:

Откуда имеем для у > 0:

Из определения следует, что случайная переменная, подчиняющаяся логарифмически нормальному распределению, может принимать только положительные значения. Как показано на рисунке 4.2, кривые функции f(y) имеют левостороннюю асимметрию, которая тем сильнее, чем больше значения параметров μ и σ. Каждая кривая имеет один максимум и является определенной для всех положительных значений у.

Вычисление математического ожидания и дисперсии случайной переменной с логарифмически нормальным распределением не составляет особых трудностей:

Путем подстановок и ввода новых переменных в интегралах 4.15 и 4.16 получим:

Вообще, для исчисления вероятности того, что случайная переменная Y с логарифмически нормальным распределением и плотностью f(y, μ, σ), примет значение в интервале (а, b), следует взять интеграл:

Однако на практике удобнее воспользоваться тем, что логарифм случайной переменной Y имеет нормальное распределение. Вероятность того, что а ≤ Y ≤ b равнозначна вероятности того, что
lnа ≤ lnY ≤ lnb.

Вычислим вероятность того, что случайная переменная с логарифмически распределением μ = 1, σ = 0,5, примет значение в интервале (2, 5). Имеем:

Из таблиц логарифмов находим ln2 = 0,6932 и ln5 = 1,6094.

Обозначив lnY = X, можем написать:

Причем случайная переменная X подчинена нормальному распределению со средним значением μ = 1 и стандартным отклонением σ = 0,5. Теперь искомую вероятность нетрудно вычислить по таблицам интегральной функции нормального распределения:

Вопросы для самоконтроля

1 Определение прямоугольного распределения.

2 График плотности вероятности случайной переменной с прямоугольным распределением

3 Основополагающее значение прямоугольного распределения.

4 Математическое ожидание и дисперсия случайной переменной в прямоугольном распределении.



5 Роль нормального распределения в математической статистике.

6 Что такое нормальное распределение и как оно связано с биномиальным?

7 График плотности вероятности случайной переменной с нормальным распределением.

8 Какими статистическими параметрами может быть задано нормальное распределение?

9 Почему нормальное распределение является непрерывным?

10 Уравнение нормальной кривой.

11 Что такое нормированное отклонение?

12 Уравнение кривой нормального распределения в нормированной форме.

13 Какими значениями μ и σ характеризуется нормальная совокупность в нормированной форме?

14 Какая доля данных выборки укладывается в пределах ±1σ, ±2σ, ±3σ?

15 Что показывает таблица нормального интеграла вероятностей?

16 Уравнение логарифмически нормальной кривой.

17 График плотности вероятности случайной переменной с логарифмически нормальным распределением.

18 Какие необходимо выполнить преобразования, чтобы из логарифмически нормального распределения получить нормальное распределение?

19 Какими статистическими параметрами задается логарифмически нормальное распределение?

ТЕМА 5 Распределения параметров выборки

5.1 t – распределение Стьюдента

5.2 F-распределение Фишера–Снедекора

5.3 χ 2 –распределение

5.1 t – распределение Стьюдента

Закон нормального распределения проявляется при числе признаков n > 20–30. Однако экспериментатор часто проводит ограниченное число измерений, основывает свои выводы на малых выборках. При небольшом числе наблюдений результаты обычно близки и редко появляются большие отклонения. Это легко объяснить законом нормального распределения, согласно которому вероятность появления малых отклонений больше, чем отклонений значительных. Так, вероятность отклонений, превышающих по абсолютной величине ±2σ, равна 0,05, или один случай на 20 измерений, а отклонений ± 3σ – 0,01, или один случай на 100.

Если же полевой опыт проводят, например, в 4 – 6 повторностях, то естественно ожидать, что среди показаний урожаев на параллельных делянках очень больших отклонений не будет. Поэтому стандартное отклонение s, подсчитанное по малой выборке, в большинстве случаев будет меньше, чем по всей генеральной совокупности . Следовательно, в этих случаях полагаться на критерии нормального распределения в своих выводах нельзя.

С начала XX века в математической статистике стало разрабатываться новое направление, которое можно назвать статистикой малых выборок. Наибольшее практическое значение для экспериментальной работы имело открытое в 1908 г. английским статистиком и химиком В. Госсетом t–распределение, получившее название распределения Стьюдента (англ. стьюдент – студент, псевдоним В. Госсета).

Распределение t Стьюдента для выборочных средних определяется равенством:

Числитель формулы означает отклонение выборочной средней от средней всей совокупности , а знаменатель:

– является показателем, оценивающим величину стандартной ошибки средней выборочной совокупности.

Таким образом, величина t измеряется отклонением выборочной средней от средней совокупности , выраженным в долях ошибки выборки , принятой за единицу.

Максимумы частоты нормального и t-распределения совпадают, но форма кривой t-распределения всецело зависит от числа степеней свободы. При очень малых значениях степеней свободы она принимает вид плосковершинной кривой, причем площадь, отграниченная кривой, больше, чем при нормальном распределении, а при увеличении числа наблюдений (n > 30) распределение t приближается к нормальному и переходит в него при n = ∞.

На рисунке 1.1 представлено дифференциальное и интегральное распределение t-Стьюдента при 10 степенях свободы.

Рисунок 5.1 – Дифференциальное (слева) и интегральное (справа) распределение t–Стьюдента

Распределение t–Стьюдента имеет важное значение при работе с малыми выборками: позволяет определить доверительный интервал, накрывающий среднюю совокупности , и проверить ту или иную гипотезу относительно генеральной совокупности. При этом нет необходимости знать параметры совокупности и , достаточно иметь их оценки μ и σ для определенного объема выборки n.

5.1.1 Проблема Беренса–Фишера

Проверка гипотезы о генеральных средних двух групп с нормальным распределением и неравными дисперсиями в математической статистике называется проблемой Беренса–Фишера и имеет в настоящее время только приближенные решения. Почему так важно требование равенства дисперсий в сравниваемых группах? Не вдаваясь в детали этой проблемы, отметим, что чем больше различаются между собой дисперсии и объемы выборок, тем сильнее отличается распределение "вычисляемого t-критерия" от распределения "t-критерия Стьюдента". При этом различную величину имеет как сам t-критерий, так и такой параметр этих распределений, как число степеней свободы. В свою очередь число степеней свободы сказывается на величине достигнутого (критического) уровня значимости (р < ...) определяемого для вычисленного значения t-критерия.

Пренебрежение исследователями, приведенными выше условиями допустимости использования t-критерия Стьюдента, приводит к существенному искажению результатов проверки гипотез о равенстве средних. Поэтому в работах, где проверка гипотез о равенстве двух средних производилась с помощью t-критерия Стьюдента, и нет упоминания критериев проверки нормальности распределения и равенства дисперсий, имеются основания предполагать некорректное использование авторами данного критерия, а стало быть, и сомнительность декларируемых ими выводов.

Другая частая ошибка – применение t–критерия Стьюдента для проверки гипотез о равенстве трех и более групповых средних. В этом случае необходимо применять так называемую общую линейную модель, реализованную в процедуре однофакторного дисперсионного анализа с фиксированными эффектами.

Рассмотрим подробнее особенности использования t–критерия Стьюдента. Наиболее часто t–критерий используется в двух случаях. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t–критерий). В этом случае есть контрольная группа и опытная группа, состоящая из разных объектов, количество которых в группах может быть различно. Во втором же случае используется так называемый парный t–критерий, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних. Поэтому эти выборки называют зависимыми, связанными. Например, измеряется содержание лейкоцитов у здоровых животных, а затем у тех же самых животных после облучения определенной дозой излучения. В обоих случаях должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп. Доминирование t–критерия Стьюдента в подавляющем большинстве работ отражает два важных аспекта.

Во-вторых, это говорит также и о том, что этим авторам неизвестны какие-либо альтернативы данному критерию, либо они не в состоянии ими самостоятельно воспользоваться. Можно без преувеличения сказать, что в настоящее время бездумное применение t–критерия Стьюдента в большинстве биологических работ приносит больше вреда, нежели пользы.

5.2 F-распределение Фишера–Снедекора

Если из нормально распределенной совокупности взять две независимые выборки объемом n 1 и n 2 и подсчитать дисперсии и со степенями свободы ν 1 = n –1 и ν 2 = n 2 –1, то можно определить отношение дисперсий:

Отношение дисперсий берут таким, чтобы в числителе была большая дисперсия, и поэтому F ≥ 1.

Распределение F зависит только от числа степеней свободы ν 1 и ν 2 (закон F-распределения открыл Р.А. Фи шер). Когда две сравниваемые выборки являются случайными независимыми из общей совокупности с генеральной средней , то фактическое значение F не выйдет за определенные пределы и не превысит критическое для данных ν 1 и ν 2 теоретическое значение критерия F (F факт < F теор). Если генеральные параметры сравниваемых групп различны, то F факт > F теор. Теоретические значения F для 5%-ного и 1%-ного уровня значимости даны в таблице, где табулированы только правые критические точки для F ≥ 1, так как всегда принято находить отношение большей дисперсии к меньшей.

Кривые, полученные из функции распределения для всех возможных значений F, особенно при небольшом числе наблюдений, имеют асимметричную форму – длинный «хвост» больших значений и большую концентрацию малых величин F (рисунок 5.2).

Рисунок 5.2 – Дифференциальное (слева) и интегральное (справа)
F-распределение Фишера–Снедекора

Отметим, что t–распределение Стьюдента является частным случаем F–распределения при числе степеней свободы ν 1 = 1 и ν 2 = ν, т. е. равно числу степеней свободы для распределения t. В этом случае наблюдается следующее соотношение между F и t:

5.3 χ 2 –распределение

Многие фактические распределения соответствуют моделям теоретических распределений (нормальное, биномиальное, Пуассона) Однако, на практике существуют распределения, сильно отличающиеся от нормального. Для оценки степени расхождения или степени согласия между численностями фактического и теоретического распределений вводятся статистические критерии согласия, например критерий χ 2 . Этот критерий применяется для решения задач статистического анализа, например для проверки гипотез: о независимости двух принципов, положенных в основу группировки результатов наблюдений из одной совокупности; об однородности групп в отношении некоторых определяемых характеристик; о согласии теоретической и экспериментальной кривых численностей. Критерий χ 2 может называться как критерием согласия, так и критерием независимости, критерием однородности. Закон распределения χ 2 (хи–квадрат) открыл К. Пирсон. Кривая распределения, полученная из функции хи–квадрат:

где f – фактические и F – теоретические частоты численности объектов выборки. Ее вид в сильной степени зависит от числа степеней свободы. Для малого числа степеней свободы ν кривая асимметрична (рисунок 5.3), но с увеличением ν асимметрия уменьшается и при ν = ∞ кривая становится нормальной гауссовой.

Распределение χ 2 , так же как и t–распределение, частный случай
F – распределения при ν 1 = ν и ν 2 = ∞.

Рисунок 5.3 – Дифференциальное (слева) и интегральное (справа)
χ 2 –распределение

Вопросы для самоконтроля

1 В каких случаях предпочтительнее использовать t-распределение Стьюдента, а не нормальное распределение?

2 Какие величины необходимо оценивать для использования t-распределения Стьюдента?

3 В чем суть проблемы Беренса–Фишера?

4 Чем численно выражается F-распределение для двух независимых выборок из общей совокупности переменных?

5 От каких характерных величин случайных переменных зависит F-распределение?

6 На какие вопросы может ответить значение критерия χ 2 при статистической обработке экспериментальных данных?

ТЕМА 6 Основы математической статистики

6.1 Средние величины

6.2 Средняя арифметическая

6.3 Средняя геометрическая

6.4 Средняя гармоническая

Модель логарифмического распределения известного английского математика Фишера была первой попыткой описать отношение между числом видов и числом особей этих видов. Особенным успехом эта модель пользовалась в энтомологических исследованиях и была впервые применена Фишером как теоретическая модель для описания распределения видов в коллекциях. Этой модели и статистике разнообразия было посвящено подробное исследование Л. Р. Тейлора с соавторами .

Распределение частот видов для логарифмического распределения описывается следующей последовательностью:

где х – число видов, представленных одной особью, х 2 /2 – число видов, представленных двумя особями и т. д.

Логарифмическая модель имеет два параметра  и x . Это означает, что для выборки объемом N и числом видов S существует только одно возможное распределение частот видов по их относительному обилию, так как и , и х являются функциями N и S . Чем больше выборка, извлеченная из данного сообщества, тем больше значение х и тем меньше доля особей, относящихся к видам, представленных одной особью в выборке. Два параметра S и N (общее число особей) связаны между собой зависимостью
, где – индекс разнообразия, который можно получить из уравнения:

,

где сумма всех особей N , принадлежащих S видам:

Моделью логарифмического распределения, характеризующейся малым числом обильных видов и большой долей «редких», с наибольшей вероятностью можно описать такие сообщества, структура которых определяется одним или немногими экологическими факторами.

Как показали исследования, проведенные Мэгарран в Ирландии , такому ряду соответствует распределение обилий видов растений наземного яруса в хвойных культурах в условиях низкой освещенности.

5.3.3. Логарифмическинормальное распределение

Для большинства сообществ характерно лог-нормальное распределение обилий видов, но обычно эта модель указывает на большое, зрелое и разнообразное сообщество. Такое распределение характерно для систем, когда величина некоей переменной определяется большим числом факторов.

Эта модель впервые была применена к распределению обилий видов Престоном. На разнообразном эмпирическом материале он показал, что частоты видов в больших выборках распределены в соответствии с логарифмическинормальным законом. По разработанной им методике в частотные классы группируются виды с числом особей, заключенным в промежутках, которые ограничены числами геометрической прогрессии. Престон нанес на ось обилия видов в масштабе логарифма по основанию 2 (log 2) и назвал получившиеся классы октавами. Но для описания модели можно использовать любое основание логарифма. На графике распределения частот видов по полученным таким способом классам численности соответствуют известной кривой нормального распределения, усеченной слева, в области частот редких видов.

Распределение обычно записывается в форме:

, где

S R – теоретическое число видов в октаве, расположенной в R октавах от модальной октавы; S mo – число видов в модальной октаве; – стандартное отклонение теоретической лог-нормальной кривой, выраженное в числе октав.

Рис. 5.3.2. Лог-нормальное распределение

Лог-нормальное распределение описывается симметричной «нормальной», т. е. колоколообразной кривой (рис. 5.3.2.). Однако если данные, которым она соответствует, получены из ограниченной выборки, то левая часть кривой (т. е. редкие, неучтенные виды) будет выражена нечетко. Престон назвал такую точку усечения кривой слева «линией занавеса». «Линия занавеса» может сдвигаться влево при увеличении объема выборки. На рисунке она указана стрелкой. Для большинства выборок выражена только часть кривой справа от моды. Только при огромном количестве данных, собранных на обширных биогеографических территориях, прослеживается полная кривая. S -образная кривая указывает на сложный характер дифференциации и перекрывания ниш. Большинство видов в природных открытых экосистемах существует в условиях соревнования за ресурсы, а не на условиях прямой конкуренции; множество адаптаций дает возможность делить ниши без конкурентного исключения из местообитания. Эта модель наиболее вероятна для ненарушенных сообществ.