Лит.: Головин Б. Н., Язык и статистика, М., 1971; Фрумкина Р. М., Статистические методы и стратегия лингвистического исследования, «Изв. АН СССР. Серия литературы и языка». 1975, т. 34, №2; Штейнфельдт Э. А., Частотный словарь современного русского языка, Таллин, 1963; Herdan G., The advanced theory of language as choice and chance, B.,1966; Mulier Ch., Initiation a la statistique linguistique, P., 1968.
М. В. Арапов.
Статистическая механика
Статисти'ческая меха'ника, тоже, что статистическая физика .
Статистическая проверка гипотез
Статисти'ческая прове'рка гипо'тез, система приёмов в математической статистике , предназначенных для проверки соответствия опытных данных некоторой статистической гипотезе . Процедуры С. п. г. позволяют принимать или отвергать статистические гипотезы, возникающие при обработке или интерпретации результатов измерений во многих практически важных разделах науки и производства, связанных с экспериментом. Правило, по которому принимается или отклоняется данная гипотеза, называется статистическим критерием. Построение критерия определяется выбором подходящей функции Т от результатов наблюдений, которая служит мерой расхождения между опытными и гипотетическими значениями. Эта функция, являющаяся случайной величиной, называется статистикой критерия, при этом предполагается, что распределение вероятностей Т может быть вычислено при допущении, что проверяемая гипотеза верна. По распределению статистики Т находится значение Т , такое, что если гипотеза верна, то вероятность неравенства T >T равна a, где a — заранее заданный значимости уровень . Если в конкретном случае обнаружится, что Т > T , то гипотеза отвергается, тогда как появление значения Т £ T не противоречит гипотезе. Пусть, например, требуется проверить гипотезу о том, что независимые результаты наблюдений x1 ,..., xn подчиняются нормальному распределению со средним значением а = a и известной дисперсией s2 . При этом предположении среднее арифметическое
результатов наблюдений распределено нормально со средним
а = a и дисперсией s
2 /n , а величина
распределена нормально с параметрами (0, 1). Полагая
можно найти связь между
T и a по таблицам нормального распределения. Например, при гипотезе
а =
a событие
Т > 1, 96 имеет вероятность а = 0,05. Правило, рекомендующее считать, что гипотеза
а = a неверна, если
Т > 1,96, будет приводить к ложному отбрасыванию этой гипотезы в среднем в 5 случаях из 100, в которых она верна. Если же
Т £ 1,96, то это ещё не означает, что гипотеза подтверждается, т.к. указанное неравенство с большой вероятностью может выполняться при
а , близких к
a . Следовательно, при использовании предложенного критерия можно лишь утверждать, что результаты наблюдений не противоречат гипотезе
а =
a . При выборе статистики
Т всегда явно или неявно учитывают гипотезы, конкурирующие с гипотезой
а = a . Например, если заранее известно, что
а ³ a , т. е. отклонение гипотезы
а = a влечёт принятие гипотезы
а > a , то вместо
Т следует взять
. Если дисперсия s
2 неизвестна, то вместо данного критерия для проверки гипотезы
а = a можно воспользоваться т. н. критерием Стьюдента, основанным на статистике
которая включает несмещенную оценку дисперсии
и подчинена Стьюдента распределению с n — 1 степенями свободы (подобную задачу см. в ст. Математическая статистика , табл. 1a). Такого рода критерии называются критериями согласия и используются как для проверки гипотез о параметрах распределения, так и гипотез о самих распределениях (см. Непараметрические методы ). При решении вопроса о принятии или отклонении какой-либо гипотезы H с помощью любого критерия, основанного на результатах наблюдения, могут быть допущены ошибки двух типов. Ошибка «первого рода» совершается тогда, когда отвергается верная гипотеза H . Ошибка «второго рода» совершается в том случае, когда гипотеза H принимается, а на самом деле верна не она, а какая-либо альтернативная гипотеза Н . Естественно требовать, чтобы критерий для проверки данной гипотезы приводил возможно реже к ошибочным решениям. Обычная процедура построения наилучшего критерия для простой гипотезы заключается в выборе среди всех критериев с заданным уровнем значимости и (вероятность ошибки первого рода) такого, который приводил бы к наименьшей вероятности ошибки второго рода (или, что то же самое, к наибольшей вероятности отклонения гипотезы, когда она неверна). Последняя вероятность (дополняющая до единицы вероятность ошибки второго рода) называется мощностью критерия. В случае, когда альтернативная гипотеза Н простая, наилучшим будет критерий, который имеет наибольшую мощность среди всех других критериев с заданным уровнем значимости а (наиболее мощный критерий). Если альтернативная гипотеза Н сложная, например зависит от параметра, то мощность критерия будет функцией, определенной на классе простых альтернатив, составляющих Н , т. е. будет функцией параметра. Критерий, имеющий наибольшую мощность при каждой альтернативной гипотезе из класса Н , называется равномерно наиболее мощным, однако следует отметить, что такой критерий существует лишь в немногих специальных ситуациях. В задаче проверки гипотезы о среднем значении нормальной совокупности а = а против альтернативной гипотезы а > a равномерно наиболее мощный критерий существует, тогда как при проверке той же гипотезы против альтернативы а ¹ a его нет. Поэтому часто ограничиваются поиском равномерно наиболее мощных критериев в тех или иных специальных классах (Инвариантных, несмещенных критериев и т.п.).
Теория С. п. г. позволяет с единой точки зрения трактовать выдвигаемые практикой различные задачи математической статистики (оценка различия между средними значениями, проверка гипотезы постоянства дисперсии, проверка гипотезы независимости, проверка гипотез о распределениях и т.п. Идеи последовательного анализа , примененные к С. п. г., указывают на возможность связать решение о принятии или отклонении гипотезы с результатами последовательно проводимых наблюдений (в этом случае число наблюдений, на основе которых по определённому правилу принимается решение, не фиксируется заранее, а определяется в ходе эксперимента) (см. также Статистические решения ).
Лит.: Kpamep Г., Математические методы статистики, пер. с англ., 2 изд., М., 1975; Леман Э., Проверка статистических гипотез, пер. с англ., М., 1964.
Л. В. Прохоров.
Статистическая радиофизика
Статисти'ческая радиофи'зика, раздел радиофизики, посвященный изучению флуктуационных явлений при генерации, излучении, распространении и приёме радиоволн. В более широком смысле С. р. охватывает исследования статистических закономерностей в колебательных и волновых процессах (когерентность , проблемы взаимодействия сигналов и шумов в нелинейных системах и т.п.). Практическое значение С. р. связано с тем, что в системах радиолокации , радионавигации , радиосвязи и др. флуктуации играют важную и во многих случаях определяющую роль на основных этапах передачи информации.