Применение случайных моделей требует использования статистических методов оценки параметров случайных величин. Кроме того, существенным моментом является определение именно тех параметров случайных функций, описывающих изменения концентрации ЗВ, которые должны быть сопоставлены с контрольными или нормируемыми уровнями при оценке санитарно-гигиенической обстановки.
Следуя сказанному выше, формальное определение одного (разового) измерения концентрации можно представить в виде соотношения:
(2.5.)
Где – измеренное значение концентрации, осредненное за время ;
X(t) – случайная функция, описывающая временную изменчивость «мгновенных» значений концентрации ингредиента в точке измерений;
Q(t) – расходная характеристика зондирующего устройства.
Если контрольным периодом является промежуток Т= t2 – t1, то средние значения за время Т можно определить двумя способами:
1)
(2.6.)
2)
(2.7.)
где – число циклов отбора проб ЗВ, (число измерений);
– продолжительность одного цикла измерения;
– промежуток времени между измерениями.
Не трудно показать, что разница между этими двумя определениями и возрастает с увеличением . Это происходит из-за потери информации о процессе X(t). Представления 2.6. и 2.7. чисто формальные, так как вид функции и не известен.
Если все {} рассматривать изолированно, как независимые случайные величины, имеющие одинаковые математические ожидания и дисперсии МХ и S2X, то, как известно, [ 5 ]
, (2.8.)
То есть, среднее арифметическое обладает выборочной неустойчивостью, а соответствующая дисперсия зависит от объема выборки n. Очевидно, что максимальное число измерений n=N за время (Т) может быть определено по формуле:
=0. (2.9.)
Следуя терминологии математической статистики число (N) можно назвать объемом генеральной совокупности [ 16 ].
Дисперсия среднего арифметического может зависеть от степени связности соответствующих экспериментальных значений {} [25,26]. Наличие связности между членами временных рядов видимо, впервые было рассмотрено Слуцким [ 25 ]. Им же показано, что устойчивость или связность в рядах затрудняет оценки статистических характеристик и требует оценок корреляционных функций. В настоящее время достаточно хорошо изучена связность метеорологических рядов [27,28], соответственно она должна учитываться в анализе данных о загрязнении воздуха [ 29,30 ]. Если концентрация ЗВ Х(t) в любой момент времени (t), определенная как (2.5.), является случайной величиной, то она однозначно определяется своей функцией распределения вероятности или частоты. Частота повторяемости появления тех или иных значений {} из (n) измерений может, например, быть рассчитана по формуле (2.1.).
Каждое загрязняющее атмосферу вещество требует вполне определенного времени экспозиции для того, чтобы проявился определенный эффект воздействия. Например, концентрация порога запаха может быть определена органолептически (organoleptical) человеком в течение 1 – 2 сек [ 34 ]. С другой стороны требуется гораздо большее время экспозиции для окиси углерода (СО), чтобы вызвать определенные эффекты в расстройстве здоровья людей. Растения могут быть повреждены при времени экспозиции менее 1 часа, если концентрация (SO2) или (NO2) достаточно высока. Таким образом, для того, чтобы связать эффекты воздействия загрязнителей атмосферы с их концентрациями, последние должны быть проанализированы как функции времени экспозиции. Это может быть сделано осреднением концентрации за некоторые периоды времени. В работе [35] приводятся зависимости между 8-часовыми уровнями концентрации (СО) в воздухе и уровнями (СО) в крови. Отмечена очень хорошая корреляция процессов. В то же время, отмечено, что 1 – часовые уровни концентрации (СО) являются плохими индикаторами содержания (СО) в крови, так как последние регулируются достаточно медленными процессами сорбции и десорбции.
Частота, с которой данная концентрация ингредиента может быть превышена, определяет частоту с которой может ожидаться определенный эффект воздействия. Таким образом, для того чтобы связать концентрации с их воздействием, данные о качестве воздуха должны быть проанализированы как функции времени осреднения и частоты. Распределения частот данных о загрязнении воздуха (воды) должны обладать одним свойством – они сугубо положительны (все >0). Поэтому функция нормального распределения (2.1.), строго говоря, не может использоваться для интерпретации данных контроля ЗВ.
Долгое время господствовало убеждение, что вполне случайное распределение должно быть строго симметричным и всякую асимметрию считали признаком тенденции к преимущественному появлению односторонних значений и, следовательно, признаком наличия каких-то связей, исключающих случайность. На самом деле это не так. Нетрудно показать, что любая функция случайной переменной, и любая функция распределения может быть преобразована в функцию распределения заданной формы. Нет никаких специальных оснований полагать, что именно тот, а не другой аргумент целиком управляет явлением. Следовательно, изучение частот появления аргумента (Х) может быть с успехом заменено равносильной задачей – изучением частот величины Z=f(X).
Так как значения ПДК для многих ЗВ весьма малы и находятся на границе чувствительности многих методов и приборов, ошибки измерений резко возрастают. Возможность появления больших средних квадратичных отклонений данных измерений, не зависимо от причин их генерирующих, и как следствие появление больших ошибок вычисления средних (больших 100%) приводит к необходимости использования несимметричных доверительных интервалов и несимметричных функций распределения вероятности.
В частности, такие функции должны быть ограничены слева значением Х=0 во избежание появления бессмысленных с физической точки зрения оценок вида:
(2.10.)
где Ɛ – абсолютная ошибка измерения.
Чтобы учесть положительную асимметрию распределения частот вносились поправки к функции распределения (2.1.) [ 21 ], предлагалось использовать усеченные нормальные распределения в виде:
(2.11.)
Где А – определялось из условия нормировки
– функция распределения Гаусса.
Эта модель дает вероятность P>0 для значений признака Х=0, в то время как MX>0.
Предлагалось использовать гамма-распределение [36, 37], плотность которого задается выражением:
(2.12.)
где – гамма функция.
Моменты распределения:
Для аппроксимации функции распределения случайных величин Х, изменяющихся на конечном интервале предлагалось использовать их разложение по системе ортогональных полиномов Лежандра и Лагерра [ 37 ]. В первом случае, если для (Х) известны ,S и центральные моменты , то плотность распределения величины задается в виде:
Соответствующие коэффициенты разложения находятся из условий ортогональности полиномов Лежандра:.
С использованием представлений для , для Cn получается:
(2.13.)
Например,
As – асимметрия.
Аналогично, предлагалось использовать разложение по полиномам Лагерра. Если известны величины , то производя замену , получим плотность распределения в виде ряда:
(2.14.)
Так как , то для Cn можно получить:
, где
Данный подход универсален и позволяет получить достаточную точность уже при вычислении 4÷5 членов разложения. Известны и другие виды разложений по ортогональным полиномам, основанным на нормальном распределении. Это, так называемые, ряд Грамма-Шарлье и асимптотическое распределение Эдокворта [ 38 ].