23 Предполагаем, что читатель знаком с основными понятиями обычной теории вероятностей (см. например, [19]).
§ 1. Случайные события
Для начала предположим, что перед нами стоит задача теории вероятности, в которой переменные принимают дискретные значения. Пусть в случайно выбранные моменты времени происходит ряд дискретных событий; это может быть, например, прохождение космических частиц через счётчик или падение дождевых капель на выделенную для наблюдений площадку. Хотя известно, что частицы появляются в случайные моменты времени, однако можно ожидать, что в течение любого достаточно длительного промежутка времени 𝑇 будут наблюдаться 𝑛=𝑇μ частиц. Таким образом, μ имеет смысл средней скорости счета.
Конечно, при любом реальном измерении точное число зарегистрированных частиц 𝑛, вообще говоря, не будет совпадать с их средним числом. Однако можно спросить, какова вероятность наблюдения некоторого числа 𝑛 частиц за время, в течение которого в среднем появляются 𝑛 частиц. Ответ даётся распределением Пуассона
𝑃
𝑛
=
𝑛𝑛
𝑛!𝑒𝑛
(12.1)
С другой стороны, можно интересоваться вероятностными вопросами иного типа. Например, какова вероятность того, что после появления предыдущей частицы следующая появится в момент 𝑡? На вопрос, сформулированный таким образом, не существует правильного ответа. Если же мы поинтересовались бы вероятностью того, что интервал между появлениями частиц будет равен или больше 𝑡, то ответ 𝑒-μ𝑡 мог бы быть получен. Это значит, что можно определить лишь, находится ли момент 𝑡 внутри некоторого временного интервала. Таким образом, если нас интересует конкретный момент 𝑡, то должны исходить из бесконечно малого интервала и формулировать вопрос следующим образом: какова (бесконечно малая) вероятность того, что промежуток времени между двумя событиями будет лежать внутри окрестности 𝑑𝑡, окружающей момент 𝑡? Ответ записывается в виде
𝑃(𝑡)
𝑑𝑡
=
μ𝑒
-μ𝑡
𝑑𝑡
.
(12.2)
Так приходим к понятию распределения вероятности для непрерывной переменной: 𝑃(𝑡) есть отнесённая к единице измерения 𝑡 вероятность того, что интервал между событиями равен 𝑡. Запишем распределение вероятности для 𝑥 как 𝑃(𝑥), если 𝑃(𝑥)𝑑𝑥 представляет вероятность того, что переменная находится в окрестности 𝑑𝑥 точки 𝑥. Можно легко распространить это определение на случай двух переменных и написать вероятность распределения 𝑥 и 𝑦 как 𝑃(𝑥,𝑦)𝑑𝑥𝑑𝑦. При этом мы подразумеваем, что вероятность найти переменные 𝑥 и 𝑦 в области 𝑅 плоскости 𝑥𝑦 даётся интегралом
∫
𝑅
𝑃(𝑥,𝑦)𝑑𝑥𝑑𝑦
.
Хотелось бы расширить концепцию вероятности ещё дальше. Желательно рассматривать распределения не только отдельных переменных, но также и целых кривых, т.е. хотелось бы построить вероятностные функции, или, точнее, функционалы, которые позволят ответить на вопрос: какова вероятность какой-либо конкретной эволюции физического процесса, развивающегося во времени, например напряжения на вольтметре или цены на товар, или, в случае двух переменных, какова вероятность формы поверхности моря как функции широты и долготы? Все это приводит нас к необходимости рассмотреть вероятность некоторой функции.
Запишем это так. Вероятность наблюдения функции 𝑓(𝑡) есть функционал 𝑃[𝑓(𝑡)]. При этом следует помнить, что вопросы относительно такой вероятности имеют смысл, только если определить интервал, внутри которого мы ищем определённую функцию. Так же, как в приведённом выше примере, мы должны были спросить: какова вероятность найти конец временного промежутка внутри интервала 𝑑𝑡? Теперь аналогично следует спрашивать: какова вероятность найти функцию в пределах некоторого более или менее ограниченного класса функций (например, среди кривых, заключённых между точками 𝑎 и 𝑏) в течение всего времени интересующего нас хода событий? Если мы назовём такую совокупность функций классом 𝐴 и спросим, какова вероятность найти функцию 𝑓(𝑡) в классе 𝐴, то ответ записывается в виде интеграла по траекториям
∫
𝑃[𝑓(𝑡)]
𝒟𝑓(𝑡)
,
𝐴
(12.3)
где интегрирование проведено по всем функциям класса 𝐴.
Это выражение можно осмыслить по аналогии с функцией вероятности для нескольких переменных. Вообразим, что точками 𝑡1,𝑡2,… время разбито на дискретные интервалы (как мы это делали в гл. 2, когда только что определили интегралы по траекториям). Тогда значения функции в избранных временных точках 𝑓(𝑡1),𝑓(𝑡2),… = 𝑓1,𝑓2,…, аналогичны аргументам функции распределения многих переменных. Вероятность обнаружения заданной кривой можно понимать теперь как вероятность получения заданной системы величин 𝑓1,𝑓2,… в интервале 𝑑𝑓1,𝑑𝑓2,…, т.е. 𝑃(𝑓1,𝑓2,…) 𝑑𝑓1,𝑑𝑓2,…. Если затем перейти к пределу, устремляя число дискретных интервалов времени к бесконечности, то получим вероятность обнаружения непрерывной кривой 𝑓(𝑡) в интервале 𝒟𝑓(𝑡), стоящую под знаком интеграла по траекториям в выражении (12.3). Определённый таким образом функционал вероятности и соответствующий вероятностный подход мы будем использовать далее в этой главе.
§ 2. Характеристические функции
Полезно и дальше использовать аналогию между функционалом вероятности траектории и более привычной функцией распределения. Оба эти подхода имеют некоторые общие понятия, например понятие среднего значения. В случае обычных функций распределения дискретных величин, когда вероятность обнаружения некоторого числа 𝑛 равна 𝑃𝑛, среднее значение определяется как
𝑛
=
∞
∑
𝑛=1
𝑛
𝑃
𝑛
.
(12.4)
Для непрерывно распределённых переменных
𝑥
=
∞
∫
-∞
𝑥
𝑃(𝑥)
𝑑𝑥
.
(12.5)
Аналогичным образом среднее значение функционала 𝑄[𝑓(𝑡)] определим как
⟨𝑄⟩
=
∫𝑄[𝑓(𝑡)]𝑃[𝑓(𝑡)]𝒟𝑓(𝑡)
∫𝑃[𝑓(𝑡)]𝒟𝑓(𝑡)
.
(12.6)
В последнем соотношении, как и в гл. 7, мы включили в знаменатель интеграл по траекториям, который напоминает нам, что мы всегда должны иметь дело с проблемой нормировки. В принципе можно было бы с самого начала вычислить интеграл по траекториям от функции распределения, приравнять его единице и определить нормировочную постоянную. Однако во многих практических случаях удобнее оставлять функцию ненормированной, просто сокращая числовые множители в числителе и знаменателе выражения, которые сами по себе могут оказаться крайне сложными для вычисления.
Средний квадрат функции в заданный момент времени, например при 𝑡=𝑎, так же как и среднее значение функции, можно выразить через интегралы по траекториям. В этом случае получается функционал
⟨[𝑓(𝑎)]²⟩
=
∫[𝑓(𝑎)]²𝑃[𝑓(𝑡)]𝒟𝑓(𝑡)
∫𝑃[𝑓(𝑡)]𝒟𝑓(𝑡)
.
(12.7)
Одним из наиболее важных случаев усреднения функций согласно (12.5) является вычисление среднего значения 𝑒𝑖𝑘𝑥. Это среднее значение называется характеристической функцией и равно