Ясно, что в иных элементарных случаях вышеприведенное определение дает результаты, согласующиеся с обычным употреблением. Теперь исследуем, удовлетворяет ли таким образом определяемая вероятность аксиомам.
Буквы p, q и h, употребленные в аксиомах, должны теперь пониматься как обозначающие не предложения, а классы или пропозициональные функции. Вместо выражения "h предполагает p" мы будем иметь выражение "h содержится в p", выражение "p и q " будет обозначать общую часть двух классов p и q, тогда как "p и q" будет классом всех членов, которые принадлежат к каждому или к обоим из двух классов p и q.
Наши аксиомы были следующие:
1. Есть только одно значение p/h. Оно будет истинным, если только h не является нулем, в каковом случае p/h = 0/0. Мы поэтому исходим из того, что h не есть нуль.
2. Возможными значениями p/h являются все реальные числа от 0 до 1. В нашей интерпретации они будут только рациональными числами, если только мы не сможем найти способ распространения нашего определения на бесконечные классы. Этого нельзя сделать просто, поскольку деление не дает единого результата, когда дело касается бесконечных чисел.
3. Если h содержится в p, тогда p/n=1. В этом случае общая часть h и p есть h, следовательно, вышеупомянутое следует из нашего определения.
4. Если h содержится в не-p, тогда p/h = 0. Это ясно по определению, ибо в этом случае общая часть h и p равна нулю.
5. Конъюнктивная аксиома. Согласно нашей интерпретации, она утверждает, что отношение членов h, являющихся членами как p, так и q, есть отношение членов h, являющихся членами p, помноженное на отношение членов p и b, являющихся членами q. Допустим, что число членов h есть а, что число членов, общих для p и h, есть b и что число членов, общих для p, q и h, есть с. Тогда отношение членов h, являющихся членами p и q, есть с/a, отношение членов h, являющихся членами p, есть h/a и отношение членов p и h, являющихся членами q, есть с/b. Таким образом, наша аксиома подтверждается, поскольку с/а = b/a x с/b.
6. Дизъюнктивная аксиома. Согласно нашей настоящей интерпретации, эта аксиома говорит, сохраняя вышеприведенные значения а, b и с и добавляя, что d есть число членов h, являющихся членами или p, или q, или обоих из них, тогда как е есть число членов h, являющихся членами q, что
То есть d = b + e - c,
что опять-таки совершенно очевидно.
Таким образом, наши аксиомы удовлетворяются, если h есть конечный класс, не являющийся нулем, за исключением того, что возможные значения вероятности нужно ограничивать рациональными дробями.
Из этого следует, что математическая теория вероятности оказывается действенной при вышеприведенной интерпретации.
Мы должны, однако, исследовать вопрос о сфере применения таким способом определяемой вероятности, которая с первого взгляда кажется чересчур узкой для того употребления, которое мы хотим сделать из вероятности.
Прежде всего мы хотим, чтобы можно было говорить о шансе, что некоторое определенное событие будет иметь некоторые черты, а не только о шансе, что какой-либо рядовой член класса будет иметь их. Например, вы уже осуществили бросание с двумя костями, но я еще не видел результата этого бросания. Какова для меня вероятность, что выпали две шестерки? Мы хотели бы сказать, что эта вероятность равна 1/36, а если наше определение не позволяет нам сказать этого, то оно неадекватно. В таком случае мы сказали бы, что мы рассматриваем событие просто как представителя определенного класса; мы сказали бы, что если А рассматривается просто как член класса В, то шанс, что он принадлежит к классу А, равен А/В. Но здесь не совсем ясно, что значит "рассматривание определенного события просто как члена определенного класса". В таком случае предполагается следующее: нам дается некая характеристика какого-либо события, которая для более полного познания, чем наше, является достаточной, чтобы определить его однозначно; что же касается нашего познания, то мы не имеем способа узнать, принадлежит ли оно к классу А, хотя мы и знаем, что оно принадлежит к классу В. Бросив кости, вы знаете, принадлежит или не принадлежит ваше бросание к классу двойной шестерки, но я этого не знаю. Я знаю только то, что это бросание с двойной шестеркой есть одно из 36 возможных бросаний. Рассмотрим следующий вопрос: каков шанс, что самый высокий человек в Соединенных Штатах живет в штате Айова? Возможно, что кто-нибудь знает этого человека; во всяком случае, существует известный метод, с помощью которого можно узнать, кто этот человек. Если бы этот метод был успешно применен, то имелся бы определенный, не предполагающий вероятности ответ, именно или что он живет в штате Айова, или что он там не живет. Но я не знаю этого. Я ногу только утверждать, что население штата Айова равно числу m, население Соединенных Штатов равно числу n, и сказать, что в отношении этих данных вероятность, что он живет в штате Айова, равна m/n. Таким образом, когда мы говорим о вероятности определенного события, имеющего какую-то характеристику, мы всегда должны специфицировать те данные, по отношению к которым должна быть степень вероятности.
Мы можем обобщить: если дан любой объект о и дано, что а есть член класса В, то мы говорим, что в отношении к этому данному вероятность, что о есть член класса А, равна А/В в ранее определенном смысле. Эта концепция полезна, потому что часто о каком-либо объекте мы знаем достаточно много, чтобы определить его однозначно, не имея при этом достаточных знаний, чтобы определить, имеет ли он то или это свойство. "Самый высокий человек в Соединенных Штатах" есть определенное описание, применимое к одному и только одному человеку, но я не знаю, к какому человеку, к поэтому для меня является открытым вопрос, живет ли он в штате Айова. "Карта, которую я собираюсь вытащить", есть определенное описание, и через момент я буду знать, будет ли это описание относиться к красной или к черной карте, но к какой, я еще пока не знаю. Именно это очень обычное состояние частичного незнания в отношении определенных объектов делает полезным применение вероятности и к определенным объектам, а не только к полностью неопределенным членам классов.
Хотя частичное незнание есть то, что делает вышеприведенную форму вероятности полезной, незнание все-таки не включено в понятие вероятности, которое по-прежнему имело бы тот же смысл для всеведущего существа, как и для нас. Всеведущее существо знало бы, относится ли a к классу A, но все-таки могло бы сказать: по отношению к данному, что a есть B, вероятность того, что a есть A равна A/B.
При применении нашего определения к конкретным примерам в некоторых случаях возможна неясность. Чтобы сделать это понятным, мы лучше воспользуемся языком свойств, чем классов. Пусть класс А определяется свойством f, а класс B свойством y. Тогда мы скажем:
Вероятность того, что о имеет свойство f при том, что оно имеет свойство y, определяется как отношение вещей, имеющих как свойство f, так и свойство y, к вещам имеющим свойство y. Мы обозначаем выражение "a имеет свойство f" знаком "fa". Но если о встречается в "fa" больше одного раза, то возникнет неясность. Например, допустим, что 'fa" обозначает "о совершает самоубийство", то есть "a убивает a". Это есть значение выражения "x убивает x", которое является классом самоубийств; оно также есть значение выражения "о убивает х", которое является классом людей, которых убивает а;, оно также есть значение выражения "x убивает a", которое есть класс людей, которые убивают о. Таким образом, определяя вероятность fa, если "a" встречается в "fa" больше одного раза, мы должны указать, какие из его наступлений должны и какие не должны рассматриваться как значения переменной.
Окажется, что мы может интерпретировать все элементарные теоремы в согласии с вышеприведенным определением. Возьмем, например, предполагаемое Лапласом оправдание индукции. Имеется N+1 сумок, каждая из которых содержит N шаров. Из этих сумок r+1-я содержит г белых шаров и N — r черных шаров. Мы вытащили из одной сумки n шаров, причем все они оказались белыми.
Каков шанс
(a) что мы выбрали сумку с одними лишь белыми шарами?
(b) что следующий шар окажется тоже белым?
Лаплас говорит, что (a) есть (n+1)/(/V+1) и (b) есть (n +1)/(n+2). Иллюстрируем это несколькими числовыми примерами. Во-первых, допустим, что всего имеется 8 шаров, из которых вытащено 4, все белые. Каковы шансы (a), что мы выбрали сумку, содержащую только белые шары, и (b) что следующий вытащенный шар тоже окажется белым?
Пусть Pr представляет собой гипотезу, что мы выбрали сумку с r белыми шарами. Эти данные исключают р0, р1, р2, р3. Если мы имеем p4, то имеется только один случай, когда мы могли вытащить 4 белых, и остается 4 случая вытащить черный и ни одного — белый. Если мы имеем р5, то есть 5 случаев, когда мы могли бы вытащить 4 белых, и для каждого из них был 1 случай вытащить следующий белый и 3 — вытащить черный; таким образом, из р5 мы получаем 5 случаев, где следующий шар будет белым, и 15 случаев, где он будет черным. Если мы имеем P6, то есть 15 случаев выбора 4 белых, а когда они вытащены, остается 2 случая выбрать один белый и 2 случая выбрать черный; таким образом, из P6 мы имеем 30 случаев получения следующего белого и 30 случаев, когда следующий будет черным. Если мы имеем p7, то есть 35 случаев вытащить 4 белых, а после того, как они будут вытащены, останется 3 случая вытащить белый и один — вытащить черный; таким образом, мы получаем 105 случаев вытащить следующий белый и 35 — вытащить черный. Если мы имеем P8, то есть 70 случаев вытащить 4 белых, а когда они будут вытащены, то есть 4 случая вытащить следующий белый и ни одного — вытащить черный; таким образом, из P8 мы получаем 280 случаев вынуть пятый белый и ни одного — вынуть черный. Суммируя, мы имеем 5+30+105+280, то есть 420 случаев, когда пятый шар является белым, и 4+15+30+35, то есть 84 случая, когда пятый шар является черным. Следовательно, разница в пользу белого составляет отношение 420 к 84, то есть 5 к 1; это значит, что шанс, что пятый шар окажется белым, равен 5/6.