Если у меня есть 58% шанс выиграть очко, каковы шансы, что я выиграю игру в пинг-понг до 21, выиграю с 2?

Я поспорил с коллегой, что из 50 игр в пинг-понг (первая выиграет 21 очко, выиграет 2) я выиграю все 50. На данный момент мы сыграли 15 игр, и в среднем я выигрываю 58% очки, плюс я выиграл все игры до сих пор. Итак, мы задаемся вопросом, есть ли у меня 58% шанс выиграть очко, а у него 42% шанс выиграть очко, каков процентный шанс, что я выиграю игру? Есть ли формула, по которой мы можем подставить разницу в% вероятностей?

Мы погуглили повсюду и даже спросили специалистов по данным в нашей компании, но не смогли найти прямого ответа.

Изменить:Вау, я поражен тщательностью ответов. Большое спасибо всем вам. Если кому-то интересно, у меня есть обновленная информация о том, как продвигается моя ставка: теперь я выиграл 18 из 50 игр, поэтому мне нужно выиграть еще 32 игры. Я набрал 58,7% всех очков, и, следовательно, мой противник набрал 41,3% очков. Стандартное отклонение для моего оппонента составляет 3,52, его средний балл - 14,83, а его средний балл - 15,50. Ниже приведен снимок экрана с результатами каждой игры на данный момент. Я могу продолжать обновлять по ходу ставки, если люди будут заинтересованы.

Редактировать № 2: К сожалению, мы смогли сыграть еще несколько игр, ниже приведены результаты. Я просто буду заменять картинку, чтобы у меня не было нескольких скриншотов с партитурой.

Последнее обновление: я наконец проиграл своему коллеге в игре №28. Он победил меня 21-13. Спасибо за всю твою помощь!

5 игр или около того. К сожалению, мы играем всего несколько игр в неделю, так как играем только после работы. $ \ endgroup $ - Ричард 23 фев.

6 ответов 6

Анализ осложняется перспективой того, что игра переходит в «овертайм», чтобы выиграть с разницей не менее двух очков.(В противном случае это было бы так же просто, как решение, показанное на https://stats.stackexchange.com/a/327015/919.) Я покажу, как визуализировать проблему и использовать это, чтобы разбить ее на легко вычисляемые вклады в ответ. Результат, хоть и немного беспорядочный, но управляемый. Симуляция подтверждает ее правильность.

Пусть $ p $ будет вашей вероятностью выиграть очко.Предположим, что все точки независимы. Вероятность того, что вы выиграете игру, может быть разбита на (неперекрывающиеся) события в зависимости от того, сколько очков набрал ваш оппонент в конце, при условии, что вы не перейдете в сверхурочное время (0,1 $, \ ldots, 19 $) или вы перейдете в через некоторое время. В последнем случае (или станет) очевидно, что на каком-то этапе счет был 20-20.

Есть приятная визуализация.Пусть результаты игры будут отображаться в виде очков $ (x, y) $, где $ x $ - ваш счет, а $ y $ - счет вашего оппонента. По мере развития игры результаты перемещаются по целочисленной решетке в первом квадранте, начиная с $ (0,0) $, создавая игровой путь . Он заканчивается, когда один из вас впервые набирает не менее 21 доллара и имеет маржу не менее 2 долларов. Такие выигрышные очки образуют два набора очков, «поглощающую границу» этого процесса, на которых игровой путь должен завершиться.

На этом рисунке показана часть поглощающей границы (она продолжается бесконечно вверх и вправо) вместе с траекторией игры, которая перешла в сверхурочное время (увы, с проигрышем для вас).

Давай посчитаем.Количество способов, которыми игра может закончиться с очками $ y $ для вашего оппонента, - это количество различных путей в целочисленной решетке очков $ (x, y) $, начинающихся с начального результата $ (0,0) $ и заканчивающихся на предпоследний балл $ (20, y) $. Такие пути определяются тем, какие из 20 + y $ очков в игре вы выиграли. Следовательно, они соответствуют подмножествам размера $ 20 $ чисел $ 1,2, \ ldots, 20 + y $, и их $ \ binom $. Поскольку на каждом таком пути вы выиграли 21 $ очков (каждый раз с независимыми вероятностями $ p $, считая финальную точку), а ваш оппонент выиграл $ y $ очков (каждый раз с независимыми вероятностями $ 1-p $), пути, связанные с $ y $ с общей вероятностью

Точно так же есть $ \ binom $ способов получить $ (20,20) $, представляющее соотношение 20-20. В этой ситуации у вас нет однозначного выигрыша. Мы можем вычислить шанс на вашу победу, приняв общее соглашение: забудьте, сколько очков было набрано на данный момент, и начните отслеживать разницу в очках. Игра находится на дифференциале $ 0 $ и закончится, когда она впервые достигнет $ + 2 $ или $ -2 $, обязательно пройдя по пути $ \ pm 1 $. Пусть $ g (i) $ будет шансом на победу, когда дифференциал равен $ i \ in \ $.

Поскольку ваш шанс на победу в любой ситуации составляет $ p $, у нас есть

Из единственного решения этой системы линейных уравнений относительно вектора $ (g (-1), g (0), g (1)) $ следует

Таким образом, это ваш шанс на выигрыш при достижении $ (20,20) $ (что происходит с шансом $ \ binom p ^ (1-p) ^ $).

Следовательно, ваш шанс на победу- это сумма всех этих непересекающихся возможностей, равная

В скобках справа указан многочлен от $ p $. (Похоже, что его степень составляет 21 доллар, но все главные члены отменяют: его степень составляет 20 долларов.)

Когда $ p = 0,58 $, шанс на выигрыш близок к 0,855913992 $.

У вас не должно возникнуть проблем с обобщением этого анализа на игры, заканчивающиеся с любым количеством очков. Когда требуемая маржа превышает 2 доллара, результат становится более сложным, но столь же простым.

Между прочим, с этими шансами на победу у вас был шанс (0,8559 \ ldots) ^ \ приблизительно 9,7 \% $ выиграть первые игры с $ 15 $. Это не противоречит тому, что вы сообщаете, что может побудить нас продолжать предполагать, что результаты по каждому пункту независимы. Таким образом, мы предполагаем, что у вас есть шанс

выигрыша во всех оставшихся играх по $ 35, при условии, что они будут действовать в соответствии со всеми этими предположениями. Это не звучит как хорошая ставка, если только выигрыш не будет большим!

Мне нравится проверять такую ​​работу с помощью быстрой симуляции.Вот код R для создания десятков тысяч игр в секунду. Предполагается, что игра закончится в пределах 126 очков (очень немногие игры должны продолжаться так долго, поэтому это предположение не оказывает существенного влияния на результаты).

Когда я запустил это, вы выиграли в 8 570 случаях из 10 000 итераций. Z-оценка (с приблизительно нормальным распределением) может быть вычислена для проверки таких результатов:

Значение 0,31 доллара в этой модели полностью согласуется с приведенным выше теоретическим расчетом.

Приложение 1

В свете обновления вопроса, в котором перечислены результаты первых 18 игр, здесь представлены реконструкции игровых путей, согласующиеся с этими данными. Как видите, две-три партии были опасно близки к проигрышу. (Любой путь, заканчивающийся светло-серым квадратом, - это потеря для вас.)

Возможное использование этого рисунка включает наблюдение:

Дорожки концентрируются вокруг склона, заданного соотношением 267: 380 общих баллов, что примерно равно 58,7%.

Разброс путей вокруг этого склона показывает изменение, ожидаемое, когда точки независимы.

Если точки нанесены полосами, то отдельные пути будут иметь длинные вертикальные и горизонтальные участки.

В более длинном наборе похожих игр ожидайте увидеть пути, которые, как правило, остаются в пределах цветного диапазона, но также ожидайте, что некоторые из них выходят за его пределы.

Перспектива игры или двух, чей путь обычно лежит выше этого спреда, указывает на вероятность того, что ваш противник в конечном итоге выиграет игру, вероятно, скорее раньше, чем позже.

Приложение 2

Был запрошен код для создания фигуры. Вот он (очищен, чтобы получить более красивую графику).

Используя биномиальное распределение и предполагая, что каждая точка независима:

Вероятность того, что игрок с $ 58 \% $ получит 21 $ за первые 40 $ очков (с учетом того факта, что должно быть выиграно последнее очко), равна $ \ sum_ ^ 0,58 ^ 0,42 ^ $ $ = \ сумма_ ^ 0,58 ^ 0,42 ^ $ \ приблизительно 0,80695 $

Вероятность $ 58 \% $ игрок получит $ 20 $ из $ 40 $ сыгранных очков является биномом $ 0,58 ^ 0,42 ^ \ приблизительно 0,074635 $. При этом вероятность того, что игрок $ 58 \% $ выиграет с разницей в два очка, будет $ \ frac \ приблизительно 0,656006 $.

Таким образом, общая вероятность того, что игрок выиграет $ 58 \% $, составляет около $ 0,80695 + 0,074635 \ раз 0,656006 $ \ приблизительно 0,8559 $.

Вероятность того, что игрок с $ 58 \% $ выиграет первые игры с $ 15 $, тогда составляет около $ 0,85559 ^ \ приблизительно 0,0969 $, что довольно маловероятно. Вероятность того, что игрок с $ 58 \% $ выиграет последние игры с $ 35 $, составляет около 0,85559 $ \ приблизительно 0,0043 $, что очень маловероятно.

Я пришел с вычислительным ответом. Вот функция R, которая имитирует игру в пинг-понг, в которой победитель должен выиграть с 2-мя выигрышами. Единственным аргументом является вероятность того, что вы выиграете очко. Он вернет окончательный счет этой игры:

Давайте сначала убедимся, что это работает, смоделировав 10 000 игр, в которых у вас есть 50% шанс выиграть каждое очко. Мы должны заметить, что ваш процент выигрыша составляет около 50%:

Это возвращает 0,4955, чего мы и ожидали. Итак, давайте подключим ваши 58%:

Это возвращает .8606. Таким образом, у вас есть примерно 86,06% шанс выиграть одну игру.

Теперь мы можем смоделировать 35 партий игр и посмотреть, сколько раз вы выиграете все 35:

Это возвращает 0,0037, что означает, что у вас есть шанс примерно 0,37% на победу в следующих 35 играх. Это предполагает, что все игры и все очки независимы друг от друга. Вы можете явно запрограммировать это в функции выше, если хотите.

Примечание: я делаю это на лету. Я уверен, что есть более эффективный с точки зрения вычислений способ программирования.

Должны ли мы предполагать, что 58% -ный шанс на победу фиксирован, а очки независимы?

Я считаю, что ответ Уубера хорош, красиво написан и объяснен, если учесть, что каждый пункт не зависит от следующего. Однако я считаю, что на практике это только интересная отправная точка (теоретическая / идеализированная). Я полагаю, что на самом деле очки не независимы друг от друга, и это может сделать более или менее вероятным, что ваш оппонент-сослуживец одержит победу хотя бы один раз из 50.

Сначала я представил, что зависимость очков будет случайным процессом, то есть не контролируемым игроками (например, когда один выигрывает или проигрывает, играя по-разному), и это должно привести к большему разбросу результатов, что поможет более слабому игроку получить это один балл из пятидесяти.

Вторая мысль, однако, может подсказать обратное: тот факт, что вы уже «достигли» чего-то с вероятностью 9,7%, может дать некоторую (но лишь небольшую) пользу, с байесовской точки зрения, идеям о предпочтении механизмов, которые помогут вам вероятность выигрыша выше 85% (или, по крайней мере, уменьшить вероятность того, что ваш противник имеет гораздо более высокую вероятность, чем 15%, как утверждается в предыдущих двух параграфах). Например, может получиться так, что вы набираете больше очков, когда ваша позиция менее хороша (неудивительно, что люди, набирающие гораздо более разные по матчевым очкам, за или против, чем по обычным очкам). Вы можете улучшить оценки 85%, приняв во внимание эту динамику, и, возможно, ваша вероятность выиграть игру превышает 85%.

В любом случае, было бы неправильно использовать эту простую статистику балловдля ответа. Да, вы можете это сделать, но это будет неправильно, поскольку предпосылки (независимость баллов) не обязательно верны и сильно влияют на ответ. Статистика 42/58 является дополнительной информацией, но мы не очень хорошо знаем, как ее использовать (правильность модели), и использование этой информации может дать ответы с высокой точностью, которой на самом деле нет.

Пример

Пример: столь же разумная модель с совершенно другим результатом

Таким образом, гипотетический вопрос (предполагающий наличие независимых точек и известных теоретических вероятностей для этих точек) сам по себе интересен, и на него можно ответить, но просто для того, чтобы вызвать раздражение и скептически / цинично; ответ на гипотетический случай не имеет такого отношения к вашей основной / исходной проблеме, и, возможно, именно поэтому статистики / специалисты по данным в вашей компании не хотят давать прямой ответ.

Просто чтобы привести альтернативный пример (не обязательно лучший), который дает сбивающее с толку (контр-) утверждение: «В: какова вероятность выиграть все 50 игр, если я уже выиграл 15?»Если мы не начнем думать, что «баллы 42/58 уместны или дают нам более точные прогнозы», тогда мы начнем делать прогнозы вашей вероятности выиграть игру и предсказывать, что вы выиграете еще 35 игр, исключительно на основе ваших ранее выигранных игр. 15 игр:

  • с байесовской техникой для вашей вероятности выиграть игру это будет означать: $ p (\ text ) = \ frac >>$, что составляет примерно 31% для равномерного априорного значения f (x) = 1 , хотя это может быть слишком оптимистично. Но все же, если вы рассматриваете бета-распределение с $ \ beta = \ alpha $ между 1 и 5, вы получите:

это означает, что я не был бы столь пессимистичен, как простой прогноз на 0,432%.Тот факт, что вы уже выиграли 15 игр, должен повысить вероятность того, что вы выиграете следующие 35 игр.

Примечание на основе новых данных

Основываясь на ваших данных по 18 играм, я попытался подобрать бета-биномиальную модель. Варьируя $ \ alpha = \ mu \ nu $ и $ \ beta = (1- \ mu) \ nu $ и вычисляя вероятности получить балл i, 21 (через i, 20) или балл 20,20, а затем суммируйте их журналы до оценки логарифма правдоподобия.

Это показывает, что очень высокий параметр $ \ nu $ (небольшая дисперсия в базовом бета-распределении) имеет более высокую вероятность и, следовательно, вероятно, есть небольшая избыточная дисперсия. Это означает, что данные не предполагают, что лучше использовать переменный параметр для вашей вероятности выигрыша очка вместо фиксированного 58% шанса на выигрыш. Эти новые данные обеспечивают дополнительную поддержку анализа Уубера, который предполагает оценки, основанные на биномиальном распределении. Но, конечно, это по-прежнему предполагает, что модель статична, а также что вы и ваш коллега ведете себя в соответствии со случайной моделью (в которой каждая игра и каждая точка независимы).

Оценка максимального правдоподобия для параметров бета-распределения вместо фиксированного шанса на победу 58%:

ПОПУЛЯРНЫЕ СТАТЬИ