1 авг. 2021 г., 00:09

Есть просьба к присутствующим здесь теннис-ставочникам. И ДимКу, конечно, если он не против. Мог бы кто-нибудь предоставить т.н. точечную диаграмму для предматчевых кэфов выигрышей. Скажем, чтобы по горизонтали был кэф на выигрыш по геймам, по вертикали - кэф на выигрыш по сетам.
И сам бы сделал, да базой данных по теннису не располагаю. :(

Поясню зачем надо.
Меня интересует, действительно ли я допустил чрезмерно грубое приближение, приняв что вероятности выигрыша по сетам и по геймам тесно связаны? Представил что можно практически на равных рассматривать как одну, так и вторую формулировки, что обе они интересны:

  • как одновременно у игрока может быть меньше шансов выиграть матч (по сетам), но в то же время больше шансов пробить фору? (при одинаковом тотале)
  • как одновременно у игрока может быть меньше шансов выиграть матч (по геймам), но в то же время больше шансов пробить фору? (при одинаковом тотале)

Или же подобная подмена вопроса недопустима ни в том частном, ни в общем случае?
Пожалуй, это единственное что можно обсуждать, потому как по остальным явно и/или неявно используемым мной приближениям претензии ДимКа так и не смог понять.

@DimOK
А по поводу одержимостью усложнений где ни попадя, вот простой пример.
Возьмём некую функцию, например f = 3*(x+y) + e(t), где e(t) - некая погрешность, и будем считать что f - наблюдаемые данные, тогда как x,y ненаблюдаемы. При этом мы предполагаем два варианта для её параметров, тоже наблюдаемых: a=x, b=x+y. Если мы попытаемся аппроксимировать f через них, получим что f = 3*b + 0*a + e'(t), т.е. якобы f не зависит от a (т.е. от x). Хотя, безусловно, рост наблюдаемого a в общем случае должен приводить к росту наблюдаемого f.
Более простая модель показала бы что f = 3*a + e"(t).
Выходит, более сложная модель дала нам "неверное" представление о зависимости f от a. И вообще анализ сложных моделей со всеми их взаимозависимостями очень сложен, и подход по типу: тут в модели кэф положительный, значит влияет положительно, тут отрицательный, значит влияние отрицательно, в общем случае, мягко выражаясь, плохо обоснован. Выяснить какой из 500 разных факторов модели является главным, насколько он главенствует и, что самое важное, почему - весьма непростой вопрос, зачастую невыполнимый без применения более простых моделей. И "нахождение" или хотя бы поиск ответа "почему" в таких сложных моделях зачастую является спекулятивным.
Сложные модели нужны для аппроксимаций, но анализировать их трудно. Как правило, для анализа более подходят упрощённые модели - они прозрачнее и нагляднее.

В том же футболе модель, всегда и везде дающая на 1X2 40-25-35% любым соперникам, можно назвать плохой, но она вполне состоятельна в рамках своих абстракций, своих приближений. И говорить что она не заслуживает вообще никакого внимания, что это "математика вместо спорта", что модель только тогда является моделью, когда дотошно учитывает все ньансы игры, включая влажность газона и влияние старых травм игроков - ну, не стоит так. Её вполне достаточно, чтобы показать что у хозяев есть преимущество - более сложной модели в общем случае не потребуется.