• <small id='eu5zta28'></small><noframes id='romrp4r7'>

      <tbody id='seotfj4t'></tbody>
    在线棋牌游戏代理-从博弈论的角度分析诈(1):在什么情况下应该诈
    作者:admin 发布时间:2020-08-17 15:00

    从博弈论的角度分析诈(1):在什么情况下应该诈

    本文的主要内容

    数学背景

    最佳策略

    纳什均衡

    诈uff是扑克游戏的重要组成部分。每个好的球员都应该牢记。永远不要虚张声势或虚张声势,对于扑克玩家来说棋牌微信送红包,这是一个巨大的错误。如何找到合适的平衡点?什么时候虚张声势是理想的选择?什么时候,您可以以何种频率虚张声势某些玩家玩获利的扑克?

    本文将介绍诈uff的数学背景,并用博弈论来解释一些策略。

    我应该虚张声势吗?

    你在河上卡面为69KA5。

    您确定您的对手有帮助。从他的举动中,你认为他可能患有AA,KK或AK。你的手是J10。

    您的抽奖失败。底池是$ 100,您和您的对手每人还剩$ 100,你先行动当您检查时,您将输掉。(如果对手也检查,您将输掉摊牌; 如果对手下注,您没有足够的钱来虚张声势。)

    假设对手读了你的牌,在河边他猜你在画画。为简单起见,让我们假设他有80%的概率您将无法通过同花或弃牌。还有87%的可能性是20%在河上直奔。

    如果你有87打直,你应该赌值不幸的是你没有。您有两种选择:检查并放弃,或者尝试虚张声势赢得彩池。假设你在虚张声势,将支付全部$ 100,哪一个锅你应该多虚张声势?

    这个问题的答案是什么?

    为了回答这个问题,我们需要使用一些数学工具。别担心,不太复杂您只需要一些代数知识和一些常识即可。差点忘了,还有博弈论但是将仅使用常识部分。

    把问题变成数学

    我们将使用一些符号。P代表锅的大小,B代表下注大小。q代表对手认为您会赢得一手的可能性。在我们的例子中P = $ 100,B = $ 100,q = 0。20如果您对20%的数字不满意,可以更换,计算方法相同。相同,您还可以更改底池大小和下注大小。

    我们需要使用符号来指示虚张声势的频率和对手呼叫的频率。x代表虚张声势y表示跟注的几率。如果我们有30%的虚张声势(x = 0。3),从长远来看, 我们诈的频率是30%。相同,y表示对手会跟注我们下注的频率。

    因此,我们的最初问题是找到x的最佳值。

    预期收益和纯策略

    首先,回到原来的问题。我们玩扑克的目标是什么?赢钱。确切地说,是为了赢得尽可能多的钱。做出决定时,我们必须问自己,哪个动作将获得最大的预期收益?

    在这个例子中如果你有胜利之手,您将进行价值下注。打赌后对手可以叫(y),也可以折叠(1-y)。

    他打电话的时候您将赢得现有彩池,再加上对手叫的钱,那就是P + B。他折叠时您只会赢得现有底池,那是P。(现有彩池通常是指您下注之前彩池的大小。)因此,如果你有胜利之手,您的预期收益Ew(代表获胜)为

    Ew = y(P + B)+(1-y)P

    如果您的手输了(平局失败),情况将变得更加复杂。你可能虚张声势(x),也可以检查并放弃(1–x)。

    当你选择虚张声势时,对手可能仍会跟注(y),或折叠(1-y)。他打电话的时候您将输掉这个赌注,因此,您的净回报为负,那是-B。他折叠时您将赢得现有彩池,那是P。所以当你虚张声势时您的预期收益将包括两个部分:

    (1–y)P–yB

    如果您选择检查(放弃手),一分钱都不会赢因此,在这种情况下,您的预期收益为0。

    综上所述,当你的手输了的时候您的预期收益El(l代表亏损)为

    El =(1-x)0 + x[(1-y)P-yB]

    由于第一部分为0,我们可以忽略它,公式变为:

    El = x[(1-y)P-yB]

    假设您知道您的对手永远不会跟注(y = 0),您的预期收益公式也可以简化为:

    El = xP

    为了使预期收益最大化,您必须让x = 1,这意味着您应该每次虚张声势。

    但,如果对手总是跟注(y = 1),您的预期收益公式将变为:

    El = –xB

    在这些情况下,为了使预期收益最大化首充送50棋牌游戏,您必须让x = 0,这意味着您永远不要虚张声势。(所以明白吗?切勿虚张声势呼叫站。)

    上面的计算是要知道对手在两种特殊情况下会采取什么策略,然后是响应的结果,但是这两种情况非常极端,因此,此策略称为纯策略。在真正的扑克游戏中对手会更加不稳定他会以一定的频率跟您下注(y不会为0或1)。他将采取混合策略。

    最佳策略

    对手可以选择通话频率y,无论您使用哪种策略(即, 无论x是什么),预期收益不会改变。我们使用yopt表示此调用频率(在某种程度上,yopt是y的最佳值。)

    yopt很容易计算,下一篇文章将对此进行讨论。

    yopt = P /(P + B)

    在我们的例子中P = B = $ 100,因此yopt = 1/2。如果对手有一半的跟注机会,你不能打败他。如果对手按照y = yopt的策略进行比赛,您的预期收益为

    El = x[PB /(P + B)–PB /(P + B)]= 0

    (这是将yopt纳入寻找El的公式中)

    此时,无论您选择哪种策略(无论x是多少),您的预期收益均不会上升或下降。

    有趣的是,yopt仅取决于底池和下注的大小。不受q的影响(q代表对手认为您会赢得一手牌的可能性)。这表明yopt并不总是y的最佳值。例如, 当q = 1时那是, 您的对手肯定您有获胜的手,目前,他的通话频率不会有一半,因为他根本不会打电话。他将使用y = 0策略。

    我们待会再说,在什么情况下才是最佳价值。

    相同,您也可以选择一个x让对手选择任何策略(无论y是多少),他的预期回报是相同的。我们使用xopt表示这个特殊的x。但,找到xopt的价值将更加复杂,它的公式是

    xopt = qB /[(1-q)(P + B)]

    如果你经常用失败的牌虚张声势,对手的预期收益是

    Eop =(1-q)P-qPB /(P + B)

    这个公式没有y因此,对手的预期收益不会改变。

    在我们的例子中 P = B = $ 100,q = 0。2,因此xopt = 1/8。如果您有1/8的诈可能性,你的对手无法击败你,即使他很细心了解您的策略(知道x = xopt)。如果您的虚张声势频率高于或低于1/8,细心的对手将利用您策略中的漏洞。所以当你面对一个非常好的对手时,xopt可以确保您的策略是最佳的。

    一个好的对手多久跟您下注一次?yopt是答案。如果您按照x = xopt的策略进行游戏,他没有选择任何游戏风格来增加或减少预期收益。如果对手没有使用y = yopt策略进行比赛,你可以看到他的漏洞,利用他的错误,选择对剥削的最佳反应。

    只有当他的y = yopt时,你不能剥削他无论此时使用哪种游戏风格,您的预期收益不会改变。

    记得,如果您不使用xopt的策略,对手还将调整游戏以利用您的漏洞。

    现在您知道xopt和yopt何时是最佳值:对手无法利用您时。在博弈论中这两种策略(xopt,yopt)称为纳什均衡点。这是博弈论和经济学中非常重要的概念。(是,电影《美丽的心灵》中的纳什1994年诺贝尔经济学奖获得者)。现在您知道它在扑克中也起着重要作用

    血流成河棋牌平台 对手 棋牌软件站 宇恒棋牌 在线棋牌游戏代理
      <tbody id='mc05l01i'></tbody>
  • <small id='2sq1dvkl'></small><noframes id='vlznjay9'>

  • <small id='wys3pf2p'></small><noframes id='41vrx3i1'>

      <tbody id='3ttabwqv'></tbody>