Answer: D. 这个问题是一个比较简单的问题,只需要用Bayes公式计算一下即可。 但是人们有时候感觉这个概率比实际中的大。类似的问题还出现在比如当你检测出来患有某种疾病的时候,假设检测错误的概率只有千分之一,但是如果那个患有那个疾病的人本身只有万分之一或者更少,则你实际得这种病的几率也要比10% 要略少。另外的一个情况我在我的另外一篇日志<<Do say love to her>>中也提到了。总的来说,人们通常更多的关注到了事情的变化,而忽略了一些事物的本质。
Answer: A. 从某种意义上来讲,这个题不能被认为是一道概率问题,因为其真正的难度不在于概率。似乎看起来这道题完全无法计算,因为你完全不知道每只蚂蚁的方向以及所处的位置,但是关键在于注意到当两只蚂蚁碰面时,虽然实际中他们互换了 方向,但是从运动的角度来讲,可以认为两只蚂蚁继续保持了前进但互换了代号。所以这个题相当于在0-1之间有5个随机数,问其中最大的期望是多少。这个数为5/6, 所以答案为A。
Answer: A. 也许有些人会对这个答案感到有些吃惊。先选的人居然如此吃亏。因为人们可能会认为,在这些序列中,有一个最优的序列,它出现的平均时间最早。这确实不错,但是序列之间不是独立的,也就是说如果A比B好,B比C好,并不一定能保证A比C好。比如第一个人选了“国徽,国徽,数字”这个序列,那我选择“数字,国徽,国徽”就可以保证在他这个序列出现之前的那3个情况中,我大约有1/2的概率可以获胜(也即在这个序列之前的那次硬币为数字即可)。这个题只能用Markov链去计算任何两个序列对抗时分别的获胜率,然后用博弈论的方法去求解。对于第一个人来说,最佳的选择可使他有1/3的概率获胜。
Answer: B. 在上一系列的概率论感觉测试的题目中,我们问在整个过程中,某一方一直领先另一方的概率。这个题只要求一方(有5块钱的人)不落后另外一方(有10块钱的人)。这个的算法是需要用brownian motion的reflection principle。实际上的比例为从0开始每一步为-1,1运动最后停到-2的路径数除以停到0的路径数,为1/51.
8. 假设你掷一枚硬币,问你期望需要掷大约多少次才能获得连续10个正面?
A. 100 次
B. 500 次
C. 1000 次
D. 2000 次
Answer: D. 在上一系列的概率论感觉测试中,我们说掷n次大概连续证明的数量为log_2^n.现在问的是要获得一定量的正面,需要掷多少次。结果比较接近但是仍然不是很相同,准确的数字为2^(k+1)-2,也就是2046次。简单的证明方法可以用数学归纳法。而比较推荐学过martingale的同学用martingale的方法证明:假设每一时刻有1个人来赌,如果正面,他的资金翻倍,否则就为0;当连续出现10个正面的时候,所有来赌的人的钱为2046。根据Optional Stopping Theorem, 所需要时间的期望也是2046。Martingale方法的好处是可以计算达到任何序列所需要的时间。
Answer: A. 这个题应该算比较经典的一道题目,但是并不能算是一道纯粹的概率题。这种类似于脑筋急转弯的题目需要人们能注意到一些简化的方法。思考的方法大约如下:对于第一名乘客,如果他恰好坐在自己的座位上,则最后一名乘客肯定也能坐在自己的座位上,如果他恰好坐在了最后一名乘客的作为上,那最后一名乘客无论如何也无法坐在自己的位子上,而这两个概率是相等的;对于其他情况,如果他坐了第k个乘客的座位,则从第2到第k-1个乘客,他们都会坐在自己的位子上,问题变相当于飞机一共有101-k个座位,第一个乘客(原来的第k个)随机选一个座位。这样递归下去可以得到不管有多少座位,以上的问题的概率都是1/2。
Answer: B. 也许答案对很多人有些出乎意料。在这种情况下,可能有人觉得能够连续赢很多把很难,但是实际上赢一把大的更难。这个问题是随机问题中的长尾和短尾的问题。长尾的意思就是取大的值的概率不是很小,而短尾正好相反。但是题目中的正态分布属于短尾,因为密度函数是指数下降的,如果稍微改一下题目中的分布,则有可能是因为一次赢了很大而最后赢的。另外说一句,有一本书叫《长尾理论》,里面说明了现在的经济中有很多东西是长尾的,比如说一年销量排在100000名之后的歌曲仍然能占据市场的一部分。这是电子商务流行的很重要原因,因为不必支付储存这个长尾的cost。
Answer: A. 也许这个也略有些意外。对于一维的情况,方法A略好于方法B。但是在高维的情况下方法A就一般情况下不如方法B了,原因是要想获得相同的效果,这个“有规律的点”需要选取太多。这是所谓的Quasi-Monte Carlo Sampling 和 Monte Carlo Sampling之间的关系
Answer: A. 不管什么赌法都不会改变这个概率。我认为这是随机过程中一个比较简单但是很有意义的结论,意思就是说you can't beat the system。这件事情说明了对于像股市,赌博这种系统,如果你假设了随机性,则其实怎么操作结果都是一样的。因此重要的在于发掘其中的非随机性。另外,到100的概率很容易计算,因为初始值是10,假设到100的概率为p,则有100p*0(1-p)=10,也即p=0.1
Answer: D. 这个可以用中心极限定理计算。事实上这个题也不需要计算,只是要考察大家的一个感觉,实际上这个概率大于0.99...9,一共有9个9,尽管有时候我们打牌仍然觉得牌总是很差。。只是我们不注意我们抓好牌的时候罢了。
8. 有以下几个国家,每个国家有自己的习俗。问哪个国家长期以后男人最多
A. 每个家庭不断的生孩子直到得到第一个男孩为止
B. 每个家庭不断的生孩子直到得到第一个女孩为止
C. 每个家庭不断的生孩子直到得到一男一女为止
D. 以上几个国家最后男女比例基本一样
Answer: D. 我们只需要考察一个家庭最后产生多少男女即可以。用概率的方法可以得到不管哪个方法都是1:1。事实上,我们只是把一个很长的男女的序列按照不同的方式来截断。当然这个序列本上包含多少男女是不变的。我每次都愿意以另外一个例子来说明,那就是如果我们在网上下棋,可以每天下到第一盘输为止或是第一盘赢为止或是有输有赢为止,显然不管怎样,因为你的实力是恒定的,你永远都是你本来应有的胜率。
A. 那个灯泡的寿命期望也约为1小时
B. 那个灯泡的寿命期望约为其他灯泡的2倍
C. 那个灯泡的期望寿命约为其他灯泡的1/2
D. 以上说法都不对
Answer: B. 这个题可能稍难。如果具体的算需要一点本科高年级的知识。不过我们仍然可以从直觉得到结果。事实上,当每个灯泡或是我们观测的事物的生命是随机的时候。在时间足够久以后的一点,那个事物的寿命要长于这个事物本身平均的寿命。因为正是因为它寿命长导致我们容易观测到。简单的说,如果灯泡有两种,一种只能坚持 1小时,一种能坚持100小时,那我们在后面观测到的99%都可能是100小时那个。所以观测到的平均寿命较长。通常我们认为灯泡的寿命是指数分布的,在这个情况下,答案是2倍。对于一般的分布,甚至有可能平均寿命有限,而观测的那个寿命期望是无限的。这个问题在美国一次监狱调查中被发现,即被调查的囚犯的平均判刑年数要远大于全美平均判刑的年数
A. 这个群体最后会灭绝
B. 这个群体最后将稳定在一个分布,即种群大小在一定范围内震荡
C. 这个群体最后将爆炸,人口将到无穷
D. 不一定会发生什么
Answer: A. 这是个简单的人口模型。这个可能直觉比较困难,但是这个实际上和后面的一道题道理是一样的。注意到每一代的期望总是1。因此根据上次的答案,这个群体最后会灭绝。对于这种模型,当每一代的期望小于等于1时,最后的结果都是会灭绝。对于期望大于1的情况,我们也可以很简单的通过解方程得到灭绝的概率。
Answer: A. 这个题要去算有几个相同的概率是比较难的,不过实际上有一个很简单的方法。在第1个位置,这个排列的第1个数字为1的概率为1/n,而期望是可加的,所以总共与原来位置相同的数字的个数的期望应该是1。也就是说不管是多少的数字,平均总是有一个数与顺序是相同的。这个题会非常经常出现在考试和习题中。
Answer: A. 这个是网上非常经典的一个问题了。不换正确的概率是1/3,换正确得概率是2/3。我比较喜欢这样去想,试想一下如果有100个门,你先选定1个,然后主持人打开98个空的,然后给你机会换不换。我想如果这样,你不难做出正确的选择。
13. 以下那件事情发生的期望时间最短
A. 在第0秒,一个物体从原点出发,每一秒以概率1/2向左走,1/2向右走,第一次回到原点的时间
B. 一只猴子,每秒种随便按键盘上的一个键,第一次打出"Beijing WelcomesYou"的时间
C. 在第0秒,一个物体从原点出发,每一秒以概率1/2向左走,1/2向右走,第一次到达1的时间
Answer: B. A和C两个事件发生的时间的期望都是+inf. 只有B是有限的。A和C说明了等概率的赌博不可能赢钱(如果C是有限的则参加赌大小的游戏总能赢钱了)。而B说明的是另外一条概率上的定理,"What always stands a reasonable chance of happening will almost surely happen, sooner rather than later",也就是说从任何时刻开始,总有一个固定的概率发生的事情(比如一个猴子打出beijing welcomes you, 这个概率可能是 1/26^20左右),不过这个概率是多少,这件事情早晚能发生。
Answer: A. 这是所谓的收集硬币问题。具体解法不是很容易。不过结论是要收集齐n种硬币,需要大约nlogn个。大约思路是收集第k个时候需要大约n/(n-k)次。平时我们收集一些食品里的卡片,也都遵循这个规律,不过多数时候每种卡片的数量都是很不同的。还记得小时候可乐里收集到苹果加蜡烛可以得到到头等奖,不过最后也没收集到任何一个苹果。
Answer: C.这个可以参见我转载的文章The Flaw of Average和我写的文章Life is a Martingale. 也就是说对于很多投机的东西,平均值总是不变的,但是多数人都会倾家荡产。其实仔细想想很有道理,比如说你的股票第一天涨10%。第二天跌10%或是第一天跌10%,第二天涨10%,最后的结果都是跌了1%。所以要保持增长所需要的是远大于0的平均变化率,这个才是一般人难以做到的。
20. 当我们考虑一种可能重复发生的事件时,哪种方式更科学
A. 按照第一次发生这个事件的时间作为一个起点,考虑从其本身出发之后的性质
B. 按照最后一次发生这个事件的时间作为一个起点,考虑从其本身出发之后的性质
C. 以上都可以
D. 以上都不可以
Answer: A. 这个问题深一些的背景在于Kolmogorov向前向后微分方程。很多人知道向后微分方程更通用,但是并不知道原因。事实上,向后微分方程是基于A的方法对事件进行分解得到的,而向前微分方程是基于B的方法对事件进行分解的。但是有很多重复发生的事情会越发生越频繁,以致没有最后一次发生的事件。但是我们总能找到第一次发生的时间。所以A更科学。
5:44 AM | Add a comment | Read comments (1) | Permalink | Blog it
March 23
概率论感觉测试(完全版)
*上一次写完之后我加了一句to be continued, 后来实在是没有太多可以想到的问题。这次我把所有的题都放到了一起,前面的5道是新的题,后面都是原来已经写过的,一共20道,以后就不打算再写了*