◇◇新语丝(www.xys.org)(xinyusi.org)(groups.google.com/group/xinyusi)◇◇   民意调查结果还可信吗?   ·方舟子·   (2020年大选回顾。众所周知,在2020年美国大选期间,我做了不少选情分 析,后来都被证明是准确的。我将陆续把当时录制的有关大选的视频整理出来, 对分析本次大选也有参考价值。)   今天又有一批关于美国总统选举的民意调查公布,平均下来现在拜登比川普 要领先10个点。这比在几天前只领先7个点高,证实了我以前的说法:川普总统 被新冠病毒感染并没有赢得美国普通民众的同情心,反而对他的选情不利。   每次谈到民意调查,就总有一些人表示不相信,说民意调查如果可靠的话, 那么现在的总统就是希拉里而不是川普了。   大家首先要了解一下民意调查的常识。全国总统民意调查是在美国全国抽查 一、两千人问对这一次美国大选要选谁。有人说,美国有三亿人口,才问一、两 千个人,怎么能够说明问题呢?如果学过概率与统计就知道,在统计学上有公式 可以算出,要做这种民意调查,只要抽查1000人左右就足够了。抽查的人越多, 误差会小一点,如果人数偏少,误差会大一点。如果要把误差控制在2~3%,抽 查一、两千人就够了。关键的问题不在人数的多少,而是抽查必须是随机的,而 且样本应该有代表性。   涉及到选举问题,代表性就很关键。这是因为不同的人群倾向性是不一样的, 并不是均匀分布。不仅选民属于民主党还是共和党会有党派的倾向,性别、族裔、 年龄、教育程度等也是影响投票倾向性的因素。所以在做完民意调查之后,还要 根据这些人群在全国占的比例,也就是所谓的“权重”,做一定的校正。这就涉 及到方法问题了:不同的调查机构用的抽查方法、校正方法不太一样,这样结果 就会出现一定的偏差。   所以,单一的民意调查不一定可靠。但是,对于美国总统大选有很多机构都 在做全国性民意调查,把他们的结果综合起来平均一下,偏差基本上可以抵消了。 一般认为,各个调查机构在一定时期内平均的结果是比较可靠的。我们下面谈的 民意调查的结果,如果不特定说明的话,指的就是各家机构的平均调查的结果。   那么,经常被提到的2016年美国总统大选的民意调查结果究竟是不是可靠?   很多人认为,如果民意调查的结果是可靠的,现在的总统就是希拉里了。很 多人因此否定民意调查。的确,在2016年大部分的人、包括很多的专家都预测希 拉里会赢。但是预测和民意调查结果不完全是一回事,虽然很多预测是根据民意 调查结果做出来的。2016年全国性的民意调查的结果,最后是希拉里领先川普3 个点(3%),投票的结果是希拉里赢了川普3个点(2%)。说明民意调查的结果 实际上是非常准确的。   希拉里赢了2%,为什么反而是川普当总统?因为美国的选举制度非常特殊, 并不是数全国的票数,如果那样就是希拉里当总统了;而是由所谓的“选举人团” 来投票,选举人团的票数是按州来分的。所以决定美国总统选举的不是全国的, 而是各个州的投票的情况,最主要的就是十个左右所谓的“战场州”。所以,除 了看全国的民意调查的情况,还要看所谓的战场州的民意调查的情况。大多数的 州或者选民主党,或者选共和党,是肯定的,战场州摇摆不定,谁当总统基本上 是由它们决定的。   2016年州的民意调查的情况比全国的民意调查不准确。主要的原因是,做全 国民意调查的机构非常多、非常的频繁,甚至一天就会做一次;但是州的民意调 查做得很少。美国有50个州,再加上一个特区,即使只做十个州的民意调查,相 当于比全国民意调查多了十倍的工作量,因为即使做州的民意调查,也要抽查 1000人左右。所以做州的民意调查的机构就比较少,而且做得没那么频繁。这样 的话就导致州的民意调查结果不像全国的结果那么准确。   还有一个原因。如果我们仔细看一下某个州的民意调查的结果,就会发现, 其实民意调查的结果对希拉里的结果是非常准确的。比如说我们看一个很关键的 战场州——威斯康星,2016年最后的民意调查的结果是希拉里有46.8%的支持率, 比川普多出了7%,这个差距很大了。   但是,民意调查表明还有很多人表示要投给第三方候选人(当时有绿党、自 由主义党在竞争),或者表示自己还没有确定,而实际上这些人大部分都想要投 给川普,或者不好意思说,或者还没定下决心。到最后投票的时候,这些人纷纷 去投川普了。最后川普反而赢了一点点,是47.2%。所以,不准的原因是低估了 川普的支持率。   今年(2020年)的民意调查的结果跟2016年有什么不一样?为什么2016年的 情况不太可能在今年重演?首先,拜登跟川普的差距要比希拉里领先川普大很多。 现在拜登比川普高出了10个点,而上一届同一个时期希拉里只比川普高出了5个 点。可见现在拜登的优势要比希拉里明显得多。   其次,拜登的支持率非常稳定,这一年来基本上没有什么波动,一直保持领 先,只不过有时候领先多一点,有时候领先少一点。而希拉里的民意调查的结果 是大起大落,有时候比川普领先很多,有时候领先很少、基本持平,偶尔还会落 后于川普。   第三,拜登的支持率基本上达到了50%甚至更高了。也就是说,这一次大选 向做民意调查的人说自己“还没确定”的人数非常少。而且这一次也不像上次那 样,没有第三方来搅局。那么,由于拜登票数已经达到了50%甚至更高了,那些 不确定的票数即使绝大部分都投给了川普,也不太可能超过拜登。   这说的是全国的民意调查情况。我刚才说了,还要看战场州的民意调查的情 况。目前十来个战场州,拜登绝大部分也都是领先的,而且情况跟我刚才说类似, 例如在威斯康星,拜登现在的支持率已经达到50%了,说还没确定的、想投给川 普但不好意思说的那些人已经很少了。所以这个差距已经很明显了。   别看川普、川粉老说民意调查不可靠,但实际上他们也是相信民意调查的结 果的。比如说,川粉喜欢传一些网络的投票,说网络投票的结果表明了川普大大 地领先于拜登。其实那种网络的投票才是靠不住的,因为网络投票不像专业的民 意调查那样是随机抽的,而是很有倾向性:在某一个网站做的网络投票,跟网站 的读者群是什么样的很有关系,跟拉票、投票的热情也很有关系。甚至有一些网 站的投票是可以反复投的:如果有一个人发了疯不停在那里刷票,当然就把某一 个候选人的票给刷上去了。所以,网络投票看上去好像投的人很多,比民意调查 抽查的人还要多,几万甚至十几万,但是它不是一种科学的民意调查,人数再多 也不能说明任何问题。其实川普、川粉也知道这个道理,所以,专业的民意调查 如果有哪一个做出的结果是川普领先了拜登,他们马上就转。   其中川普最喜欢转的,是一个叫做“拉斯姆森”的民意调查机构。拉斯姆森 在上一届大选做出的民意调查结果跟别的民意调查的结果是相反的,是川普领先 希拉里2%,于是就自称是“最准确的民意调查机构”。其实是最不准确的,投票 结果实际上是希拉里赢了2%。但不管怎样,它认为预测对了川普会当选,所以就 自认为是最准确的。它的方法可能有问题,因为它的各种各样的民意调查的结果 都是偏向川普的。比如说,各个民意调查机构的调查结果,川普执政的赞赏率从 来没有达到50%,都是40%左右;但是拉斯姆森偶尔会让川普的赞赏率达到50%, 而一达到50%川普必转。这说明,川普其实是很看重专业的民意调查的,虽然是 比较另类的民意调查机构。   拉斯姆森今天公布了它最新的民意调查的结果,拜登居然比川普领先了12个 点,比平均还要高。那就是说,今年已经没有专业的民意调查会去做出对川普有 利的结果了,所以连川普最信任的、最喜欢的民意调查机构做出来的结果也认为, 拜登目前大幅度地领先川普。   既然现在民意调查的结果认为拜登大幅度领先,那么我们能不能说拜登就必 胜无疑呢?不能这么说。民意调查查的是现在的情况,如果现在就投票的话,那 么拜登是肯定会赢的,甚至能够领先川普大约10个点。但是可惜的是,投票不是 在今天投的。虽然有一些地方已经开始陆陆续续地提前投票、邮寄投票了,但最 终的、最主要的投票日期是在11月3日,还有20多天。这20多天什么情况都有可 能发生,我们没法预测。像上一届,我们哪里会知道,在大选的前一周FBI局长 科米会宣布重新调查希拉里的邮件门呢?那件事可能对上一次的大选发生了影响, 导致希拉里的支持率下降。在接下来20多天里,我们不知道会发生什么事。更何 况川普现在是总统,手上有很大的权力,他会采取各种各样的方法来让选举没法 顺利进行,甚至会用作弊或者别的方法来干扰整个大选。所以,这20多天会不会 发生什么事情是不知道的,还有可能发生变化。但如果就这么持续下去的话,按 照整个趋势拜登赢的可能性相当高。   民意调查一个很重要的作用,就是在相当程度上预测了整个大选的趋势,可 以说给出的是一种可能性。目前来说,拜登获胜的可能性相当高,可以说达到了 90%或者更高。但是概率再高还是有可能发生意外,有可能发生小概率事件。你 去赌博,人家给你算了概率,但是你反着来,非要押那个小概率的,那么是有可 能反而赢的,这就是所谓的“爆冷门”。爆了冷门不能说人家的计算就是错的。   有没有可能再爆一次冷门呢?当然有可能,只不过这种可能性更低。川普获 胜的可能性当然存在,只不过这种可能性要比上一届还要低。就是说,川普需要 再创造一个更大的奇迹。   2020.10.8.录制   2024.9.1整理 (XYS20241007) ◇◇新语丝(www.xys.org)(xinyusi.org)(groups.google.com/group/xinyusi)◇◇