Notes on how to think straight about psychology

  • Stanovich. K. E. (2019). How to think straight about phychology (11th edition, 英文版). 北京: 人民邮电出版社.

The goal of this book is to present a short introduction to the critical thinking skills that will help to better understand the subject matter of psychology.

Few people are aware that the majority of the books they see in the psychology sections of many bookstores are written by individuals with absolutely no standing in the psychological community. (p. xiv)

大多内容, 尤其是后半本书 (因此笔记主要针对前几章), 至少对理科生而言都是常识, 但是依然有新的东西, 再系统地回顾一遍也是有好处的. 另外可以知道大众会犯哪些错误.

Ch. 1 Psychology is alive and well

Why Freud’s methods are unrepresentative of modern psychology

大家都听说过 Freud (弗洛伊德). 但是他的理论只是这个学科的沧海一粟, 方法论不科学, 会误导普通群众. 比如说,

  • 他没有采用控制实验. 见 ch. 6.
  • 他认为只靠 case studies 就可以判定理论正确与否. 见 ch. 4.
  • 最严重的的问题, 不可证伪. 见 ch. 2.

精神分析法有理论有假设, 但是缺少了实证观测的方法. 他专注于建立复杂的理论结构, 却没有保证他们可以复现.

Differences between psychology and other disciplines that deal with human behavior

心理学与其他处理人类行为的学科 只有 两个不同:

  • Psychology studies the full range of human and nonhuman behavior with the techniques of science.
  • The applications that derive from this knowledge are scientifically based.

很多人认为心理学不是科学, 这种现象的原因可能是

  • 传播伪科学的产业出于既得利益的考虑, 总是想让大众相信, 无论什么都能纳入心理学的范畴, 而且心理学的主张不能以理性标准来衡量.
  • The tendency to oppose the expansion of science into areas where unquestioned authorities and “common sense” have long reigned. 一些历史例子, 比如用哲学猜测, 神谕, 民间智慧来解释自然世界, 而拒绝科学.

心理学并不存在大一统的理论, 它是由很多不同方向的理论构成的, 并且只能解释非常有限的行为. 如果你因此而批评它, 那么其实许多其他科学同样也缺乏统一的理论 (比如 20 世纪初的物理化学), 心理学不背这个锅. 心理学的统一性应该着眼于 (科学的) 方法论, 而不是具体内容.

Three features that define science

  • Systematic empiricism (系统的实证主义)
    • 实证 = 基于观测 (observation) 的实践. 而不是臆想或者诉诸权威.
    • 不仅要观测, 还要系统, 结构化.
    • 科学观测通常是理论驱动的, 检验不同的解释. 也是结构化的, 基于观测的结果来确定理论是被支持还是拒绝.
  • Publicly verifiable knowledge: replication and peer review (公共的可验证的知识: 可复现性和同行评审)
    • 公共的意思是指科学知识并不仅存在于某个特定的人的脑内. 只有当知识被提交到科学 community, 经过别人 criticism 和检验之后, 才叫科学知识.
      • Likewise, science rejects the claim that particular groups have access to special knowledge.
    • 可复现性保证了科学能被 publicly verified, 而不是研究者自身的错误或者偏见. 别人做同样的实验, 要能得到同样的结果. 可复现性定义了 public knowledge.
      • 科学的发展就是建立在所有研究者都可以获取前人积累的知识.
    • Publicly verifiable knowledge = findings presented to the scientific community in such a way that they can be replicated, criticized, or extend by anyone in the community.
      • 伪科学的一个常见操作是不把结果发表在科学刊物上, 而是直奔媒体.
    • 同行评审是指每一篇投递到研究期刊的 paper 都要经过若干科学家的 criticism, 并把他们的意见上交给编辑. 编辑一般是某领域资深专家, 最终拍板 paper 能不能发表.
      • 现在有些期刊给钱就能发, 所以要注意期刊是否有同行评审过程.
      • 通过了同行评审也不能保证都是对的, 这只是一个 最低要求. 关键在于过不了同行评审的就明显有问题了.
      • 同行评审是将客观性和 public criticism 制度化的一种方法. 它绝非完美, 却是唯一的防线
  • Empirically solvable problems
    • 处理的问题都是可能被现有的 empirical techniques 解决的. 因此这个划分不是绝对的, 会根据科学的进展而变动.
    • 理论 -> 预测 -> 检验 -> 修改理论. 因此 “可解的问题” 必须是 “可检验的理论”, 也就是可证伪, 见 ch. 2.

Folk wisdom is nonsense

如果有人用民谚/民间智慧来解释某种结果, 那么通常他可能在早些时候用了另一个完全矛盾的民谚来解释同样的事件. 举个例子, “look before you leap” (三思而后行), 和 “he who hesitates is lost” (犹豫就会败北); 又比如在面对离别的时候, “absense makes the heart grow fonder” (距离产生美) “out of sight, out of mind” (眼不见为净). 这种操作的诱惑之处在于, 其论断是无法被驳斥的 (没有可证伪性). 无论发生了哪种情况, 都可以掏出一条民谚来解释它.

事实上, 民谚是在放马后炮, 他在预测的时候毫无卵用. Everything is obvious once you know the answer. 书 p. 12 有个有趣的例子说明了即使被告知了错误的结论, 人们也会倾向于编造一个解释来说明结果.

几个例子

  • 社会上依然盛行 “学习好或读书多的孩子都不擅长社交和体育” 这一偏见, 事实上恰恰相反 (Singh et al., 2012).
  • “做多项选择题时如果不确定, 就不要改变最初的答案”. 不对 (Kruger et al., 2005; Lilienfeld et al., 2010).
  • “我们只用了大脑 10% 的功能” 毫无依据 (Ferguson et al., 2018; Lilienfeld et al. 2010). 另外, 虽然大脑不同区域有分工, 但是左右脑这种词汇无疑是胡说八道, 尤其是当我们知道大脑是以整体工作的时候 (Lilienfeld et al. 2010; Radford, 2011).
    • “Right-brained people tend to be artistic, intuitive, and in touch with their feminine side; left-brained people are more logical, analytical, and in touch with their masculine side.” In fact, the two halves of the brain differ in how they process tasks rather than what they process. The two hemispheres communicate extensively and continually. There is no direct evidence that differential hemispheric utilization can be trained.
  • “We are each intelligent in our own way”, 不 (Deary, 2013; Ferguson et al., 2018; Waterhouse, 2006).
  • 速读 (reading at several times the normal rate with little loss in comprehension) 量子波动速读, 当然是不可能的 (Rayner et al., 2016).

Reasons for the hostility directed towards psychology as a discipline

People often are offended simply by the presentation of simple descriptive facts about human behavior… This opposition, when the issue is a heated one, can get hostile and can be personally directed at psychologists.

大概可以这么说, 很多人只愿意相信他们愿意相信的事情, 认为某些结果会冒犯他们的信仰.

References

Ch. 2 Falsifiability

一个例子是放血疗法: 成功了就归功于治疗方法, 失败了就说本来就没救了. 这种评估方式使得这个疗法永远不可能被证明是无效的, 即不可证伪.

Scientific theories must always be stated in such a way that the predictions derived from them could potentially be shown to be false (Koepsell, 2015).

一个有用的理论必须能够做出明确的预测, 同时告诉我们什么应该发生, 什么不会发生. 如果后者发生了, 那么就证伪了理论.

外行可能会说 “Oh, it’s only a theory”, 他们以为理论是 an unverified hypothesis, a mere guess, a hunch. 但 理论 这个词在科学中可不是这么用的. 在科学范畴中讨论的理论都是已经在一定程度上证实的, 能够做出与实证观测不矛盾的预测.

Freud 的理论是在事后解释人类的行为, 而非事先预测. 他可以解释任何事情, 但是由于他并不能做出预测, 这套理论在科学意义上毫无用处. 他的危害之处见 p. 21.

编造一个不可证伪的概念: 脑中的绿色小人. 宣称我脑中有一个绿色小人. 他们很机灵, 当有人试图观测时, 他们就消失 (变得不可见). 于是脑中小人永远不可能被证伪. 类似地, 很多宣称有超能力的人和这个弱智的例子差不多, 无法复现或者不可证伪.

没有可证伪性也不一定就不是科学. 能量守恒就是一个很好的例子.

References

Ch. 3 Operationism and essentialism

讲 metrics.

Why science does not answer essentialist questions

物理学家 “真正” 理解什么是 gravity 吗? Gravity 的本质是什么? 当谈及 gravity 时, 到底是什么意思? Karl Popper 将这种问题成为本质主义 (essentialism). 这种观点认为, 只有能对现象做出本质解释的理论才是好理论. 再比如 “发生衰变的放射性元素的原子数量与时间是呈指数函数关系的”, 可是这并不能回答为什么会遵循这个函数, 放射性衰变到底是什么.

科学家并不宣称用于本质主义者所追求的知识, 科学家认为这些问题是无法回答的. 物理学家并不知道 gravity 的本质. Physics makes no attempt to explain what things really are or why they got that way.

There exist questions that science cannot answer and that no conceivable advance of science would empower it to answer. These are the questions that children ask – the ‘ultimate questions’… I have in mind such questions as: How did everything begin? What are we all here for? What is the point of living? (Medawar, 1984, p. 66)

本质主义者喜欢咬文嚼字. “我们必须首先定义我们的术语”. The idea seems to be that, before a word can be used as a concept in a theory, we must have a complete and unambiguous understanding of all the underlying language problems involved in its usuage. 但和科学家的工作方式相反. 物理学家在开始研究前, 不会花费力气讨论一个词怎么用, 一个词是否抓住了本质含义.

在科学里, 一个概念的意义是在做了充分研究之后才决定的, 而不是在研究前. 概念的完善源自理论和数据的交互, 而不是嘴皮子功夫. 本质主义会让我们陷入无休止的文字争论, 偏离了科学本来的目的.

Why psychology requires operationism to evaluate theoretical claims

Operationism (操作主义) is simply the idea that concepts in scientific theories must in some way be grounded in, or linked to, observable events that can be measured. Linking the concept to an observable event makes the concept public.

比如把 “hunger” 定义为 “that gnawing feeling I get in my stomach” 不是 operational definition, 因为这和个人体验相关, 无法被其他观测者感知. 相对地, 如果定义涉及到 “some measurable period of food deprivation” 或者一些生理指标 (如血糖水平), 则为 operational, 因为所有人都可以观测.

It is important to realize that a concept in science is defined by a set of operations, not by just a single behavioral event or task. Several slightly different tasks and behavioral events are used to converge on a concept (见 ch. 8).

简单地说, 你需要一个或一系列恰当指标来度量.

Operational definition 需要信度 (reliability) 和 效度 (validity). 信度是指 “采取同样的方法对同一对象重复进行测量时, 其所得结果相一致的程度”, 相当于 variance, 把指标看成估计量, 方差小意为着信度高. 而效度相当于 bias.

当思考物理或者化学时, 很多人能理解操作主义的必要性, 但心理学就不一样了. 原因之一是, 人们有预设偏见 (preexisting-bias). People do not come to the study of geology with emotionally held beliefs about the nature of rocks. However, we all have intuitive theories of personality and human behavior because we have been “explaining” behavior to ourselves all our lives. 误解产生的一个重要原因是, 心理学许多专业概念是用日常用语表达的, 导致媒体难以准确呈现心理学成果. 比如 intelligence (智力), anxiety (焦虑) 这些词汇和普通群众所用的意思并不一定相同.

一个科学概念也不是一成不变的. 心理学目前的解释是对行为的暂时性的理论建构. 这些建构在将来会被更好的, 更接近事实的理论概念体系所取代.

References

  • Medawar, P. (1984). The limits of science. Oxford Univ. Press. (527 citations till 2020/12/31)

Ch. 4 Testimonials and case study evidence

从概率论来讲, 对于一个随机变量, 我们给定几个独立的观测值 (样本), 是无法推断出这个随机变量的分布或者其他统计性质的 (如矩等).

要排除安慰剂效应, 只需要最基本的实验原则, 做对照.

Limitations of case studies and testimonials as scientific support for theories

第四章开头讲了一类用不可证伪的理论解释现象的电视节目.

A case study is an investigation that looks intensely and in detail at a single individual or very small number of individuals. 个案研究可以在研究阶段早期提供灵感 (提出假设). 而由于个案研究在特定理论的检验中无法作为证实或证伪的证据 (检验假设), 因此在研究后期没什么用. Freud 工作的一个缺陷是, 他只停留在个案研究这一步.

见证叙述 (testimonial) 与个案研究类似, 都是孤立事件. 每一个伪科学治疗都可以找到一些真诚的病人为这个疗法做见证叙述, “really worked for them”.

个案研究和见证叙述作为孤立的现象而存在, 缺少必要的比较性信息, 不能证明某一特定理论或疗法更优越.

How placebo effect invalidates testimonials or case study evidence

几乎每种医学或者心理学疗法都有支持者, 并能产生出一些发自内心认可其疗效的人. 比如猪牙齿, 鳄鱼的分辨, 木乃伊的粉末. 事实上, 人们早已知道, 仅仅暗示正在接受某种治疗, 就足以使很多人感觉病情好转. 无论治疗是否有效, 人们都倾向于报告某种疗法有帮助, 这就是安慰剂效应 (Benedetti et al., 2011; Churchland, 2015; Lu, 2015; Marchant, 2016; Schwarz et al., 2016).

事实上, 由于只有在最近百年, 医学才发展出了较多具有确凿疗效证据的治疗方法, it is often said that 在二十世纪之前, 所有的医学史只是安慰剂效应的历史罢了.

新药研究必须包括对安慰剂的控制 (双样本检验). 安慰剂是等量不含任何药物的药剂, 病人并不知道他们吃的是什么药. 安慰剂效应是很强大的, 安慰剂在一些疾病治疗中有大约 30% 的患者报告有效 (Cho et al., 2005). 当然实际的药物研究中, 为了判断新药是否更好, 要让它和当前最好的药物对比.

在心理治疗中, 安慰剂效应也很常见. 控制研究显示, 一部分的康复是由于安慰剂效应和单纯的时间推移造成的 (Driessen et al., 2015). 后者称为自然康复/自发性减轻 (spontaneous remission). 很多疾病是自限的 (self-limiting), 能自己治愈.

How vividness of information affects interpretation of scientific evidence

鲜活性效应是指, 当需要解决一个问题或面临一个决策时, 人们会从记忆中提取与当前情景看似相关的信息. 其中一个强烈影响 accessibility 的因素是信息的鲜活性. 个人见证恰恰是最鲜活的, 因为这是已经发生的, 真实的事情. 比如在你看了数千份消费者报告, 若干本汽车杂志, 并且确认专家也推荐同一车型后, 你感觉稳了; 结果在一次聚会时朋友说他买了这车, 是垃圾, 再也不会买了. 虽然个案不应该很大程度影响我们的决策, 毕竟之前做了这么多准备工作; 但我们很难抵御诱惑, 不 overweight this evidence.

在世界范围, 每天死于车祸的人大约抵得上 2011 日本海啸的量 (Lewis, 2017, p. 346). 但我们对此漠然置之, 因为没有像 “能坐满一架飞机的人死了” 这种信息通过媒体以鲜活的形式传达给我们. 事实上, 与生活中几乎其他所有的活动相比, 开车都是一种极端危险的行为, 比坐飞机高多了 (Galovski et al., 2006; National Safety Council, 2016). 比如你驾车送朋友去机场, 分别的时候说 “一路平安”, 但其实你危险得多 (Sivak & Flannagan, 2003; Smith, 2013). 因此联邦航空管理局 (FAA, federal aviation administration) 景观推荐婴儿和儿童坐在自己的座位上 (have their own seat), 但并不强制要求 (Associated Press, 2010). 因为他们害怕父母为了节省小孩的票钱, 会因此选择驾车, 这可比坐飞机危险多了. 对儿童来说, 车里是最危险的地方了.

当遇到有人陷入鲜活性问题不能自拔时, 可以考虑用魔法打败魔法. Fight vividness with vividness.

鲜活事例可以用来 illustrate a point but not to prove it.

How to identify pseudoscientific claims

一个特点是, 伪科学 offer an outcome that allows one to escape well-established trade-offs. 比如高收益通常对应高风险.

References

  • Benedetti, F., Carlino, E., & Pollo, A. (2011). How placebos change the patient’s brain. Neuropsychopharmacology, 36(1), 339-354. (421 citations till 2021/1/1)
  • Churchland, PS. (2015, Aug 8). Brain Chemicals Explain the Power of Placebos. Wall Street Journal, p. C2.
  • Lu, S. (2015, Apr). Great expectations. APA Monitor on Psychology, 45, 50-53.
  • Marchant, J. (2016, Jan 10). A Placebo Treatment for Pain. New York Times, p. SR5.
  • Schwarz, K. A., Pfister, R., & Büchel, C. (2016). Rethinking explicit expectations: connecting placebos, social cognition, and contextual perception. Trends in Cognitive Sciences, 20(6), 469-480. (77 citations till 2021/1/1)
  • Cho, H. J., Hotopf, M., & Wessely, S. (2005). The placebo response in the treatment of chronic fatigue syndrome: a systematic review and meta-analysis. Psychosomatic Medicine, 67(2), 301-313. (134 citations till 2021/1/1)
  • Driessen, E., Hollon, S. D., Bockting, C. L., Cuijpers, P., & Turner, E. H. (2015). Does publication bias inflate the apparent efficacy of psychological treatment for major depressive disorder? A systematic review and meta-analysis of US National Institutes of Health-funded trials. PloS one, 10(9), e0137864. (175 citations till 2021/1/1)
  • Lewis, M. (2017). The undoing project: A friendship that changed the world. New York: Norton.
  • Galovski, T. E., Malta, L. S., & Blanchard, E. B. (2006). Road rage: Assessment and treatment of the angry, aggressive driver. American Psychological Association. (107 citations till 2021/1/1)
  • National Safety Council. (2016). Injury facts 2016: odds of dying. 原文用的是 2016 的数据, 这个页面是动态更新的. 注意最后一行 “Passenger on an airplane: Too few deaths in 2018 to calculate odds”.
  • Sivak, M., & Flannagan, M. (2003). Flying and driving after the September 11 attacks. American Scientist, 91, 6-7. (57 citations till 2021/1/1)
  • Smith, P. (2013). Cockpit confidential: Everything you need to know about air travel: Questions, answers, and reflections. Sourcebooks, Inc.. (10 citations till 2021/1/1)
  • Associated Press. (2010, Sep 7). Safety board renews call for young to fly in own seats.

Ch. 8 Converging evidence

简单地说, 如果结论正确, 那么各方证据应该都能支持这个.

科学是缓慢地积累, 逐步发展的, 几乎没有大跃进. 每次发展通常都是之前结果的延拓, 称为 connectivity (与先前的理论有联系). 而这个性质在艺术领域几乎是缺失的. 艺术史是艺术家的历史.