从数学、统计学角度讨论身高回归定律(即高尔顿定律)原理本质
东方2185
编辑于 2023年02月05日 21:42

大多数人认为的身高回归定律可能是种错觉。讨论身高回归定律(即高尔顿定律)以及所衍生的其他类似现象背后的原理本质。

科普,已了解可跳过:1889年,英国统计学家弗朗西斯·高尔顿研究发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们的父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们的父母的平均身高高。高尔顿把这种后代的身高向中间值靠近的趋势称为“回归现象”亦称“高尔顿定律

人们随后发现这一现象广泛存在于其他诸多领域(主要是遗传学领域),因此将这一定律推广衍生到其他领域(如智商遗传)。然而,高尔顿没能解释回归的原因。却见到有些拓展到解释富不过三代之类的,这种过分滥用多少给人一种强行牵扯到成功学的感觉

看过很多现代的科学讨论和科普解释,大多是认为没有这一限制容易让种群快速两极分化,不利于种内协作之类的。这种感觉很多还是从复杂而具体的现实经验去倒推论证。总而言之不尽人意。今天估且从统计学、数学角度提出一些个人见解以供参考

影响人类身高的遗传性因素,可认为其在大范围的人类群体中趋向于正态分布(事实上只要有先增后减、大致对称等特点就满足以下的推论)。以具有某一程度遗传素质之个体的平均身高设为预期身高。 (如下图)

将后天性因素抽象成一个整体,可视其为作用于预期身高的±n值(大致亦呈现正态分布特征)先天后天因素叠加确定实际身高范围

某一具体的实际身高则是由先天因素/预期身高不同的个体受后天因素影响得到。如下图所示,高于平均水平某位置,与其差距相等的两个位置,其所占人数比例并不相同

不同遗传素质的个体促成某一实际身高的过程,亦可视为促成不同遗传素质个体在该身高中占比的过程。

也就是说,在所测身高高于总体平均水平的群体中,遗传素质所预期的身高低于该群体平均身高的占多数。其平均遗传素质是低于统计数据的。那么,后代平均身高低于上一代测量统计的平均身高,也就不足为奇了

同理,身高低于平均水平的群体,平均遗传素质其实高于统计数据导出的数值。其后代平均身高自然高于上一代。

由此观之,"回归"更有可能是人们观测统计过程中产生的一种错觉。它更多的是作为一种统计现象而存在,而与许多人认识的却不同。称为“回归”或许不太准确有误导性。

而当前对于某个具体的表现出回归效应的现象,其究竟更符合哪种猜测解释构想,我认为可以进行如下实验:比如对于人类身高,选定高于平均身高的某一值,该部分的后代平均身高低于该值(即被认为出现了身高回归),研究他们再下一代的平均身高,是向着总体平均身高"回归",还是接近于母代的平均身高

拓展延伸:当后天因素作用不明显,某基础位置上的个体促成实际身高变化不大时,实际身高分布图像与遗传因素预期身高图像基本重合。而当后天因素作用极大时,实际身高图像将显得极为扁平。推测通过测量统计实际身高与下一代的"回归"情况,可能能够获得上一代遗传素质真正的分布图像,以及后天因素的偏差作用图像

当然对人类身高的测量实验可能涉及更多复杂的因素,实验周期也较长。这暂时也不是在下一位高中生能做要做的事儿了

欢迎发表各种方面的见解,欢迎参与这一命题的讨论研究