导读 3 月 20 日,美籍加拿大数学家罗伯特·朗兰兹获得了阿贝尔奖,以表彰他在数学领域的终身成就。朗兰兹的研究展示了几何、代数和分析中的

3 月 20 日,美籍加拿大数学家罗伯特·朗兰兹获得了阿贝尔奖,以表彰他在数学领域的终身成就。朗兰兹的研究展示了几何、代数和分析中的概念如何通过与素数的共同联系而结合在一起。

当挪威国王在 5 月向朗兰兹颁奖时,他将表彰 2300 年来理解素数的最新成果,可以说是数学中最大和最古老的数据集。

作为致力于“朗兰兹计划”的数学家,我对质数的历史以及最近的进展如何揭开它们的秘密着迷。为什么它们吸引了数千年的数学家?

如何找到质数

为了研究素数,数学家通过一个又一个的虚拟网格对整数进行应变,直到只剩下素数为止。这种筛选过程在 1800 年代产生了数百万个素数表。它允许今天的计算机在不到一秒的时间内找到数十亿个素数。但筛子的核心思想在2000多年里没有改变。

数学家欧几里得在公元前 300 年写道: “素数是仅用单位来衡量的”这意味着素数不能被除 1 以外的任何更小的数整除。 按照惯例,数学家不会将 1 本身视为一个质数。

欧几里得证明了质数的无限性——它们永远存在——但历史表明是埃拉托色尼给了我们筛子来快速列出质数。

筛选 2、3、5 和 7 的倍数只留下 1 到 100 之间的素数。信用:MH Weissman

这是筛子的想法。首先,过滤掉 2 的倍数,然后是 3,然后是 5,然后是 7——前四个素数。如果对从 2 到 100 的所有数字执行此操作,则只会保留质数。

8个过滤步骤,最多可分离400个素数。168个过滤步骤,最多可分离100万个素数。这就是埃拉托色尼筛法的威力。

桌子和桌子

制表素数的早期人物是约翰佩尔,他是一位致力于创建有用数字表格的英国数学家。他的动机是解决丢番图的古代算术问题,但也出于对组织数学真理的个人追求。由于他的努力,到 1700 年代初,高达 100,000 的素数已广泛流传。到 1800 年,独立项目已经列出了多达 100 万的素数。

为了使繁琐的筛分步骤自动化,一位名叫 Carl Friedrich Hindenburg 的德国数学家使用可调节滑块一次在整个表格页面上标记出倍数。另一种技术含量低但有效的方法是使用模板来定位倍数。到 1800 年代中期,数学家雅各布·库利克 (Jakob Kulik ) 开始了一项雄心勃勃的项目,要找出 1 亿以内的所有素数。

如果不是卡尔·弗里德里希·高斯 (Carl Friedrich Gauss ) 决定分析素数,那么 1800 年代的“大数据”可能只能作为参考表。有了多达 300 万个素数的列表,高斯开始计算它们,一次“千年”,或 1000 个单位的组。他把素数数到 1000,然后是 1000 到 2000 之间的素数,然后是 2000 到 3000 之间的素数,以此类推。

高斯发现,当他数得更高时,根据“对数倒数”定律,素数逐渐变得不那么频繁。高斯定律没有准确显示有多少素数,但它给出了一个很好的估计。例如,他的定律预测了 1,000,000 到 1,001,000 之间的 72 个素数。在正确的计数是75米的素数,约4%的误差。

在高斯第一次探索一个世纪之后,他的定律在“素数定理”中得到了证明。在越来越大的素数范围内,百分比误差接近于零。黎曼假设,今天的百万美元奖金问题,也描述了高斯估计的准确程度。

素数定理和黎曼假设得到了关注和金钱,但都跟进了更早、不那么迷人的数据分析。

现代主要谜团

今天,我们的数据集来自计算机程序而不是手工切割的模板,但数学家仍在寻找素数的新模式。

除了 2 和 5,所有素数都以数字 1、3、7 或 9 结尾。在 1800 年代,已经证明这些可能的最后一位数字同样频繁。换句话说,如果你看一百万以内的质数,大约 25% 以 1 结尾,25% 以 3 结尾,25% 以 7 结尾,25% 以 9 结尾。

几年前,斯坦福大学的数论家 Lemke Oliver 和 Kannan Soundararajan 被质数最后一位数的怪癖弄得措手不及。一项实验研究了素数的最后一位,以及下一个素数的最后一位。例如,23 之后的下一个质数是 29:人们看到最后一位数字是 3,然后是 9。在素数的最后一位数字中,人们看到 3 然后 9 比 3 然后 7 更常见吗?

数论家预计会有一些变化,但他们发现的结果远远超出了预期。素数被不同的间隙隔开;例如,23 与 29 相差 6 个数字。但是像 23 和 29 这样的 3-then-9 质数比 7-then-3 质数更常见,即使它们都来自 6 的间隔。

数学家们很快找到了一个合理的解释。但是,在研究连续素数时,数学家(大部分)仅限于数据分析和说服。证明——数学家解释事物真实原因的黄金标准——似乎还需要几十年的时间。