对由气候变化,COVID-19的传播,农业趋势以及邻近地区的社会经济问题驱动的人类迁徙的识别取决于数据-模型越复杂,就需要更多的数据来理解这种空间分布的现象。但是,可靠的数据通常昂贵且难以获得,或者稀疏而无法进行准确的预测。

机械和航空航天,生物医学以及土木和城市工程学院教授,​​纽约大学丹东工程学院城市科学与进步中心(CUSP)的成员Maurizio Porfiri,设计了一种基于网络和信息理论的新颖解决方案,通过将通常用于时间序列的数学技术应用于空间过程,可以使“小数据”发挥更大的作用。

这项名为“研究小型数据集中空间依赖性的信息理论方法”的研究以皇家学会A:数学,物理和工程科学论文集的封面为特色,描述了如何从有限数量的少量属性样本中根据位置,观察者可以对影响进行有力的推断,包括对中间区域甚至具有相似关键属性的遥远区域进行插值。

“大多数时候数据集都很差,”波尔菲里解释说。他说:“因此,我们采取了一种非常基本的方法,运用信息论来探索时间意义上的影响是否可以扩展到空间,这使我们可以处理非常小的数据集,只有25到50个观测值。” “我们正在为数据拍摄一张快照并绘制连接(不是基于因果关系,而是基于各个点之间的交互作用),以查看系统中是否存在某种形式的基础集体响应。”

该方法由Porfiri和西班牙卡塔赫纳技术大学定量方法,法律和现代语言系的合作者Manuel RuizMarín开发,涉及:

Porfiri解释说,由于非参数方法没有为节点之间的影响提供任何底层结构,因此它在如何关联节点,甚至如何定义邻居的概念方面赋予了灵活性。

“由于我们抽象了邻居的这个概念,因此可以在您喜欢的任何品质的上下文中对其进行定义,例如意识形态。从意识形态上,加利福尼亚可以是纽约的邻居,尽管它们不在同一地理位置。可能具有相似的价值。”

该团队针对两个案例研究验证了该系统:孟加拉国因海平面上升和美国的机动车死亡而导致的人口迁移,从而得出了具有统计学原理的重要社会经济问题机理的见解。

“在第一种情况下,我们想看看是否可以通过地理距离或该特定区域的淹没严重程度来预测位置之间的迁移-知道哪个区域靠近另一个区域或了解洪水的程度是否会有所帮助预测移徙的规模。”鲁伊斯·马林(RuizMarín)说。

对于第二种情况,他们研究了1980年,1994年和2009年与酒精有关的汽车事故的空间分布,比较了发生此类事故的州与邻近州以及具有类似酒后驾车立法意识形态的州之间的关系。

“我们发现,在国界共享国之间的关系要比在国界共享有关饮酒和驾驶的立法意识形态之间的关系更牢固。”

接下来,Porfiri和RuizMarín计划将其方法扩展到时空过程的分析,例如美国的枪支暴力(这是美国国家科学基金会的LEAP HI计划最近资助的一项重大研究项目)或大脑中的癫痫发作。他们的工作可以帮助您了解何时何地可能发生枪支暴力或可能引发癫痫发作。