空间数据挖掘是尝试在地理数据中查找模式的过程。它最常用于零售业,它已经脱离了数据挖掘领域,数据挖掘最初专注于寻找文本和数字电子信息中的模式。空间数据挖掘被认为是比传统挖掘更复杂的挑战,因为分析空间和时间中具体存在的对象存在困难。
与标准数据挖掘一样,空间数据挖掘主要用于营销和零售领域。这是一种用于决定在哪里开设何种商店的技术。它可以通过处理有关哪些因素促使消费者去一个地方而不是另一个地方的预先存在的数据来帮助为这些决策提供信息。<图>
空间数据挖掘是专业的尝试在地理数据中查找模式的过程。
假设阿什利想在某个城市街区开设一家夜总会。如果她能够访问适当的数据,她就可以使用空间数据挖掘来找出哪些空间因素使夜总会成功。她可能会问这样的问题:如果附近有公共交通,会更多的人来俱乐部吗?距离其他夜生活场所多远可以最大限度地增加客流量?靠近加油站是优点还是缺点?
Ashley 可能还想确保来到她的夜总会的人在每个晚上均匀分布。她还可以使用空间数据挖掘(也许更准确地说,时空数据挖掘)来了解人们在特定时间如何在城市中移动。相同的过程可以应用于一周中不同晚上的光顾。
这种方法的困难是由于互联网之外的世界的复杂性造成的。鉴于过去在数据迷你方面的努力通常,我们拥有可供分析的成熟数据库,但可用于空间数据挖掘的输入不是信息网格,而是地图。这些地图具有不同类型的对象,例如道路、人口、企业等。
确定某事物是否"接近"其他事物从离散变量变为连续变量。这极大地增加了分析所需的复杂性。令人难以置信的是,这是尝试空间数据挖掘的人可以使用的更简单的关系类型之一。
空间数据挖掘还面临误报问题。在搜索数据寻找关系的过程中,由于统计误报,会出现许多明显的趋势。对于挖掘更简单的数据库的任务也存在这个问题,但它会因数据挖掘器可用的数据量而放大。最终,应通过解释和额外研究的过程来确认数据挖掘确定的趋势。








