2. 北京市安全生产科学技术研究院, 北京 101101
2. Beijing Academy of Safety Science and Technology, Beijing 101101, China
开放科学(资源服务)标志码(OSID):
目前,全球一半以上的人口居住在城市中,而且城市人口规模仍在不断扩大,到2030年,全球城市人口数量估计会增长到50亿[1]。因此,对如此庞大的城市人口和有限的城市地区进行管理非常重要。
城市功能区识别是进行合理城市规划和管理的关键一环。功能区是一个文化概念,描述了某个地区的人类活动,能够反映城市的复杂空间分布和社会经济功能[2]。每个功能区在空间上都由不同的地理对象聚合,并从土地用途上进行语义抽象[3]。功能区是城市规划的基本单位[4-5],对城市交通、资源管理、工厂选址等都有重要影响[6-7]。传统的城市功能区识别研究主要采用调研统计的方法,通过对人们出行日志的记录和问卷调查等方式进行。这种方法具有很大的局限性,不仅需要大量的人力、物力、财力,效率低下,而且调查者容易将主观意见和看法带入研究结果[8]。
遥感影像数据可以很好地捕获陆地表面的自然外观,因此,大量研究者用遥感影像数据来进行功能区识别[9-11]。但仅使用遥感图像进行区域功能识别存在不足:一方面,遥感数据只能反映地表的自然属性,而城市功能区具有社会经济属性,并由相关的人类活动决定;另一方面,遥感数据的获取需要巨大的耗费,且高密度城市中众多高层建筑存在阴影,这对遥感图像处理带来了巨大挑战。
公共交通工具(公共汽车、地铁、出租车等)能够产生大量与人移动强相关的位置数据用于功能区识别[12-13]。QIAN等[14]提出了一个集成模型,先基于出租车轨迹中的上下车点,使用K-Means和k最近邻算法提取区域社交属性,再基于决策树算法融合遥感数据得到功能区分类。但公交数据会忽视行人对于城市功能区的影响,也会忽略路网未覆盖的区域。
兴趣点(Points of Interest,POI)数据作为城市设施的代表,被广泛应用于城市功能区提取。YUAN等[15]使用基于主题的推断模型来推断每个区域的功能,该模型将区域视为文档,将功能视为主题,将POI的类别视为元数据,将人类流动模式作为词语。POI数据以建筑物的功能属性出发,能够覆盖所有区域,但并未考虑人的社会活动属性,同时数据更新成本较大。
手机呼叫详细记录(Call Detail Records,CDR)数据间接记录了人的活动时间、空间信息,同时隐含了人的社会活动属性[16-17],数据获取成本较低,且支持实时更新。江贵林等[18]使用高斯混合模型,基于CDR数据的简单统计量设计多特征加权判决的功能区识别算法。TU等[19]先基于手机信令数据推断人的职住位置,再基于隐马尔可夫模型由社交媒体签到数据获取人的活动的知识,从而推断城市功能。JIA等[20]自定义融合规则,同时使用遥感影像数据与CDR数据。但目前基于手机数据的大部分研究都只用到了简单的统计量,如区域内不同时间段的通话量等。
现有基于出行信息的功能区识别研究大部分停留在简单的统计,且多数将区域内不同出行行为的人群混杂在一起,并没有考虑不同群体对区域产生的不同影响。笔者通过研究相关数据发现:不同功能区的人群出行活动具有各自的特征,而通过学习这些特征可以识别出相应的功能区。本文基于人群出行行为轨迹构建城市功能区识别模型UFAI。利用粗粒度的匿名个体移动位置数据提取隐含的个体出行特征,并通过将这些出行特征与所在局部区域相关联,对该区域的群体出行特征进行分类。在此基础上,通过训练功能区的多分类深度学习模型,完成对功能区的识别。
1 UFAI模型 1.1 模型框架与符号定义UFAI模型框架如图 1所示,主要分为3个模块:
![]() |
Download:
|
图 1 UFAI模型框架 Fig. 1 UFAI model framework |
1)个体出行特征提取模块。对原始数据进行数据预处理后,使用ST-DBSCAN算法[21]识别用户停留点,然后构建出行链,提取出用户的职住位置以及隐含的个体出行特征。
2)区域内人群出行行为刻画模块。以区域为研究对象,基于个体出行特征划分区域内的不同群体,提取出各类人群的停留特征和居民的活动特征。
3)功能区分类模块。首先人工标注高置信度样本,然后以时间周期为单位切分数据,从而扩充样本,构建并训练深度学习模型。
本文所使用符号定义如表 1所示。
![]() |
下载CSV 表 1 相关符号定义 Table 1 Definition of related symbols |
一个用户
$ {R}_{\mathrm{i}\mathrm{d}}=\{{r}_{\mathrm{i}\mathrm{d}}^{1}, {r}_{\mathrm{i}\mathrm{d}}^{2}, \cdots , {r}_{\mathrm{i}\mathrm{d}}^{n}\} $ | (1) |
其中:
通过对聚类算法的研究可知,密度聚类算法DBSCAN比较适用于停留点提取,但传统的DBSCAN算法只考虑了空间这一单一维度,并不适用于处理具有多个维度的数据,因此,本文引入面向高维数据的ST-DBSCAN算法。ST-DBSCAN算法相对DBSCAN主要有两点改进:时间阈值的加入与选择样本邻域方法的改变。时间阈值限制了簇集中样本点的最短时间跨度值,而选择样本邻域的方法由随机扩展方式改为按时序扩展方式,能够保证一个簇集中的样本点在时间上是连续的。
从手机CDR数据中获取用户的停留点集合,如式(2)和式(3)所示:
$ {P}_{\mathrm{i}\mathrm{d}}=\{{p}_{\mathrm{i}\mathrm{d}}^{1}, {p}_{\mathrm{i}\mathrm{d}}^{2}, \cdots , {p}_{\mathrm{i}\mathrm{d}}^{n}\} $ | (2) |
$ {P}_{\mathrm{i}\mathrm{d}}=\mathrm{s}\mathrm{t}\mathrm{d}\mathrm{b}\mathrm{s}\mathrm{c}\mathrm{a}\mathrm{n}({R}_{\mathrm{i}\mathrm{d}}, {\varepsilon }_{\mathrm{S}}, {\varepsilon }_{\mathrm{T}}) $ | (3) |
其中:
基于停留点集合
$ {h}_{\mathrm{i}\mathrm{d}}=\underset{{p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{l}\mathrm{o}\mathrm{c}\in C}{\mathrm{a}\mathrm{r}\mathrm{g}\mathrm{m}\mathrm{a}\mathrm{x}}\left\{\sum\limits_{\forall {p}_{\mathrm{i}\mathrm{d}}^{i}\in {P}_{\mathrm{i}\mathrm{d}}}{f}_{\mathrm{T}}\left[\right({p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{t}\mathrm{s}, {p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{t}\mathrm{e})\bigcap {d}_{\mathrm{H}}]\right\} $ | (4) |
$ {w}_{\mathrm{i}\mathrm{d}}=\underset{{p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{l}\mathrm{o}\mathrm{c}\in C}{\mathrm{a}\mathrm{r}\mathrm{g}\mathrm{m}\mathrm{a}\mathrm{x}}\left\{\sum\limits_{\forall {p}_{\mathrm{i}\mathrm{d}}^{i}\in {P}_{\mathrm{i}\mathrm{d}}}{f}_{\mathrm{T}}\left[\right({p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{t}\mathrm{s}, {p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{t}\mathrm{e})\bigcap {d}_{\mathrm{W}}]\right\} $ | (5) |
其中:
以往针对区域内人群出行行为的研究,都是以区域内的所有人群为研究对象,但单个区域内的人员成分复杂,不同人群的出行行为也互不相同。因此,本文先将单个区域
![]() |
下载CSV 表 2 区域内人群研究类别定义 Table 2 Categories definition of population research in the region |
对于用户
$ {l}_{\mathrm{i}\mathrm{d}}^{c}=\sum ({p}_\text{id}^{i}.\mathrm{t}\mathrm{e}-{r}_\text{id}^{i}.\mathrm{t}\mathrm{s})\text{,}\forall {p}_\text{id}^{i}\in {P}_\text{id}\wedge ({p}_\text{id}^{i}.\mathrm{l}\mathrm{o}\mathrm{c}\in c) $ | (6) |
用户在整个研究范围内的停留天数如式(7)所示:
$ {d}_{\mathrm{i}\mathrm{d}}=\left|\right\{{p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{t}\mathrm{s}.\mathrm{d}\mathrm{a}\mathrm{t}\mathrm{e}|\forall {p}_{\mathrm{i}\mathrm{d}}^{i}\in {P}_{\mathrm{i}\mathrm{d}}\}| $ | (7) |
其中:
$ {G}_{1}^{c}=\{{u}_{\mathrm{i}\mathrm{d}}\in U|{p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{l}\mathrm{o}\mathrm{c}\in c, \forall {p}_{\mathrm{i}\mathrm{d}}^{i}\in {P}_{\mathrm{i}\mathrm{d}}\} $ | (8) |
$ {G}_{2}^{c}=\{{u}_{\mathrm{i}\mathrm{d}}\in U|{h}_{\mathrm{i}\mathrm{d}}\in c\} $ | (9) |
$ {G}_{3}^{c}=\{{u}_{\mathrm{i}\mathrm{d}}\in U|{w}_{\mathrm{i}\mathrm{d}}\in c\} $ | (10) |
$ {G}_{4}^{c}=\{{u}_{\mathrm{i}\mathrm{d}}\in U|{h}_{\mathrm{i}\mathrm{d}}\in c\wedge {w}_{\mathrm{i}\mathrm{d}}\in c\} $ | (11) |
$ {G}_{5}^{c}=\{{u}_{\mathrm{i}\mathrm{d}}\in U|\mathrm{ }({l}_{\mathrm{i}\mathrm{d}}^{c} < {\delta }_{\mathrm{L}})\wedge ({d}_{\mathrm{i}\mathrm{d}} > {\delta }_{\mathrm{D}})\} $ | (12) |
$ {G}_{6}^{c}=\{{u}_{\mathrm{i}\mathrm{d}}\in U|\mathrm{ }({l}_{\mathrm{i}\mathrm{d}}^{c} < {\delta }_{\mathrm{L}})\wedge ({d}_{\mathrm{i}\mathrm{d}} < {\delta }_{\mathrm{D}})\} $ | (13) |
$ {G}_{7}^{c}=\{{u}_{\mathrm{i}\mathrm{d}}\in U|\mathrm{ }({l}_{\mathrm{i}\mathrm{d}}^{c} > {\delta }_{\mathrm{L}})\wedge ({d}_{\mathrm{i}\mathrm{d}} > {\delta }_{\mathrm{D}})\} $ | (14) |
$ {G}_{8}^{c}=\{{u}_{\mathrm{i}\mathrm{d}}\in U|\mathrm{ }({l}_{\mathrm{i}\mathrm{d}}^{c} > {\delta }_{\mathrm{L}})\wedge ({d}_{\mathrm{i}\mathrm{d}} < {\delta }_{\mathrm{D}})\} $ | (15) |
区域内不同人群的出行行为在相同时间范围内具有不同的人数变化趋势,因此,先以
对于区域c,在第k个时间周期的第d天,时间片t对应g类人群的数量如式(16)所示:
$ \begin{array}{l}{N}_{c, k}^{g, d, t}=\left|\right\{{u}_{\mathrm{i}\mathrm{d}}\in {G}_{g}^{c}\left|\mathrm{ }\right({p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{l}\mathrm{o}\mathrm{c}\in c)\wedge ({p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{t}\mathrm{s} < \tau \times (t+1))\wedge \\ ({p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{t}\mathrm{e} > \tau \times t), \forall {p}_{\mathrm{i}\mathrm{d}}^{i}\in {P}_{\mathrm{i}\mathrm{d}}\left\}\right|\end{array} $ | (16) |
由此,可得到各个区域的人群出行行为特征矩阵N。
1.3.3 区域内居民的活动特征刻画对于区域c内的居民
$ \begin{array}{l}{a}_{c, k}^{\mathrm{i}\mathrm{d}, d}={f}_{\mathrm{D}}\left(\mathrm{m}\mathrm{a}\mathrm{x}\right(\mathrm{d}\mathrm{i}\mathrm{s}({p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{l}\mathrm{o}\mathrm{c}, {h}_{\mathrm{i}\mathrm{d}})\left)\right)\\ \mathrm{s}.\mathrm{t}.(\forall {p}_{\mathrm{i}\mathrm{d}}^{i}\in {P}_{\mathrm{i}\mathrm{d}})\wedge ({h}_{\mathrm{i}\mathrm{d}}\in c)\end{array} $ | (17) |
$ \begin{array}{l}{\boldsymbol{w}}_{c, k}^{\mathrm{i}\mathrm{d}, d}={f}_{\mathrm{D}}\left(\frac{\sum \left(\mathrm{d}\mathrm{i}\mathrm{s}\right({p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{l}\mathrm{o}\mathrm{c}, {h}_{\mathrm{i}\mathrm{d}})\times ({p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{t}\mathrm{e}-{p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{t}\mathrm{s}\left)\right)}{\sum ({p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{t}\mathrm{e}-{p}_{\mathrm{i}\mathrm{d}}^{i}.\mathrm{t}\mathrm{s})}\right)\\ \mathrm{s}.\mathrm{t}.(\forall {p}_{\mathrm{i}\mathrm{d}}^{i}\in {P}_{\mathrm{i}\mathrm{d}})\wedge ({h}_{\mathrm{i}\mathrm{d}}\in c)\end{array} $ | (18) |
其中:
$ {f}_{\mathrm{D}}\left(x\right)=r, \exists r\in \mathbb{Z}\wedge (r\le T)\wedge ({\kappa }_{r, 1}\le x < {\kappa }_{r, 2}) $ | (19) |
其中:
对于区域c,在时间周期k的第d天,半径离散类别r对应的值如式(20)和式(21)所示:
$ {A}_{c, k}^{r, d}=\left|\right\{{u}_{\mathrm{i}\mathrm{d}}\in U\left|\mathrm{ }\right({h}_{\mathrm{i}\mathrm{d}}\in c)\wedge (r{a}_{\mathrm{i}\mathrm{d}, d}^{c}==r\left)\right\}| $ | (20) |
$ {W}_{c, k}^{r, d}=\left|\right\{{u}_{\mathrm{i}\mathrm{d}}\in U\left|\mathrm{ }\right({h}_{\mathrm{i}\mathrm{d}}\in c)\wedge (r{d}_{\mathrm{i}\mathrm{d}, k}^{c}==r\left)\right\}| $ | (21) |
由此,可得到各个区域的居民出行行为特征矩阵A和W。
1.4 功能区分类模型区域人群出行行为刻画模型基于粗粒度轨迹数据,从出行行为角度出发计算得到区域的人群出行行为特征和居民出行行为特征。
功能区分类模型先拼接两类特征矩阵,得到模型的输入特征矩阵X。由经验可知,一周为一个人类活动的周期,因此,本文选取一周七天为区域的一个时间周期,构建区域
$ {\boldsymbol{X}}_{c, k}^{10\times d\times t}=\{{\boldsymbol{N}}_{c, k}^{8\times d\times t}, {\boldsymbol{A}}_{c, k}^{1\times d\times t}, {\boldsymbol{W}}_{c, k}^{1\times d\times t}\} $ | (22) |
其中:t代表一天的时间片个数;d代表一个时间周期的天数;
结合实际经验和数据分析,先人工标记部分功能区,作为训练和测试数据。但由于功能区数量本身有限,导致有标签的功能区数量有限,因此需要扩充样本。
由于数据在同一个区域的不同时间周期上遵循同一个概率分布,而且时间周期是可以不断扩展的,因此本文将一个区域对应的多个时间周期数据切分为多个训练样本,从而扩充样本集。
1.4.2 模型训练与分类结果对于任意区域c,时间周期k对应的特征矩阵
对于输入
$ {y}_{j}^{1}=\sigma \left(\sum\limits_{i\in {M}_{j}}{x}_{i}^{0}\cdot {k}_{i, j}^{1}+{b}_{j}^{1}\right) $ | (23) |
其中:
$ {x}_{j}^{1}=\underset{i\in N\times N}{\mathrm{m}\mathrm{a}\mathrm{x}}({y}_{i}^{0}\cdot u(n, n\left)\right) $ | (24) |
其中:
$ {y}_{j}^{2}=\sigma \left(\sum\limits_{i\in {M}_{j}}{x}_{i}^{1}\cdot {k}_{i, j}^{2}+{b}_{j}^{2}\right) $ | (25) |
$ {x}_{j}^{2}=\underset{i\in N\times N}{\mathrm{m}\mathrm{a}\mathrm{x}}({y}_{i}^{1}\cdot u(n, n\left)\right) $ | (26) |
最后,将
$ {y}_{c, k}=\boldsymbol{W}{\boldsymbol{x}}_{\mathrm{f}\mathrm{o}\mathrm{l}\mathrm{d}} $ | (27) |
其中:
对于同一个区域,当输入多个时间周期时,得到的分类结果可能会有所不同。出现这种情况的原因可能是该区域的功能分类复杂,也可能是数据采集的问题。因此,本文选取所有时间周期对应的分类结果中出现次数最多的结果,作为区域的功能区分类的最终结果。在第k个时间周期,区域c的输入特征矩阵为
$ {o}_{c}={f}_{\mathrm{M}}({y}_{c, 1}, {y}_{c, 2}, \cdots , {y}_{c, K}) $ | (28) |
其中:
本文实验所用的数据集为某移动运营商提供的北京市2019年1月—2019年10月的手机信令数据,覆盖北京市范围内2 000万匿名手机用户,数据采样频率为半小时,主要字段说明如表 3所示。
![]() |
下载CSV 表 3 数据字段说明 Table 3 Data field description |
经过数据去噪后,本文选取数据质量好、无重大节日影响且具有典型日常生活特征的数据作为UFAI模型的输入。
2.2 实验设置本文以北京市作为研究区域,以250 m×250 m为精度将其划分为18 106个网格区域。通过参考《北京市土地利用总体规划(2006—2020年)》《北京市主体功能区规划》以及网络地图,选取250个区域作为训练集,100个区域作为测试集,经过样本扩充,训练集个数最终为1 250个,功能区类别有居住区、工作区、其他。同时,本文的多分类模型采用交叉熵损失函数,如式(29)所示:
$ \mathrm{l}\mathrm{o}\mathrm{s}\mathrm{s}(x, \mathrm{c}\mathrm{l}\mathrm{a}\mathrm{s}\mathrm{s})=-\mathrm{l}\mathrm{o}{\mathrm{g}}_{a}\left(\frac{\mathrm{e}\mathrm{x}\mathrm{p}\left(x\right[\mathrm{c}\mathrm{l}\mathrm{a}\mathrm{s}\mathrm{s}\left]\right)}{\sum\limits_{j}\mathrm{e}\mathrm{x}\mathrm{p}\left(x\right[j\left]\right)}\right) $ | (29) |
采用本文模型进行训练,实验结果如表 4所示。
![]() |
下载CSV 表 4 各功能区分类结果 Table 4 Classification results of each functional area |
图 2为某局部区域对应的功能区分类结果,从中随机选取多个网格进行数据分析,如图 3所示,其中横坐标为一天48个时间片,纵坐标为各时间片对应人数,不同线条代表一周七天。可以看出:网格①平时人数多于周末人数,且每天人数趋势符合“凸”形;网格②平时人数少于周末,且每天人数区域符合“凹”形。以上数据表现符合日常生活经验。
![]() |
Download:
|
图 2 某局部区域功能区分类结果 Fig. 2 Classification result of functional area in a local area |
![]() |
Download:
|
图 3 一周七天网格内总人数随时间变化曲线 Fig. 3 Curve of the total number of people over time in the daily grid in a week |
实验使用以下对比模型:
1)决策树分类模型(Decision Tree)[22]。
2)随机森林模型(Random Forest)[23]。
3)核函数选择线性函数(SVM)[24]。
4)多项式朴素贝叶斯算法(Multinomial NB)[25]。
5)K最近邻分类算法(KNN)[26]。
6)逻辑回归算法(Logistic Regression)[27]。
7)集成学习梯度提升决策树分类模型(Gradient Boosting Classifier)[28]。
对比结果如表 5所示,与其他模型相比,本文UFAI模型具有最好的性能,F1值达到0.95。
![]() |
下载CSV 表 5 对比实验结果 Table 5 Comparison experimental results |
本文基于粗粒度匿名个体移动位置数据构建城市功能区识别模型UFAI。挖掘个体出行特征并与局部区域结合,将人群划分为不同类别。在此基础上,通过刻画各个区域内不同人群的出行活动,构建功能区多分类深度学习模型,同时将多个时间周期数据划分为多个训练样本,从而扩充样本集。实验结果表明,UFAI模型识别准确率达到0.93,相比于决策树、随机森林等分类模型准确率更高。下一步将结合更多识别功能区的人群出行活动特征,扩大本文模型的识别范围。
[1] |
TU W, HU Z W, LI L F, et al. Portraying urban functional zones by coupling remote sensing imagery and human sensing data[J]. Remote Sensing, 2018, 10(1): 141. DOI:10.3390/rs10010141 |
[2] |
BAO H Q, MING D P, GUO Y, et al. DFCNN-based semantic recognition of urban functional zones by integrating remote sensing data and POI data[J]. Remote Sensing, 2020, 12(7): 1088. DOI:10.3390/rs12071088 |
[3] |
ZHANG X Y, DU S H, WANG Q. Hierarchical semantic cognition for urban functional zones with VHR satellite images and POI data[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2017, 132: 170-184. DOI:10.1016/j.isprsjprs.2017.09.007 |
[4] |
MATSUOKA R H, KAPLAN R. People needs in the urban landscape: analysis of landscape and urban planning contributions[J]. Landscape and Urban Planning, 2008, 84(1): 7-19. DOI:10.1016/j.landurbplan.2007.09.009 |
[5] |
MONTANGES A P, MOSER G, TAUBENBÖCK H, et al. Classification of urban structural types with multisource data and structured models[C]//Proceedings of JURSE'15. Washington D. C., USA: IEEE Press, 2015: 1-4.
|
[6] |
HEIDEN U, HELDENS W, ROESSNER S, et al. Urban structure type characterization using hyperspectral remote sensing and height information[J]. Landscape and Urban Planning, 2012, 105(4): 361-375. DOI:10.1016/j.landurbplan.2012.01.001 |
[7] |
FAN J, TAO A J, REN Q. On the historical background, scientific intentions, goal orientation, and policy framework of major function-oriented zone planning in China[J]. Journal of Resources and Ecology, 2010, 1(4): 289-299. |
[8] |
陈占龙, 周路林, 禹文豪, 等. 顾及兴趣点潜在上下文关系的城市功能区识别[J]. 测绘学报, 2020, 49(7): 907-920. CHEN Z L, ZHOU L L, YU W H, et al. Identification of the urban functional regions considering the potential context of interest points[J]. Acta Geodaetica et Cartographica Sinica, 2020, 49(7): 907-920. (in Chinese) |
[9] |
CAO R, TU W, YANG C X, et al. Deep learning-based remote and social sensing data fusion for urban region function recognition[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2020, 163: 82-97. DOI:10.1016/j.isprsjprs.2020.02.014 |
[10] |
XIA J M, DING Y, TAN L. Urban remote sensing scene recognition based on lightweight convolution neural network[J]. IEEE Access, 2021, 9: 26377-26387. DOI:10.1109/ACCESS.2021.3057868 |
[11] |
DU S J, DU S H, LIU B, et al. Large-scale urban functional zone mapping by integrating remote sensing images and open social data[J]. GIScience & Remote Sensing, 2020, 57(3): 411-430. |
[12] |
JIANG Z, EVANS M, OLIVER D, et al. Identifying K primary corridors from urban bicycle GPS trajectories on a road network[J]. Information Systems, 2016, 57: 142-159. DOI:10.1016/j.is.2015.10.009 |
[13] |
ZHANG F S, JIN B H, WANG Z Y, et al. On geocasting over urban bus-based networks by mining trajectories[J]. IEEE Transactions on Intelligent Transportation Systems, 2016, 17(6): 1734-1747. DOI:10.1109/TITS.2015.2504513 |
[14] |
QIAN Z, LIU X T, TAO F, et al. Identification of urban functional areas by coupling satellite images and taxi GPS trajectories[J]. Remote Sensing, 2020, 12(15): 2449. DOI:10.3390/rs12152449 |
[15] |
YUAN J, ZHENG Y, XIE X. Discovering regions of different functions in a city using human mobility and POIs[C]//Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, USA: ACM Press, 2012: 186-194.
|
[16] |
GONZÁLEZ M C, HIDALGO C A, BARABÁSI A L. Understanding individual human mobility patterns[J]. Nature, 2008, 453(7196): 779-782. DOI:10.1038/nature06958 |
[17] |
PEI T, SOBOLEVSKY S, RATTI C, et al. A new insight into land use classification based on aggregated mobile phone data[J]. International Journal of Geographical Information Science, 2014, 28(9): 1988-2007. DOI:10.1080/13658816.2014.913794 |
[18] |
江贵林, 胡访宇, 石立兴. 基于呼叫详细记录数据的城市功能区识别[J]. 计算机应用, 2016, 36(7): 2046-2050. JIANG G L, HU F Y, SHI L X. Urban functional area identification based on call detail record data[J]. Journal of Computer Applications, 2016, 36(7): 2046-2050. (in Chinese) |
[19] |
TU W, CAO J Z, YUE Y, et al. Coupling mobile phone and social media data: a new approach to understanding urban functions and diurnal patterns[J]. International Journal of Geographical Information Science, 2017, 31(12): 2331-2358. DOI:10.1080/13658816.2017.1356464 |
[20] |
JIA Y X, GE Y, LING F, et al. Urban land use mapping by combining remote sensing imagery and mobile phone positioning data[J]. Remote Sensing, 2018, 10(3): 446. DOI:10.3390/rs10030446 |
[21] |
BIRANT D, KUT A. ST-DBSCAN: an algorithm for clustering spatial-temporal data[J]. Data & Knowledge Engineering, 2007, 60(1): 208-221. |
[22] |
LEO B. Random forests[J]. Machine Learning, 2001, 45(1): 5-32. DOI:10.1023/A:1010933404324 |
[23] |
PRAAGMAN J. Classification and regression trees: Leo BREIMAN, Jerome H. FRIEDMAN, Richard A. OLSHEN and Charles J. STONE The Wadsworth Statistics/Probability Series, Wadsworth, Belmont, 1984, x + 358 pages[J]. European Journal of Operational Research, 1985, 19(1): 144. |
[24] |
ELOMAA T, MANNILA H, TOIVONEN H. Machine Learning[C]//Proceedings of the 13th European Conference on Machine Learning. Berlin, Heidelberg: Springer, 2002: 1-5.
|
[25] |
KIBRIYA A M, FRANK E, PFAHRINGER B, et al. Multinomial Naive Bayes for text categorization revisited[M]//WEBB G I, YU X. AI 2004: advances in artificial intelligence. Berlin, Germany: Springer, 2004: 488-499.
|
[26] |
ZHANG M L, ZHOU Z H. ML-KNN: a lazy learning approach to multi-label learning[J]. Pattern Recognition, 2007, 40(7): 2038-2048. DOI:10.1016/j.patcog.2006.12.019 |
[27] |
HOSMER D W, LEMESHOW S, STURDIVANT R X. Applied logistic regression[M]. [S. l. ]: Wiley, 2013.
|
[28] |
MASON L, BAXTER J, BARTLETT P, et al. Boosting algorithms as gradient descent in function space[EB/OL]. [2021-05-10]. https://www.researchgate.net/profile/Marcus-Frean/publication/2750572_Boosting_Algorithms_as_Gradient_Descent_in_Function_Space/links/09e4150617c0848d46000000/Boosting-Algorithms-as-Gradient-Descent-in-Function-Space.pdf?origin=publication_detail.
|