1. 研究主题

        现在是大数据时代,为人的行为模式的挖掘提供新的方式。对人的行为模式进行建模,预测人未来的时空行为,有利于提高人们的生活质量,有利于城市规划建设;如公共交通规划,广告投放等;采样社交媒体数据,不仅有人类行为轨迹,也有具体的行为信息,这有利于深层次挖掘人类行为的方式、信息;个体的日常行为轨迹历程具有一定的重复性和确定性,对这些行为模式进行研究,可以描述一个人的行为特征,并预测其在不久将来的行为,这对于研究评估社交网络人口之间的联系起着至关重要的作用。目前可视化工具很多,动态可视化增强用户与数据的交互性,数据以多维的形式显示,拥有更好地可视性。这对我们的现实生活具有重要意义。

 

  1. 团队成员名单

队长:梁稚媛          成员发展:保研至华中科技大学

队员:张超            成员发展:保研至华中科技大学

队员:李理            成员发展:保研至华南理工大学

队员:夏润泽          成员发展:工作

指导老师:李圣文

 

  1. 研究方向

3.1行人轨迹数据抓取模块

        利用“爬虫”工具,如Arachnid,Heritrix等,抓取社交媒体上用户的定位和具体内容信息,用以深度挖掘人类的行为方式。

        分以下两个方向,位置获取和行为的获取。位置获取,随着以GPS导航仪与智能手机为代表的智能终端的普及,我们可以获取大量的用户实时位置信息,通过GPS,我们获取用户经纬度信息、行驶方向信息,智能手机的用户也可以通过基站定位的方式,估算出用户所在的位置区域。我们也可以做一个类似爬虫的软件,用户浏览社交网站(如微博、Twitter)时,可能会留下位置信息,例如发空间动态时,会附上自己所在的地点,我们可以通过相应的API把这段信息爬取下来;用户行为方式包括用户日常的一些行为习惯,比如经常走的路线,公交站或者地铁站,经常去的地点,经常使用的软件等。主要的获取方式也是通过爬虫软件和参考位置信息得到,通过位置信息的分析,很容易获取用户经常走的路线,出没的站点等。

3.2数据建模模块

        通过采用时空聚类分析,将所得结果结合特定的时空上下文,挖掘和解释用户的日常行为规律,从中预测人未来的时空行为和分析人的行为方式。

3.2.1采取时空聚类分析

        获取数据后,需要对数据进行分析。其中,聚类分析是最常用的技术手段。例如,对用户日常行为特点的研究,先使用meanshift聚类根据用户的历史行为轨迹数据生成其日常驻留区域,并结合时间特点给出结果的语义解释;还可以利用空间信息辅助对结果的解读,如我们可以把聚类获得的用户驻留点与其周边的兴趣点(公园、学校等)相关联,并把用户的出行轨迹串联起来,以此实现对用户出行轨迹的语义解读。

3.2.2采用贝叶斯理论构建个人行为轨迹路径

        贝叶斯理论理论是机器学习的框架,广泛的应用于大数据智能分析中。贝叶斯分析的思路对于由证据的积累来推测一个事物发生的概率具有重大作用, 它告诉我们当我们要预测一个事物, 我们需要的是首先根据已有的经验和知识推断一个先验概率, 然后在新证据不断积累的情况下调整这个概率,整个通过积累证据来得到一个事件发生概率。当我们对用户的数据做出建模后,采用贝叶斯理论进行分析,能对用户的行为做出预测和分析,提高分析的可行性与正确性。

3.2.3构建时空路径评价指数

        在对数据的分析处理中,我们要提炼出高质量的样本节点,对于明显不符合正常数据的节点,要及时剔除,以确保最后分析结果的正确性。

3.3动态可视化模块

        将web的可视化的总体框架分为数据层、服务层、表现层三个部分,利用HTML5 Canvans绘图技术,WebGL三维绘图技术,WebSocket实时通信技术,实现时空轨迹web可视化。

        基于HTML5的移动时空轨迹Web可视化的实现,通过对数据库、浏览器和Web服务器相关内容和技术进行研究,利用WebSocket进行前后台数据传输和HTML5图形绘制方法进行浏览器端图形绘制。我们设计采用基于HTML5的时空轨迹网络可视化架构,整个架构采用MVC模式完成,将整个可视化流程整体划分为数据层、服务层和表示层三个部分,以实现不同层之间的低耦合性,易于扩展和维护。

 

  1. 研究成果展示或总结

4.1时空热点:

        ST-DBSCAN聚类算法获得时空热点,这里是获得40个核心点的信息:

        第1个簇:30.4510701006;114.436222553;2014-06-02 23:10:12.0

        第2个簇:30.500287;114.343729;2014-06-02 16:25:43.0

        第3个簇:30.5054893494;114.400688171;2014-06-02 13:18:38.0

        第4个簇:30.5073887978;114.397505422;2014-06-02 18:45:35.0

        第5个簇:30.5072993896; 114.398139697;2014-06-02 18:45:38.0

        第6个簇:30.5130500793; 114.409309387;2014-06-02 14:43:10.0

        第7个簇:30.4510701006 ;114.436222553;2014-06-02 23:10:12.0

        第8个簇:30.5052604675 ;114.40196991;2014-06-02 14:43:12.0

        第9个簇:30.4795884964 ;114.41077354;2014-06-02 16:04:10.0

        第10个簇:30.543103;114.305196;2014-06-02 23:10:15.0

        第11个簇:30.547258;114.343878;2014-06-02 21:49:56.0

        第12个簇:30.547054;114.342728;2014-06-02 20:43:43.0

        第13个簇:30.5448904806;114.334954159;2014-06-02 20:43:53.0

        第14个簇:30.5258629641;114.35533282;2014-06-02 16:25:36.0

        第15个簇:30.5256195068 ;114.35635376;2014-06-02 17:18:28.0

        第16个簇:30.5176124549;114.376990677;2014-06-02 17:18:23.0

        第17个簇:30.5774433305;114.27005126;2014-06-02 22:17:49.0

        第18个簇:30.5834903717;114.275741577;2014-06-02 21:50:23.0

        第19个簇:30.5732739;114.2853299;2014-06-02 21:49:55.0

        第20个簇:30.5808400607;114.27055802;2014-06-02 19:18:01.0

        第21个簇:30.5813850178;114.274232647;2014-06-02 19:18:03.0

        第22个簇:30.5817115532;114.271573843;2014-06-02 19:17:58.0

        第23个簇:30.5849784187;114.286327858;2014-06-02 23:50:13.0

        第24个簇:30.5848999023;114.285003662;2014-06-02 22:17:46.0

        第25个簇:30.593099;114.305393;2014-06-02 13:18:33.0

        第26个簇:30.593099;114.305393;2014-06-02 13:17:55.0

        第27个簇:30.4510701006;114.436222553;2014-06-02 23:10:12.0

        第28个簇:30.4510701006;114.436222553;2014-06-02 23:10:12.0

        第29个簇:30.4510701006;114.436222553;2014-06-02 23:10:12.0

        第30个簇:30.4510701006;114.436222553;2014-06-02 23:10:12.0

        第31个簇:30.4510701006;114.436222553;2014-06-0223:10:12.0

        第32个簇:30.4510701006;114.436222553; 2014-06-0223:10:12.0

        第33个簇:30.4510701006;114.436222553; 2014-06-0223:10:12.0

        第34个簇:30.4510701006;114.436222553; 2014-06-0223:10:12.0

        第35个簇:30.4510701006;114.436222553; 2014-06-0223:10:12.0

        第36个簇:30.4510701006;114.436222553; 2014-06-0223:10:12.0

        第37个簇:30.4510701006;114.436222553; 2014-06-0223:10:12.0

        第38个簇:30.4510701006;114.436222553; 2014-06-0223:10:12.0

        第39个簇:30.4510701006;114.436222553; 2014-06-0223:10:12.0

        第40个簇:30.4510701006;114.436222553; 2014-06-0223:10:12.0

4.2二维可视化

        导入地图,在空间中描绘点(即行人的经纬度)、并连线。

4.3三维可视化

        使用three.js文件,在浏览器中显示三维效果,在二维基础上多了一个z轴表示时间。