基于大数据的移动用户行为分析研究

2019-10-21 08:08王长会马庆利
现代信息科技 2019年12期
关键词:用户行为

王长会 马庆利

摘  要:基于移动大数据,本文对用户通话到达情况(次数)进行了研究。由于人们生活习惯具有时间规律性,齐次的泊松过程不能完全适合基站的通话到达规律,因此本文引入非齐次泊松过程,在一定程度上解决了齐次泊松过程的不足。根据用户通话到达情况,提出采用非齐次复合泊松过程来估算一段时间某一基站通话总共的时间,从而根据通话流量为基站的合理调度、分配资源提供依据。

关键词:用户行为;通话到达;非齐次泊松过程;复合泊松过程

中图分类号:TP274      文献标识码:A 文章编号:2096-4706(2019)12-0058-03

Abstract:Based on mobile big data,this paper studies the call arrival condition (times) of users. Due to the time regularity of peoples living habits,the homogeneous poisson process is not completely suitable for the call arrival rule of the base station. Therefore,this paper introduces the non-homogeneous poisson process to solve the deficiency of the homogeneous poisson process to some extent. According to the arrival condition of the users call,the non-homogeneous compound poisson process is proposed to estimate the total time of a base stations call in a certain period of time,so as to provide a basis for the reasonable scheduling and resource allocation of the base station according to the call flow.

Keywords:user behavior;call arrival;nonhomogeneous poisson process;compound poisson process

0  引  言

移动流量数据最近几年呈井喷之状。据统计,过去10年增长了4000倍,在2017年底,平均每月全球移动流量达到了9.9EB[1]。移动运营商收集的这些流量数据对于了解人们生活习惯是一笔宝贵的信息资源,关于对它的分析可以涉及许多领域,如都市生活、交通运输和社会网络[2]等方面。本文对大量移动用户的通话到达过程进行研究。早在1909年Arlang[3]把泊松分布成功应用到了通话到达模型中,齐次泊松过程在移动通信网络中也被广泛采用[4,5]。例如,Merve[6]采用了齐次泊松过程,没有考虑时间变化性,而实际上,白天和晚上的通话到达数量是完全不一样的。因此,对一天内的用户流量分析,采用齐次泊松过程已不科学。本文提出采用非齐次泊松过程及其相对应的混合泊松过程来解决现实问题。

1  泊松过程

1.1  齐次泊松过程

CDR(Call Detail Record)数据集来自北京移动,采集10000个活跃用户(每月通话时间大于100分钟),共2453238条记录,时间跨度为2017年11月1日~2017年11月30日,每条记录有6个属性。考虑一天内某一基站通话到达的分布情况,以每一分钟为间隔统计到达次数,假设这一天内通话到达是满足泊松分布的,泊松分布的参数λ表示意义为单位时间内(每分钟)用户到达次数,则在假设的前提下,计算得到λ=1.2167,实际分布和泊松分布如图1所示,可以看出二者相差比较大,即假设不成立,不满足泊松分布。

这是不难理解的,因为泊松分布潜在的含义是:在固定时间t的平均到达人数为λt,而实际的事实是,在凌晨通话到达人数和上午是完全不一样的。因此可以考虑短时(1小时)通话行为分布。

2  结  论

用户的通话到达分析离不开泊松过程,本文针对大量的移动用户的通话行为提出应用齐次、非齐次、复合泊松过程来对用户的通话到达过程进行建模。通话到达实验以每分钟为颗粒度,统计某一基站发现短时间(1小时)内用户通话到达确实是符合泊松过程的,但考虑人类活动的规律性,基站通话到达在一天内的情况肯定具有时变性,因此非齐次泊松过程被提出应用于一天内的通话到达过程,本文也提出了非齊次泊松强度计算的高效方法;针对此基站一天内所有用户通话时间长短分布问题,成功把复合泊松过程应用于此。通过大数据的分析建模可以为移动运营商、设备制造商根据时间合理分配资源,达到节能减排、绿色通信的目的。

参考文献:

[1] Cisco. Cisco Visual Networking Index:Global Mobile Data Traffic Forecast Update,2016–2021 White Paper [EB/OL]. https://www.cisco.com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/white-paper-c11-738429.html,2017-03-28.

[2] Willkomm D,Machiraju S,Bolot J,et al. Primary user behavior in cellular networks and implications for dynamic spectrum access [J]. IEEE Communications Magazine,2009,47(3):88-95.

[3] Erlang A.K. The Theory of Probabilities and Telephone Conversations [J]. Nyt Tidsskrift for Matematik B,1909(20):33.

[4] Jabbari B. Teletraffic aspects of evolving and next-generation wireless communication networks [J]. IEEE Pers. Commun.,1996,3(6):4-9.

[5] Opechowski Z,Correia L M. Analysis of traffic distributions in GSM [C]// Microwaves,Radar and Wireless Communications. 2000. MIKON-2000. 13th International Conference on. S.l.:s.n.,2000:390-394.

[6] Yuksel B,Cingoz M,Karabulut G,et al. Call arrival model for GSM network including handover [C]// IEEE International Symposium on Advanced Networks & Telecommunication Systems. IEEE,2009.

作者简介:王长会(1974-),男,汉族,陕西西安人,工程师,硕士,研究方向:电工技术、网络安全;马庆利(1982-),男,汉族,山西怀仁人,博士,研究方向:数据融合、模式识别、语音编码。

猜你喜欢
用户行为
基于“点击流数据”的电子商务用户行为分析研究综述
基于用户行为数据分析的高校图书馆信息服务平台研究
网络免费学术资源分享及使用行为初探
电力高校图书馆转型智库服务的研究
社会化媒体用户使用动机与行为探析
移动互联网环境下用户行为社交化变迁的探析
基于云计算技术的大数据用户行为引擎设计
基于用户行为分析的智能家居系统的研究与设计
基于CDL话单的高铁无线网络分析
基于社交网络的个性化知识服务模型研究