时间:2022-09-22 23:17:10
导言:作为写作爱好者,不可错过为您精心挑选的10篇网站数据分析报告,它们将为您的写作提供全新的视角,我们衷心期待您的阅读,并希望这些内容能为您提供灵感和参考。
那么,数据分析师们如何实现从数字到观点,以下是我的五点建议:
1、不仅要对比差异,而且要对比趋势
网站分析软件让分析师去对比连续的数据,例如:按月、按年来比较变成很容易,但是对于一些逻辑上的比较,例如:工作日每天,当前与上周的同一天等在对于软件的实现有一定难度。然而,最好的发现趋势的方法还是把数据导入到excel中,通过透视表去发现数据中的趋势。还可以在分析中加入一些统计指标,均值、方差、均方差;
2、在形成结论前请深入分析数据的异常
对于一个网站分析师来说,没有什么出现那种“狼来了”更悲剧的事情。曾经有一个同事对于一次网站的活动表现非常忧虑,因为自从这个活动上线后,指标连续8周下降。后面分析发现这是一个针对返校的活动(国外大部分大学每学年为三个学期,开学时间分别是8月、1月、5月),但那个时间正赶上感思节(感恩节是在每年11月的第四个星期四)。
对于之前讨论的情况,计算方差是一个很好的评估你的数据变化是不是在统计学上显著,是否你的变化的数据落到二个方差之外。(译者备注:如果一个变量符合正态分布,则其95%的值会落到均值左右二个方差内。这也许就是为什么时候你会听到一个分析师说,这个变化超过5%了吗?超过应该给予足够的关注。)
3、细分是更深入的分析的基础
发现影响数据变化的关键因素(显著变化的驱动力)可能需要花费你超过90%的时间与精力。有时间,导致数据明显变化的原因可以很容易被发现。有的时候为了回答一个数据的变化,你可能需要花很大精力去研究。然而,通过对数据细分(数据行业有一句话:无细分,吾宁死),您可以快速找到影响的未来趋势变化共享行为特征。
4、在报告中与对商业的影响联系在一起
你在报告中必须向听众这样一个问题:为什么我需要关心?常规中,分析结果可以提高收入、节约费用、或者提高用户服务满意度。例如,针对季节性的促销活动,网站的着陆页是不是比去年表现的好。如果是,需要多快去实现这些改变,这些改变对于整体的影响,是不可以实现设定的销售目标。
“一带一路”官网相关负责人向《财经界》记者表示,官网上线一个月来运行平稳,社会反响良好。目前,网站累计访问量已近140万,多数新闻媒体开始转载官网稿件,具备较好媒体传播能力。我们将密切配合“一带一路”国际合作高峰论坛,全力做好报道工作。
事实上,这种底气还来自于官网背后的强大支撑。2015年,国家信息中心先后组建了国家发展改革委互联网大数据分析中心和国家信息中心“一带一路”大数据中心,前者侧重于国家宏观经济监测预测、政策评价等大数据分析,后者侧重于“一带一路”及海外大数据分析,共同为官网提供全方位的数据支撑。
该负责人进一步表示,高峰论坛之后,官网还将着力开展三项工作:一是加快完善网站各项管理制度,加强团队业务培训,保障官网内容生产高标准、高质量;二是马上启动网站二期建设,计划在2017年年底实现俄文版、法文版、阿拉伯文版、西班牙文版上线运行,届时将覆盖全球大部分地区;三是探索开放合作机制,拓展官网信息传播渠道,加强品牌化建设,提升网站综合信息服务能力。
Q :《财经界》
A : “一带一路”官网相关负责人
两个“中心”的强大支撑
Q:“一带一路”官网今年3月上线,为什么要成立这个网站?国家信息中心做了哪些筹备工作?
A:深入推进“一带一路”建设,是“十三五”以及更长一段时期我国实行开放发展的重大战略任务,国际国内政府部门和社会各界都十分关注和高度重视。有效打造能够及时在线“一带一路”权威信息和开展交流互动的官方网络平台十分必要。第一,可以全方位、精准化、集成化地和展示我国推进“一带一路”建设的倡议构想、重大规划、重要政策、重要建设需求和成果、重大活动等专项信息,以及各类基础性数据和基本信息,有利于引导海内外广大受众全面、客观、深入、准确地了解当前现状以及发展趋势,增强战略互信;第二,可以借力官网这一开放平台,强化与“一带一路”沿线国家和地区的信息互联互通和交流,以及与广大海内外受众的互动答疑解惑,及r回应国内外关切,积极传播正能量;第三,可以为深化拓展国际合作空间特别是企业合作和人文交流提供可信赖的信息服务,同时未来通过采取与不同国家、地区合作共建的形式,调动更多资源和社会力量参与“一带一路”投资建设和经贸合作。
在这样的背景下,国家信息中心按照推进“一带一路”建设工作领导小组办公室关于建设“一带一路”官网的部署和要求,基于信息中心在网站建设运维、“一带一路”大数据等方面的经验和基础,积极整合各方资源,创新建设模式,自2016年4月启动官网建设工作。一年来,在亿赞普集团的大力支持下,我们建立了专业的网站建设队伍,完成了从栏目体系设计、页面设计、功能设计、前后台搭建、内容采集和编辑上传、配套制度和标准制定等工作,并在上线前对网站安全做了重点加固。3月21日,官网正式上线运行。网站上线引起社会各界广泛关注,目前运行状态良好,用户访问量逐周增加,实现了良好开局。
Q:2015年,国家信息中心组建了两个“中心”―― 国家发展改革委互联网大数据分析中心和国家信息中心“一带一路”大数据中心,能否为我们介绍一下这两个中心的相关情况?它们与“一带一路”官网之间又是什么关系,工作上是如何互相配合的?
A:为贯彻落实国家大数据发展战略,提升以大数据支撑国家发展改革委核心业务的服务水平,2015年4月,国家信息中心组建国家发展改革委互联网大数据分析中心,主要面向国务院、国家发展改革委、各级发改部门和相关政府部门提供互联网大数据分析与决策支持。
同时,为更好服务国家“一带一路”建设,2015年12月,国家信息中心联合亿赞普集团共同发起成立了国家信息中心“一带一路”大数据中心,该中心以“一带一路”大数据开发应用为重点,以支撑政府决策和服务企业及社会需求为导向,以广泛深度归集全球“一带一路”相关信息并建设综合数据库为基础,以打造若干专业化、开放性、机制化大数据合作平台为抓手,以中国一带一路网和一带一路大数据综合服务门户为载体,打造基于大数据的“一带一路”特色智库,为有关政府部门和社会提供多元化、个性化、可视化的大数据产品和服务,提升“一带一路”大数据决策支持能力和综合服务水平。
国家发展改革委互联网大数据分析中心主要侧重于国家宏观经济监测预测、政策评价等大数据分析,国家信息中心“一带一路”大数据中心主要侧重于“一带一路”及海外大数据分析。这两个中心为官网提供主要的数据支撑。
Q:大数据在一带一路战略实施中有何重要意义?
A:“国之交在于民相亲,民相亲在于心相通”。信息是中国与“一带一路”沿线国家加强沟通、扩大共识、深化合作的重要基础,是政府和企业决策的重要依据。“一带一路”横跨亚、欧、非大陆,涉及国家众多,各国经济发展水平、资源禀赋、基础设施、政治制度、投资环境、人文风俗千差万别。如何消除建设过程中的信息不畅通、不对称,构筑快捷、通畅的信息“高速路”,不仅是促进民心相通的基础工程,更是推进“一带一路”建设、促进区域内国家均衡发展的必然要求。正所谓“兵马未动,粮草先行”,当前我们正处在大数据时代,信息不仅是核心资源,还是关键的生产要素。对信息资源掌握的多寡成为国家软实力和竞争力的重要标志,很大程度上决定企业竞争力的强弱,也影响着合作共赢的实现效果。构建“一带一路”大数据决策支持体系,加强对“一带一路”相关信息和数据的采集存储与分析挖掘,对于支撑“一带一路”战略决策和服务企业“走出去”都具有十分重要的意义。从2015年开始,我们探索创新从大数据应用角度开展“一带一路”常态化信息归集和大数据专项分析,每半个月向“一带一路”领导小组办公室和国家发展改革委提交大数据专题分析报告,领导批示率很高。2016年10月,我们基于前期工作基础,结集出版了《“一带一路”大数据报告(2016)》,获得了社会各界高度关注和一致好评。
Q:“一带一路”大数据中心要打造成为基于大数据的“一带一路”特色智库,目前来看,成效如何,可以提供哪些大数据产品和服务?对这个特色智库的功能我们可以有哪些期待?
A:目前“一带一路”大数据中心主要进展包括:一是形成了包括国际互联网、国内互联网、国内统计、国外统计、核心业务、共享交换等六大类数据源的“一带一路”数据资源归集体系,于2016年2月26日建成“一带一路”综合数据库(一期)工程;二是基于数据库及大数据分析技术,形成了多样化大数据分析产品,建立了常态化“一带一路”大数据决策支持机制,已陆续向国家推进“一带一路”建设工作领导小组办公室报送了50余份大数据分析报告;三是开通了一带一路大数据综合服务门户,积极承建国家“一带一路”官网,初步形成“一库两网”的集成融合体系;四是积极推进分中心建设和行业合作。先后与海南、大连、重庆等地签署战略合作协议,共建地方分中心。推进与中央电视台、北京大学等有关机构合作取得积极成效;五是研发了基于大数据的“一带一路”系列指数,出版了《“一带一路”大数据报告(2016)》,了《“一带一路”贸易合作大数据报告2017》,国家信息中心“一带一路”大数据品牌影响力进一步提升。
下一步,我们将继续围绕打造“一带一路”大数据特色品牌的目标,努力橛泄鼐霾卟棵藕蜕缁崽峁多、更好的大数据产品和服务。
将进一步助力国际合作
Q:做好宣传、讲好故事是“一带一路”倡议推进中的重要工作,官网的重点栏目设置都有什么考虑?除了单纯的信息收集,还有哪些宣传路径?
A:官网的重点栏目主要围绕传递信息、沟通文明、合作共赢的基本宗旨设置,目前设置了海外要闻、国内要闻、政策环境、五通发展、基础数据、企业风采等主要信息类栏目,同时开设“一带一路”基础数据库、政策库、项目库、企业库与人才库等服务类栏目,以及共话丝路、留言板等互动类栏目。上述栏目设计配合新媒体和新技术传播方式,旨在建立起国内外关于“一带一路”的权威信息体系,全面生动反映“一带一路”方方面面的进展,科学准确阐释“一带一路”核心理念。
根据网宿的数据分析,人们大多喜欢在刚上班时关注金融、证券的行情;中午休息时,网页游戏则更受欢迎;下午股市、证券等网站的交易时间结束前,这类网站会再度集中“迎客”;下班后,社交类网站和视频网站才是大多网民最爱去的地方。而7×24小时开业的网上商城已经渐渐成为网民生活的一部分,随时都会有人想要“逛逛街”。
北京人最爱SNS
该报告显示,SNS(社交网络)的访问高峰出现在20:00;网页游戏白天的访问高峰期出现在12:00,晚上的高峰期出现在19:00;视频网站的访问高峰出现在21:00;政府和企业网站访问集中在工作时间;招聘类网站网民访问峰值出现在工作日10:00~11:00;财经类网站的访问最高峰出现在上午9:00、下午13:00~14:00以及晚上21:00,而电子商务网站的访问时间整体比较平稳,没有明显峰值。
网宿的报告还显示,人口和经济发达程度对网民地理分布比例有重要影响,人口多、经济越发达地区网民访问比例越高,反之则比较低。2011 年第一季度, 对于SNS(社交网络),来自北京、江苏、山东的网民访问频率最高;广东、山东、河北的网民则更钟爱网页游戏;对电子商务类网站的访问量,广东、上海、北京最高;对视频类网站的访问量,广东、浙江、江苏排在前三位;访问政府、企业类网站的时候,来自广东、北京和江苏三省的访问量名列前三。
定制化项目效率低下
艾瑞咨询集团(iResearch)是一家专注于网络媒体、电子商务、网络游戏、无线增值等新经济领域,深入研究和了解消费者行为,并为网络行业和传统行业客户提供市场调查研究和战略咨询服务的专业市场调研机构。
目前,艾瑞咨询集团可以向企业提供线下报告和软件两种定制化咨询报告服务。但是,企业客户的定制化需求非常多变,艾瑞咨询集团生成一份线下报告交付周期需要3至4周,提供软件的交付周期则需要半年。再加上项目所需人工成本升高、迭代周期延长,艾瑞咨询集团往往不敢承接太多定制化项目。
通过调研,笔者发现了艾瑞咨询集团的真正需求:根据时间维度和网站汇总对用户的来源地区、来路域名、页面访问次数、停留时间、有效访问次数、跳出率、回访者、新访问者、回访次数和回访相隔天数等相关数据进行统计分析,并且还能够在动态添加条件之后,通过对监测用户行为获得的数据进行分析,以最终得出更加详细、清楚的用户行为习惯。
因此,艾瑞咨询集团迫切需要一种更加敏捷、高效的大数据分析工具提升定制化业务的效率。
大数据面前:敏捷BI PK传统BI
在解决艾瑞咨询集团面临的难题时,传统BI的做法是,IT人员事先根据需求分析进行建模,建好二次表或打Cube并提前汇总好数据,业务人员才能在前端查看到分析结果的报表。虽然这种做法很成熟,但是解决不了艾瑞咨询集团的难题。
首先,业务人员查看的报表相对静态,分析的维度和度量的计算方式已在建模时预先设定好,不能更改。例如,定好了求和或求平均数,再想改成求方差必须再去修改模型。
其次,分析需求变更时,业务人员不能直接调整报表,需要IT人员重新建模或修改已有分析模型,耗时较长,响应速度较慢。
最后,有些企业的数据量很小,也需要按照此流程和架构来进行大费周折的数据分析。
造成这些问题的本质原因是,过去的技术架构针对海量数据的计算能力不足,企业用户需要通过建模、二次表、Cube提前进行数据运算汇总。
艾瑞咨询集团希望为企业客户提交这样一份分析报告,不仅能看还能动态分析。对于艾瑞咨询集团来说,数据展现应该是起点而不是终点。看到了数据,要能交互式分析、深入向下挖掘,要能发现问题并找到答案,还要能采取行动。与数据交互的过程要足够快,如果用户每次点击需要等三五分钟才出结果,就无法进行交互分析。
并且,分析报告应能让非IT部门的同事直接在分析平台上做出来。不能把所有的分析报告需求都提交到IT部门,这样会严重增加IT部门的工作负担。同时,敏捷BI的实施和操作要简单化,让业务人员可直接使用。
同时,分析报告需求经常需要牵涉到数据层的改动,需要IT部门去改进数据层和业务层,传统BI平台需要一两个月才能完成模型梳理。敏捷BI无需事先建模,可以在分析过程中灵活调整分析维度和报表展现,需求变更可以在一天之内响应,提升企业的洞察力决策力。
与传统BI的重量建模、统一视图不同,敏捷BI采取轻量建模、N个视图的方法,不建二次表和Cube,数据导入后可以直接进行分析,并且业务人员可以实时调整分析的维度和度量的计算方式,极大地增加了灵活性,真正做到和数据对话。
既然有这么便捷的方式,为何传统BI不采用这种架构呢?那是因为,传统技术架构没有引入大数据技术,面对海量数据无法在用户点击后的几秒内就展现企业客户需要的分析结果,因此必须通过建模提前把数据汇总好,才能保证分析报表展现时的速度。
因此,实现敏捷BI的前提是采用新架构处理数据,其涉及的技术包括分布式计算、内存计算、列存储、库内计算等。敏捷BI可以通过更低的成本、更短的上线周期,快速让企业洞察到数据的含义和价值。
业务效率数倍提升
深入研究艾瑞咨询集团要分析的数据,笔者发现,艾瑞咨询集团每天要分析的数据量达几千万条,且不同企业客户的分析需求各不相同。因此,复杂多变的多维度分析需求对分析工具的分析性能提出了更高的挑战,而传统的数据库和Hadoop架构已经无法满足高性能和即时分析的需求。
为此,艾瑞咨询集团考察过国外一些知名的产品,但是当他们获知产品的价格和后续的服务费用之后只能放弃。而国内大多数的分析工具大多是上一代BI,需事先建模再进行分析,难以应对灵活的多维度分析变化需求,且针对大数据量的处理能力不能满足要求。
最终,艾瑞咨询集团选择了永洪敏捷BI技术。当艾瑞咨询集团将三个月的细节数据(约50亿条)导入敏捷BI系统,直接就可以展现出定制分析报告。对比原先基于Excel和SQL编程的分析方法,艾瑞咨询集团的业务效率获得数倍的提升:线下报告交付周期从3至4周缩短至小于1周,软件交付从半年缩短至一个月。
同时,艾瑞咨询集团原来由于担心需求变化导致没有能力交付的很多项目被收入囊中。采用敏捷BI工具后,艾瑞咨询集团可以在几天内快速搭建原型向客户展示,任意的需求变更都可以一周内调整完毕。这种快速原型试错的方式,使得艾瑞咨询集团有能力承接很多此类项目。
由于业务效率的极大提升,有能力承接更多的项目,艾瑞咨询集团的收入空间也出现了数倍的增长。与此同时,艾瑞咨询集团的客户满意度也稳步提升。
不仅如此,为了提供更加直观可交互的分析报告,提升企业用户体验,艾瑞咨询集团基于敏捷BI工具,构建了一个新型SaaS平台。艾瑞咨询集团把企业客户用Hadoop架构存储的数据,通过敏捷BI提供的接口导入到数据集市内,然后通过敏捷BI快速呈现出结果。
1引言
近年来,暴雨等极端天气给社会管理、城市运行和人民群众生产生活造成了巨大影响,加之部分城市排水防涝等基础设施建设滞后、调蓄雨洪和应急管理能力不足,出现了严重的暴雨内涝灾害。《全国城市市政基础设施规划建设“十三五”规划》提出“加快对城市易涝点整治”“建设暴雨内涝监测体系,提高内涝预报预警能力。”如何及时、准确、完整地掌握各个城市排水防涝工作进展,对城市排水防涝工作进行科学、有效的监督指导,成为住建部、省、市城建管理部门的迫切需求。大数据技术在海量异构数据融合、分布式数据处理与计算、数据可视化等方面具有优势,[1]融合大数据技术与城市涝情监管预警业务,成为客观分析排水防涝效果,科学指导城市安全度汛的有效方法。[2]
2应用需求
基于大数据技术,通过数据集成、互联网信息爬取、传感器采集等方式收集城市易涝点信息、城市降雨信息、城市涝情信息,为用户提供综合数据分析、可视化展现等服务,为城建管理部门监督、指导城市开展排水防涝工作提供支撑平台。系统主要需求包括以下三方面:①准确、及时掌握城市降雨及涝情信息。能够从气象网站获取全国主要城市的逐小时降雨信息。从门户网站、微博等渠道爬取城市涝情相关信息,及时掌握全国各地涝情程度和影响;②城市涝情信息预警预测。综合降雨量、城市防涝标准、易涝点治理进展、历史涝情等信息,建立城市涝情预警分析模型,对全国城市未来涝情情况进行预警,指导城市排水防涝工作;③对降雨、积水、涝情等信息进行综合利用,提供每日涝情情况汇总报告、涝情周报、涝情预警情况报告。辅助领导决策,满足监督、指导各地开展排水防涝工作的需要。
3系统建设方案
3.1数据架构。排水防涝信息系统融合易涝点基础信息、补短板项目进展信息、易涝点实时监测信息、城市涝情信息、城市降雨信息,形成排水防涝综合数据库,支撑排水防涝业务处理及科学决策需要。排水防涝数据体系包括:基础数据、业务数据、决策分析数据三类:①排水防涝基础数据:基础数据包括代码数据、基础数据、空间数据。基础数据在排水防涝系统各模块共享使用;②排水防涝业务数据:包括补短板项目业务进展数据、易涝点实时监控数据以及从互联网、第三方采集的降雨数据、涝情数据、统计年鉴等排水防涝相关数据,为排水防涝分析决策提供支撑;③排水防涝决策分析数据:决策分析数据是依据数据分析与综合决策要求,对排水防涝业务数据进行加工处理形成的数据,包括排水防涝统计数据、治理系统评价数据、涝情分析预测等数据。3.2技术架构。排水防涝信息系统利用大数据平台的数据采集、存储、计算、分析能力构建,由基础设施层、综合数据库层、大数据技术支撑层、排水防涝应用层以及信息安全体系、数据指标体系组成,构建科学合理的数据分析、涝情预测模型,通过丰富、形象、易用的数据可视化技术,满足排水防涝业务的数据应用需求。①基础设施层:通过云计算技术,将网络、计算、存储、安全等基础设施池化,为大数据支撑平台、综合数据库、排水防涝应用提供稳定、可靠、高效的运行环境;②综合数据库层:将易涝点数据、涝情数据、降雨数据、监测数据等按照数据标准体系进行清理、转换、加载等处理,形成满足业务处理与分析决策的综合数据库;③大数据技术支撑层:满足分布式环境下海量异构数据采集、存储与资源管理、分布式计算框架、大数据分析与可视化展现等功能需求。主要的技术组件包括地理信息、信息爬取与搜索、数据挖掘、集成接入(ETL)、遥感遥测分析等;④信息安全体系:围绕信息保密性、真实性、可用性(CAA)目标,参照信息系统安全机制构建涵盖物理安全、网络安全、应用安全、数据安全、管理安全的数据安全服务体系,为排水防涝信息管理提供安全的数据服务;⑤数据指标体系:建立排水防涝信息的数据标准、技术标准和管理标准,确定数据采集、数据集成、数据共享的技术路线,推动数据互联互通与信息共享,形成排水防涝顶层数据指标体系;⑥排水防涝应用层:梳理排水防涝信息管理业务流程,按照数据指标体系要求,提供易涝点管理、涝情信息管理、降雨信息管理、综合数据分析、业务一张图、涝情预测等服务,满足排水防涝业务需求。3.3功能架构。排水防涝系统主要功能包括:城市降雨信息管理、涝情报告生成、综合展现一张图、统计分析、基础信息管理等模块。①城市涝情预警。融合降雨数据、防涝标准、历史涝情数据,构建涝情预警模型,提供城市涝情预警预测服务;②涝情报告生成。利用网络爬虫及语义识别技术,从微博、门户网站等渠道采集城市涝情信息。提供城市涝情周报、日报等报告生成功能;③综合展现一张图。基于二维GIS地图展现城市降雨、涝情以及易涝点位置、积水、视频等数据,实现相关数据的综合展现;④统计分析。从行政区域、时间等维度提供涝情分布、涝情趋势对比分析等功能,通过统计图表方式,实现数据的直观展现和应用;⑤基础信息管理。对城市防涝标准、易涝点位置、监测设备等基础信息进行管理,为规范城市涝情、降雨、积水等信息提供支持。
4关键技术
4.1涝情信息爬取与识别技术。4.1.1涝情信息爬取。通过爬虫采集数据主要包括三种方式:定向采集、扩展采集以及源搜索。定向采集是指限定站点或者频道来搜索,实现精确的数据采集;扩展采集是指通过设定采集的起始点和采集的深度来实现比较精确的数据采集;源搜索是指利用搜索引擎(如百度、搜狗、360等),通过设置关键词组来实现数据的非精确采集。本项目采用定向采集方式。按照数据采集范围、关键词持续采集数据,并对重复数据进行去重,能够根据语义过滤垃圾数据。分布式城市涝情信息爬虫体系包括如下四部分:①系统管理控制台:对爬虫系统部署的软硬件资源进行监控及动态管理,包括服务器资源及网络状况、爬虫进程运行情况以及异常事件处理等;②爬取规则定义:能够依据网络爬虫的运行状况和信息爬取效果对爬取规则进行定义及优化。主要定义的爬取规则包括:爬取范围、优先策略(深度、广度)、分析词策略(关键词、剔除词)、爬取频率等;③功能中间件:主要包括爬取中间件、爬取防屏蔽中间件、数据存储中间件等,提供数据采集、分析、避免反爬取策略、数据存储及查询服务;④分布式基础设施:采用“主从”模式构建,主节点将爬取、分析任务在从服务器动态分配,并建立异常处理机制,实现爬虫高效、稳定运行。4.1.2涝情信息识别。网络爬虫依据“大雨、内涝”等关键字采集的舆情数据不都是有效涝情信息,存在大量噪声。为了提高爬虫获取涝情数据的准确率,构建了“正则关联”与机器学习算法结合的涝情信息识别模型。通过机器学习算法进行语义理解,建立爬虫抽取的数据类别库,即判读每一条数据是否与洪涝相关,从而将样本库分为两类。通过卷积神经网络(CNN)和循环神经网络(RNN)提取文本上下文语义特征信息,依据属性特征对其进行分类,判别爬取的内容是否属于涝情相关的数据。该模型进一步提高了涝情数据的精准度。4.2城市涝情预警预测技术。以降雨预报、历史降雨信息、历史涝情信息、排水防涝标准、易涝点治理进展为主要因子构建城市涝情预测模型,将风险划分为“最高”“高”“较高”“一般”“无”5种等级,并三天内各城市的风险预警,为指导城市内涝工作提供决策依据。通过接入涝情城市、基于内涝点的降水实况及预报、覆盖内涝城市的降水实况及预报等数据,通过滚动计算方法,将其与城市防涝标准做对比,通过制定风险预警策略,预判城市涝情风险和易涝点涝情风险,并实时涝情预警信息。4.3排水防涝数据可视化技术。通过大数据技术融合城市涝情舆情信息、城市降雨信息、城市涝情监控实时信息,利用专题一张图、报告生成等方式实现多维度叠加式数据可视化,更好地服务综合管廊建设管理部门的规划和决策。①排水防涝专题一张图。基于GIS的业务多图层综合展现,将全国易涝点、降雨和涝情信息集中在一张图,关联降雨对涝情的影响,科学评估易涝点治理效果;②排水防涝业务分析报告:面向不同用户的业务需求,按照报告模板要求的格式、数据快速生成分析报告。报告采用文字、表格、统计图等多种数据展现形式,内容包括降雨分布情况、涝情分布情况、降雨与涝情关系分析等。
5结论
文章研究大数据在城市涝情监管预警领域的应用方案,充分发挥大数据在分布式、海量、异构数据采集、存储、处理、分析方面的优势,改变传统信息采集方式,融合易涝点数据、降雨数据、涝情数据、补短板项目数据,实现“填报型”到“监控型”应用的转变,构建城市排水防涝效果评价、涝情预测等数据分析应用模型,为促进排水防涝工作提供有力支撑。
参考文献:
[1]孙敏,王琳.大数据时代下的数据可视化方法分析[J].软件,2019,40(9).
[2]张丽虹.大数据背景下城市排水防涝设施动态管理系统设计[J].工程管理与技术,2018(4).
[3]薛祥光,蒋世峰,李萌,等.GIS在城市排水防涝中的应用趋势[J].科技视界,2016(1):71-72.
[4]侯圣峦,刘磊,曹存根.基于语义文法的网络舆情精准分析方法研究[J].计算机科学,2014(10).
目前的团购模式,是基于互联网发展十余年的经验积累,对商业和人性的发挥做到了极致。如此模式到了国内,很容易走上一条具有“中国特色”的道路。
可以看到的是,团购网站深陷价格战,大家进入低价的竞争。你推出的套餐128,我要推出99的,他要推出60的。大家在这个市场中,不是根据自身的情况定价,拼的是谁有钱,谁可以赔更长时间。就算赔到剩寡头竞争的时候,利润肯定还是上不去,因为特殊的市场环境和模式的易复制性决定了这一切。当只用低价吸引贪便宜的低端消费者,能为商家带来什么?为消费者带来什么?
另外,目前进行团购的商家整体水平很低,甚至很多别有用心的商家在利用团购,例如面临倒闭的商家,利用团购赚一票走人等层出不穷。
好的企业也会进行团购尝试,但是价格、产品、规模控制得很死,团购网站几乎零利润在为优质企业服务,而且在优质商家面前,没有区别性可言。
当一个行业没有核心产品而又陷入价格竞争的时候,这个行业就已经死了。更别说,从业者仍在疯狂地烧钱来做这件事情了。
面对如此境况,要突围,必须要创新。社区化电子商务是未来的发展方向,也是具有活力和充满创新的领域。将媒体、电商、社区相融合,开发优惠及代金券系统,让商家吸引目标用户,同时凭借数据分析和挖掘技术,为商家提供全方位的用户数据分析服务,例如各个年龄层、收入的用户购买情况,购买和消费的时间和空间的分布等等。
以新开业商家为例,它的需求是迅速建立知名度、获得体验用户、打开市场,借助传统的团购模式,可以轻松实现这些目标。现在加入社交元素后,可以帮助商家进行团购后客户关系管理,一步步筛选用户,传播品牌文化,强化与消费者的沟通,将其转化为高质量的忠实用户群。其三段式营销策略为:
第一段:预热,新开张
传统媒体:以专业媒体的角度给予商家客观的评价;
网媒:设计套餐,通过团购体验商家的产品和服务;
社区:开通商家官方微博,通过在网站与报道、团购相结合,增加关注度。
第二段:营销,成长期
传统媒体:持续的广告投入与电商平台的平媒推广相结合,保持商家的曝光度,增加读者和消费者认知;
网媒:提交团购购买及消费分析报告,与商家共同分析用户属性与行为;
进行优惠券等销售,使消费者可以更全面地了解商家的产品、体验商家服务;
社区:通过互动平台,使得消费者加深对商家的了解,提高品牌的认知度。
第三段:品牌,成熟期
传统媒体:持续广告投入,打造品牌概念;
2电子烟官方网站建设策划
2.1官网核心管理系统。(1)运营监控:监控网站运营时长、域名状况、流量分析;(2)可视化管理:所见即所得快速修改指定网站内容,即时添加指定内容、即时快速编辑指定内容、即时为指定内容进行展示排序;(3)内容管理:添加/维护内容页面、页面内容管理;(4)商品管理:添加/维护产品、产品分权限浏览、产品展示排序、添加/维护产品类别(支持多级分类)、相关产品推荐、产品评论、添加/维护营销分类、添加/维护产品品牌、产品属性模板设置、产品系列规格设置、产品标记设置;(5)资讯管理:添加/维护资讯、支持分权限浏览、推荐、置顶、拖拽排序、抓取新闻、添加/维护资讯类别(支持多级分类)、资讯批量导入/导出/转移;(6)留言管理:自定义留言类别、留言信息审核、留言回复;(7)搜索优化设置:网站地图提交、网站登录入口提交、搜索引擎优化设置(页面标题设置、页面关键词设置、页面描述设置);(8)流量统计分析:流量分析:实时访客,访问流量趋势;产品分析:产品排行、品类排行;访客分析:访客地区、访客访问次数、停留时间、访问深度、客户端数据分析;来源推广效果分析:搜索引擎数据分析、关键词数据分析推介网站、外部链接数据分析、广告效果分析;官网页面分析:页面排行、站内搜索关键词分析;统计设置:下载/打印分析报告、订阅邮件设置、IP地址黑名单设置;(9)官网会员管理:添加/维护会员、会员批量导入/导出、会员分组管理、会员级别管理。会员积分管理等;(10)官网图片管理:图片库管理:添加/维护图片、图片库多视图管理、图片(批量)添加水印设置、图片(批量)转移。电子图册管理:添加/维护图册内容、添加/维护图册类别、电子图册多视图管理;(11)官网信息设置:网站基本设置、管理员权限设置、网站栏目设置;(12)友情链接管理:添加/维护友情链接、链接分组管理;(13)短信/邮件业务提醒:对访客:会员注册、资格审核通过、密码修改、找回密码、留言被回复;对管理员:有新会员注册、留言、简历以短信与邮件提醒。
2.2移动客户端核心系统。(1)手机客户端:提供企业自有品牌客户端;独有企业品牌客户端标识、品牌欢迎页;通过客户端实时访问企业的最新信息及地图定位;(2)内容管理:添加/维护内容页面,以图文并茂的方式介绍企业信息;(3)产品管理:添加/维护产品信息、设置展示排序;添加/维护产品分类(支持多级分类);管理产品评论、维护产品橱窗和产品品牌、设置产品标记;(4)资讯管理:添加/维护资讯内容,可置顶显示、添加/维护资讯分类(支持多级分类)、可批量转移资讯;(5)广告管理:添加/维护广告。通过广告管理,可以实现Banner动画图片进行添加和维护;(6)图片管理:添加/维护图片、图片处理、图片转移。可批量对图片进行添加、删除、转移;(7)一键电话:访客使用时,可快捷拨打企业电话,即时与企业主动联系;(8)一键留言:访客使用时,可快捷对企业进行留言。企业通过电脑访问网站后台,对留言信息进行审核和回复;(9)一键询价:访客使用时,浏览企业产品时,可进行快捷询价。企业通过电脑访问后台,对询价单进行处理;(10)一键分享:访客使用时,可将当前访问内容快捷分享到其它平台,如微博、空间等;(11)一键地图:访客可快捷查看企业位置(仅中文语言版提供地图功能且为中国地图,台湾省内除外);(12)短信营销:企业最新消息,可通过短信营销让客户周知(操作界面为中文,限发国内手机用户);(13)二维码营销:后台自动生成二维码,方便访客随时随地扫描二维码,访问到企业移动官网;(14)业务提醒:有新留言或询价信息时,将会及时以短信或邮件的方式提醒至企业管理员。
2013年1月底,国双科技在北京正式宣布成立“国双数据中心”,该中心拥有基于OLAP技术的强大交互式数据挖掘平台,可以将数据仓库中的每一个数据通过上百个维度和指标进行关联、交叉、演绎,提供不同深度的分析报告,满足不同视角的数据挖掘和分析需求。当天,国双数据中心首次对外《2012中国互联网发展数据报告》和《2012中国政府网站发展数据报告》。
“基于海量在线数据和先进的网络营销云统计分析平台,国双数据中心将专注于数字化环境下的在线媒体研究和受众研究,并将定期互联网行业报告,向业界分享专业的在线媒体数据研究成果,促进产业发展。”祁国晟表示。
数据也“性感”
“球场上球员的表现不再是谁能进球谁的贡献最大了。”国双科技高级副总裁续扬表示,以足球为例,从门将开出球的那一刻,价值就产生了,哪个球员传出最具威胁对方的球?哪个球员在最关键的时刻盯住对方核心球员?一场比赛下来,功劳最大的不一定是最终进球的那个球员。
“同样,国双科技告诉广告主的不是用户最终达成交易的数据,而是整个用户选择的过程。”续扬认为,广告主往往很难判断,消费者的购买和市场推广有多大的关系,国双科技的职责就是帮助广告主精准地测算出广告的效果。
随着全球互联网的快速发展,越来越多的网络用户通过多种终端、多种平台输出数字内容,驱动整个互联网世界迈入到“大数据时代”,海量数据的运用已成为未来竞争和增长的基础,运用大数据分析用户特征并通过分析提升企业的业务价值,提高企业的核心竞争力。
来自国双科技数据中心的报告显示,数据对企业决策运营越来越重要,大数据时代来临,企业最终需要的是有价值的数据而不是大数据,通过海量数据挖掘用户特征,企业可获取有价值的用户信息,科学分析用户行为,是了解用户、贴近用户最为有效的方式,帮助企业明确品牌定位、优化营销策略。
今天的Facebook日均上传数据100TB,Twitter一天的发推量也会达到2.3亿,全球Email的发送量为2940亿封……企业毋庸置疑地正在迎来一个大数据时代。数据优化和数据分析将成为炙手可热的产业,国双科技也在把握这样一个发展契机。
可口可乐的粉丝喜欢留存可乐的瓶盖,他们会非常熟悉地将瓶盖上的13位字符串敲在网站上,然后满足地拿到可口可乐给他们的积分。事实上,这也包含了国双科技为可口可乐提供的一项专业技术:度量并优化在线渠道对13位字符串转化的贡献。
“我们每天需要分析所有登录iCoke官网的流量数据,然后通过各种分析工具的挖掘,让可口可乐的线上营销方案趋于更加合理。”国双科技国际业务总监吴铮介绍自己每天的工作,除此以外,他还要帮助客户建立从SEM(搜索引擎广告、SEO(搜索引擎优化)、UEO(用户体验优化)等在内的一系列基于效果的在线营销方式。
“通常我们会先帮客户建立一个KPI,这主要是让客户清楚如何去度量自己所投的各种在线广告。”吴铮用流量分析为例,他会把媒体拆分得非常细,哪些是自然流量,哪些是从SEM(搜索引擎营销)过来的,并且也会分析流量与搜索引擎的不同产品线之间有什么关系。不同的产品有不同的属性,衡量标准也各有不同。
树立行业“风向标”
如今,面对移动和社交快速发展的态势,没有人能够忽略其中蕴藏的机会。而国双数据中心的成立,也正式宣告让这样的机会更加明显地出现在消费者、广告主、商家面前。
在国双科技的《中国互联网发展数据报告2012》中显示:网民每日网购在上午10点达到最高峰;52%的消费者在访问4~6次网页后产生购买行为;在在线多媒体营销中,搜索媒体对消费者购买决策的贡献率达到58%,其次为垂直媒体。
2017年3月21日,麦乐购(香港)有限公司创始人&CEO马云告诉《中国经济信息》记者,“母婴行业只是看上去很美,任何花俏的商业模式都无法逾越安全红线。只有电商、消费升级和大数据才是核心竞争力,而安全是根本。”
轻公司别做跨境母婴
在名为“爱他美”的会议室,马云说,“母婴行业要保障食品安全,就要笨一点、慢一点,轻公司做不来。”
2016年,母婴电商行业规模已达1000亿元,但在飞速发展中,“价格战”、“以次充好”等乱象也不断显现。马云说:“用低价吸引来的用户是对价格很敏感的用户,很难沉淀。电商们终究要回归本质,不可能永远依靠低价。”
自麦乐购上线以来,一直围绕食品安全进行布局,马云说:“我们出售的婴幼儿食品都是直接和品牌方或者当地的经销商、商合作,并进行大批集装箱采购,保证产品出现问题,厂商会负责。”
据马云介绍,大批集装箱采购的两个好处:首先能拿到最好的价格;其次是一个集装箱的全部奶粉生产批次是一样的。关于货品检查,公司要求十分严格:首先是厂家首先提供生产报告;其次是委托当地第三方抽样检验;最后在中国入海关还要检验检疫。
“奶粉上都有二维码,实现了流通过程的全称可追溯。消费者可以随时了解到产品的生产时间和出厂时间、进入了什么地区的仓库、什么时候进入保税区、何时配送等信息。”马云说。
马云觉得,海淘、代购等买手制可能更适合服装鞋帽等时尚品。因其很难确保母婴用品在物流过程中不被二次污染。
据介绍,截止目前,公司已有6万平米库房,虽然积压大量资金,但却做到了全部商品的安全可控。在新西兰、美国开设了分公司,在欧洲和日本也有员工常驻,主要负责拓展当地品牌。
马云常说:“我做事情要不就不干,要干就想把它做好。”而走上母婴跨境电商这条路与2008年“三聚氰胺”事件有关。
“当时,浙江有位母亲在‘妈妈说’上记录了自己有关遭遇。这件事极大地触动了我们,我就想一定还能做点什么。”马云说。2009年麦乐购正式上线,目标就是为妈妈们提供安全的食品。“在电商里我们只做跨境,在跨境里我们只做儿童食品、健康相关产品。”他说。
“8年来没出现一起安全事故,但资金投入巨大。”马云说,这也注定了我们不可能是一家轻公司。
从“赚差价”到消费升级
作为一家“重”型“小”电商,除了保障食品安全这条红线,马云还清晰地意识到,跨境母婴电商的商业模式绝不仅仅是“买和卖”这么简单,锁定消费升级、提供营销服务和向上游拓展才是利润增长点。
在千亿元母婴电商市场份额中,天猫和京东占比约80%,“而我们去年的销售额只有约10亿元,量不如人决定了我们的商业模式无法依赖‘赚差价’。”马云如是说。
而他对盈利模式的思考是贯穿于创业始终的。
1999年,北京“清华园”,马云等五位大学生停学创业,成立校园门户“易得方舟”,该网站一度成为教育网内最大的个人网站,并迅速拿到百万美元投资,风光无限。但由于商业模式不清晰,问题也迅速显现。2000年6月,互联网泡沫破裂、资金链断裂,“易得方舟”迅速归零。
马云回忆道:“我们从一家所有人都说好的公司,变成了发不出工资、人去楼空的公司。这让我意识到自己的幼稚,做公司商业模式必须清晰。”
自公司成立以来,已完成两轮共5000万美元融资,但马云宁愿步子小些也要先确定商业模式。在电商们大打价格战时,公司已开始另辟蹊径。
古籍《管子》说:“士农工商四民者。”马云的理解是,当市场越来越成熟和透明时,“商”居于最次,利润最低,必须向其他方向拓展。他首先瞄准了“工”,同时立志成为连接全球各种品牌和中国8000万个有0-6岁婴幼儿家庭的桥梁,即所谓消费升级。
就在《中国经济信息》记者采访马云前,他正在跟美国几家品牌商跨洋视频。“孩子吃的维生素,有机防蚊液,美国监测孩子饥饱的智能硬件等,很多品牌都想进入中国。”他说。在一般贸易方式下,国外商品很难进入中国,但商品只要符合原产国标准并满足一系列条件,跨境电商就可以销售。
“我们帮助这些企业进中国,赚营销服务费,2017年希望可以达到利润一半。”目前,公司已与国外上百家企业签订了总协议,今年还将与国际营养保健品集团荷兰皇家帝斯曼集团达成协议,共同出资设立合资公司进行生产。
电商的人口红利已逝,如何挖掘用户潜力是当务之急。垂直电商的优势恰在于提供优质、全面和多样性的服务。
健康数据挖掘必由路
仅靠食品安全、注资进入上游生产领域、服务国外品牌就可以高枕无忧了吗?马云的回答是“No”!他对母婴市场的理解很另类。作为清华的学霸,他早就将目标锁定于大数据和AI(人工智能)。为保障数据安全,早在2013年,就组建了一支专司儿童健康大数据分析的百人团队。
马云表示,公司在过去8年里已积累了上千万用户的消费记录,这些信息都来自于官网。“我们对一些产品的销售组合非常清楚。例如购买这个配方奶粉的用户会购买怎样的辅食或者营养品,都可以做数据挖掘。”他说。
马云还说,公司将来还将继续收集孩子的年龄、身高、体重、智力差异等信息,然后通过大数据分析为每个孩子画像,个性化地向其推荐特定的配方奶粉、辅食、需要补充钙和维生素的剂量,并制作其在同龄孩子中的身体素质情况报告。
为了搜集更多稻荩公司还将触角下沉,进入二三线城市的母婴门店。“现在母婴用品门店只能销售国产奶粉,而国外品牌奶粉又只能在线上销售,这就形成了互补。”马云说,“我们将销售终端置于这些门店,消费者扫描二维码即可购买。”
据了解,以这样的方式与其合作的店铺已达约2000家。马云说:“不仅帮助线下实体店扩充进口品类,还可以完善最后一公里。更重要的是,还有助于大数据分析。”
公司如果有规范的职位职务体系基础容易统计内部薪酬分布,行业的数据一般来自大型HR咨询公司的薪酬数据库。做跨公司的职位职务对应匹配却是件有挑战性的事情――你怎么知道A公司的八级软件工程师相当于B公司的十级咨询顾问呢?传统上,我服务的那家公司是定向的对标指定,即人工对应到具体同类型公司的同类型岗位。随着技术的发展,现在时髦的基于文本分析的“大数据分析”能够解决更广泛的职位匹配问题,再结合薪酬数据库,能够提供更准确做薪酬对标。可以预计,这种对标方法会成为一种更加普及的应用。
HR咨询公司薪酬数据库的客观性和准确性往往存有争议,大企业做对标时一般会购买几家咨询公司的数据,相互参照使用。然而,现在互联网上各种“晒工资”网站越来越多,例如,基于互联网的大数据分析可能颠覆传统的薪酬数据库服务,企业能够更加实时、准确地做职位薪酬对标,提升人才管理水平。
HR部门的价值从后台服务职能,发展到帮助业务部门挖掘、培养、发展人才,成为企业业务的驱动者,人才相关数据的分析为这样的工作方式转型提供了可能性。不仅是薪酬数据分析,从下图所示的HR相关数据可以产生很多分析机会。