时间:2022-04-23 23:29:37
导言:作为写作爱好者,不可错过为您精心挑选的10篇云计算数据论文,它们将为您的写作提供全新的视角,我们衷心期待您的阅读,并希望这些内容能为您提供灵感和参考。
云计算的平台构架主要技术有并行编程的模式,分布式文件系统,数据处理模型。其层次如图1所示。云计算的数据应用共分为三个层次:应用层、索引层和数据存储层。同时要了解云计算数据应用系统的三个要素:用户、应用服务器和数据中心。这三个要素各有着不同的功能,用户的功能是存储数据,在数据计算的基础上,计算个体用户和组织用户的数据。应用服务器的功能是维护云计算的系统。数据中心的功能是存贮实际的数据信息。但是,在云计算数据应用系统模型中,存在着很大的安全威胁,主要是来自传统数据的威胁,容易受到影响的对象有客户端、主从结构和病毒的传播,通信的安全性。其中,病毒的传播主要是通过互联网的数据交易服务,病毒侵入计算机网络系统,它的破坏性远远大于单机系统,用户也很难进行防范。现在的互联网中,病毒一般有隐蔽性,传播速度也很快。另外,病毒的制造技术也越来越高级,不仅可以破坏用户的程序,还可以窃取信息,造成系统的交叉感染。这种感传染性的病毒危害性非常大。对于通信故障,网络中通常分为两种类型的安全攻击类型:主动攻击和被动攻击。常见的攻击手段有偷窃、分析、冒充、篡改。对于数据安全来说,除了上述的数据安全,还有新数据的安全威胁,主要表现在几个方面:保密失效威胁、分布式可用威胁、动态完整性威胁。
1.2云计算数据安全模型
典型云计算数据技术如图2所示。该数据安全模型主要分三个层次:第一层的功能是负责验证用户的身份,保证云计算中数据的安全;第二层的功能是负责对用户的数据进行保密处理,保护用户的隐私;第三层的功能是恢复用户误删的数据,是系统保护用户数据的最后一道防线。这三层结构是相互联系,层层深入。首先要验证用户的身份,保证用户的数据信息不被篡改。如果非法用户进入的系统,则进入系统后还要经过加密保护和防御系统。最后是文件恢复的层次,这一层次可以帮助用户在数据受损的情况下修复数据。
2多维免疫的云数据安全
2.1多维免疫算法
多维免疫算法的组成主要依靠生物原理、免疫系统的多维模型、多维免疫的基本原则组成。其中,生物原理是把生物学的理论应用在云计算中。人工免疫系统发展到现在,在免疫能力的发挥方面有了很大的发展。免疫能力的增长是一个漫长的过程,后天的免疫的生成更是一个艰难的过程。在一个系统生成初期,完全没有后天的免疫能力,但是随着身体的成长,免疫细胞逐渐增多,免疫系统也开始形成。多维免疫系统的形成也是这样的。
2.2多维免疫的数据安全原理
阻碍多维免疫的数据安全的因素主要有不可靠网络、节点故障、超大规模的用户访问、数据更新引起的数据不一致性等。为了提高数据管理的安全性,云计算为用户提供了一个一致的入口,只有向用户提供透明的文件,进行文件数据的定位数据选择。对于数据管理服务,应该注意,这项服务是连接用户和系统的。应用服务器和数据中心共同组成了云计算数据应用系统。应用服务器主要目的是方便用户访问历史和相关的文件信息。
2.3多维免疫的云数据安全策略
主要包括文件分布的策略,HDFS文件冗余度计算,多维免疫的文件分布,数据块选择机制等。对于云计算中的用户文件,需要考虑到数据块的数量分布、数据块的颗粒度和数据库的创建时间。多维免疫的文件分布中,首先要掌握文件分布的原理,多维免疫算法和云计算中文件的创建和文件块的分配法是一致的。
1.1数据采集
大数据的采集是整个流程的基础,随着互联网技术和应用的发展以及各种终端设备的普及,使得数据的生产者范围越来越大,数据的产量也越来越多,数据之间的关联也越来越复杂,这也是大数据中“大”的体现,所以需要提高数据采集速度和精度要求。
1.2数据处理与集成
数据的处理与集成主要是对前一步采集到的大量数据进行适当的预处理,包括格式化、去噪以及进一步集成存储。因为数据采集步骤采集到的数据各种各样,其数据结构也并不统一,不利于之后的数据分析,而且,一些数据属于无效数据,需要去除,否则会影响数据分析的精度和可靠性,所以,需要将数据统一格式并且去除无效数据。通常会设计一些过滤器来完成这一任务。
1.3数据分析
在完成了数据的采集和处理后,需要对数据进行分析,因为在进行数据分析后才能体现所有大数据的重要价值。数据分析的对象是上一步数据的处理与集成后的统一格式数据,需要根据所需数据的应用需求和价值体现方向对这些原始样本数据进一步地处理和分析。现有的数据分析通常指采用数据仓库和数据挖掘工具对集中存储的数据进行分析,数据分析服务与传统数据分析的差别在于其面向的对象不是数据,而是数据服务。
1.4数据解释
数据解释是对大数据分析结果的解释与展现,在数据处理流程中,数据结果的解释步骤是大数据分析的用户直接面对成果的步骤,传统的数据显示方式是用文本形式体现的,但是,随着数据量的加大,其分析结果也更复杂,传统的数据显示方法已经不足以满足数据分析结果输出的需求,因此,数据分析企业会引入“数据可视化技术”作为数据解释方式。通过可视化结果分析,可以形象地向用户展示数据分析结果。
2云计算与大数据分析的关系
云计算是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源,是一种按使用量付费的模式。这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络、服务器、存储、应用软件、服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。目前,国内外已经有不少成熟的云计算的应用服务。数据分析是整个大数据处理流程里最核心的部分。数据分析是以数据的价值分析为目的的活动,而基于大数据的数据分析通常表现为对已获取的海量数据的分析,其数据来源可能是企业数据也可能是企业数据与互联网数据的融合。从目前的趋势来看,云计算是大数据的IT基础,是大数据分析的支撑平台,不断增长的数据量需要性能更高的数据分析平台承载。所以,云计算技术的不断发展可以为大数据分析提供更为灵活、迅速的部署方案,使得大数据分析的结果更加精确。另一方面,云计算的出现为大数据分析提供了扩展性更强,使用成本更低的存储资源和计算资源,使得中小企业也可以通过云计算来实现属于自己的大数据分析产品。大数据技术本身也是云计算技术的一种延伸。大数据技术涵盖了从数据的海量存储、处理到应用多方面的技术,包括海量分布式文件系统、并行计算框架、数据库、实时流数据处理以及智能分析技术,如模式识别、自然语言理解、应用知识库等等。但是,大数据分析要走向云计算还要赖于数据通信带宽的提高和云资源的建设,需要确保原始数据能迁移到云环境以及资源池可以随需弹性扩展。
3基于云计算环境的Hadoop
为了给大数据处理分析提供一个性能更高、可靠性更好的平台,研究者基于MapReduce开发了一个基于云计算环境的开源平台Hadoop。Hadoop是一个以MapReduce算法为分布式计算框架,包括分布式文件系统(HDFS)、分布式数据库(Hbase、Cassandra)等功能模块在内的完整生态系统,已经成为当前最流行的大数据处理平台,并被广泛认可和开发应用。基于Hadoop,用户可编写处理海量数据的分布式并行程序,并将其运行于由成百上千个节点组成的大规模计算机集群上。
4实例分析
本节以电信运营商为例,说明在云计算环境中基于Hadoop的大数据分析给大数据用户带来的价值。当前传统语音和短信业务量下滑,智能终端快速增长,移动互联网业务发展迅速,大数据分析可以为运营商带来新的机会,帮助运营商更好地转型。本文数据分析样本来自于某运营商的个人语音和数据业务清单,通过Hadoop2.6.0在Ubuntu12.04系统中模拟了一个大数据分析平台来处理获得的样本。希望通过对样本数据的分析与挖掘,掌握样本本身的一些信息。以上分析只是一些很基本的简单分析,实际上样本数据中所蕴含的价值要远远大于本文体现的。以上举例意在说明基于云计算的大数据分析可以在数据分析上体现出良好的性能,为企业带来更丰富更有效率的信息提取、分类,并从中获益。
2云计算环境下工作流执行模型
科学工作流由工作流管理系统提交和管理,工作流管理系统驻留在提交主机,协调调度工作的流执行。工作流管理系统将工作流中的任务分配到虚拟机的工作节点,任务的执行所需要的数据可以从一个或多个输入数据存储点输入。中间文件在工作流执行期间驻留在数据暂存站点。当工作流结束时,工作流管理系统删除中间数据,同时将输出文件从暂存站点转存到输出站点,然后永久性保存。根据工作流管理系统和目标执行环境的不同,多个数据站点可以协同工作。例如,在输入数据已经驻留在计算节点的情况下,该计算节点和输入点是相同的。图2显示了具有两个任务的工作流,来说明工作流所需的文件是如何在逻辑上独立的站点之间移动的。
3对象存储应用于科学工作流中的数据管理
对象存储系统主要包括存储服务器、元数据服务器、客户端等组成部分,其核心思想是将数据的读和写与元数据存储分离,如图3所示。存储服务器主要负责数据存储、智能的数据分布以及每个对象元数据的管理;元数据服务器主要提供对象存储访问、文件和目录访问管理以及客户端缓存的一致性管理等功能。为了提供可扩展的可靠服务,对象存储器的内部结构非常复杂。例如,亚马逊的简单存储服务(S3)[12]通过REST(RepresentationalStateTransfer)、SOAP(SimpleObjectAccessProtocol)和APIs(ApplicationProgrammingInterfaces)提供检索和删除操作;它将一个对象的多个副本布局在存储服务器上以提供错误情况下的冗余。很多网格存储服务和为数据密集型应用设计的协议可以认为是对象存储,这种架构对构建来自不同的执行环境的数据管理模式而言具有重要的借鉴意义。针对面向大数据工作流,利用对象存储的优点,本文提出两个方案:一是工作流中的3类数据文件都使用远程的对象存储;二是在计算节点上使用共享文件系统作为数据暂存点来存储中间数据。
3.1单独使用对象存储
在这种情况下,所有的数据都存储在对象存储系统中,工作流管理系统需要从对象存储中无缝检索数据,为本地工作流任务使用。在这样的设置中,工作流管理系统从对象存储中检索输入文件和中间文件,然后,工作流中的任务对本地的POSIX文件系统做必要的输入/输出设置,任务完成时,工作流管理系统能够将中间数据和输出数据存储到对象存储中。这样,即使工作流被部署在分布的资源上,科学应用只需要对POSIX做常规的输入/输出设置,就能完成工作流的执行。工作流管理系统与对象存储的多次交互增加了工作流执行的开销,而该开销与分布资源上的计算相比并不算大。对象存储中既有输入数据也有中间数据,只要工作流系统与对象存储能够无缝检索和存储,那么任务执行可以在任何地方。如图4中,任务t1可以在校园计算机集群上完成,而属于同一工作流的任务t2可以在亚马逊的EC2上完成,t1、t2使用亚马逊的S3对象存储作为中间数据文件的暂存。总之,数据存储和执行环境的分离,使得工作流在分布资源上的执行更为容易。一个常见的情况是,当计算需求超过本地或校园计算所提供的资源时,将使用云资源。图4也说明了工作流的数据移动情况。在这里,文件F-i被传送到云中的高性能计算集群工作节点的本地文件系统。任务t1从该节点开始,读入输入文件F-i,然后写入本地文件系统的中间文件F-t,F-t被传回到作为数据暂存点的对象存储中。F-t文件将从对象存储中被检索进入到EC2节点的本地文件系统。任务t2启动后读取F-t文件(该文件是由t1创建),然后将F-o写到本地磁盘,再传送到对象存储中。以上所有的数据传输工作都由工作流管理系统完成。科学工作流中单独使用对象存储的明显不足之处是,数据重复传输会引起在大数据处理过程中的延迟。工作流中的多个任务使用相同的文件,所以重复传输是显而易见的[13][14]。对象存储将对同一资源的重复请求认为是不同的请求,对象存储通常以其良好的扩展性减轻这种重复对工作流性能造成的影响。另外,工作流系统可能在本地节点选择缓存文件,或者利用集群中的共享文件系统来减轻此问题。延迟是整个工作流性能应该关注的问题,云对象存储的设计提供了很高的带宽,但对单个检索或对象操作可能需要数秒钟的延迟。对具有大量文件的数据密集型的科学工作流而言,这种延迟显著增加了工作流运行的时间开销。大型工作流中的另一个问题是多数中间文件需要被传输到对象存储中由相关后续任务检索并使用。由于商业对象存储提供以GB为单位的存储,并按迁移、存储和检索的请求数付费,所以重复传输也就意味着费用的增加。
3.2共享文件系统作为数据暂存
解决由数据重复迁移造成的延迟问题的方法之一,是工作流管理系统将中间文件暂存在POSIX兼容系统中,由多个计算节点文件系统共享,然后在一个资源节点上运行所有的计算。文件共享系统保存了工作流管理系统中所有任务的中间数据,在这种情况下,只有输入输出文件存储在对象存储中。由于中间文件不需要在对象存储与计算节点之间传送,从而可降低使用商业云对象存储的费用。如图5所示,是一个具有文件共享系统的高性能计算环境下具有2个任务的简单工作流。文件F-i被工作流管理系统传送到集群文件共享文件系统。任务t1在计算节点1上启动,从共享文件系统中读入文件F-i,然后将中间文件F-i-t写入到共享文件系统中,任务t2在计算节点2上启动,从文件共享系统中读入F-i-t(由任务t1创建),然后将其输出写入到F-o,F-o由工作流管理系统送到对象存储中,这种方法的优点在传统的有高速并行超级计算环境中尤为显著。例如,XSEDE(ExtremeScienceandEngineeringDiscoveryEnvironment)节点对多数科学工作流点有极大扩展性[15]。值得注意的是,如果第一个计算节点忙而需要将计算溢出到另一个节点时,这种随数据布局任务的方法,损失了布局计算的灵活性。以上两种方法各有所长,选择使用哪种方法取决于工作流的类型和工作流执行的目标环境,这就要求工作流管理系统的开发具有弹性的数据管理方案,允许科学家有效使用对他们有用的基础设施。工作流中的数据管理方案应该具有如下特征:首先,科学工作流管理系统允许任务和数据后绑定,任务依据资源的可用性映射到计算资源上,任务在执行时能够发现资源,并从众多存储中选择数据暂存位置;其次,在科学家只有一个计算资源可用的情况下,允许任务和数据的静态绑定;再次,支持使用不同协议和不同安全机制访问对象存储。
4相关工作
工作流管理系统处理数据的方法很多,Swift[16]采用与本文所描述的第二种模式类似,使用本地文件系统或共享文件系统作为数据缓存,提交主机扮演数据暂存的角色。系统首先选择一个计算站点来运行一个任务,然后将数据从提交主机推向该站点的文件系统,任务执行后,输入的文件被回传给提交主机,中间文件被留在共享文件系统中以便后续任务的执行。相对而言,本文将数据文件(包括输入、输出、中间文件)与提交主机分离,并使用不同的协议,具有更好的灵活性。其他工作流管理系统如Kepler[17],Triana[18]和Taverna[19]关注的是流式工作流中任务的调度和其他Web资源的调用,这些工作流具有图形化的用户界面,允许用户搭建具有不同部件的工作流,但通常没有涉及访问大量数据集的问题。这些工作流中的数据管理很大程度上依赖于用户,数据管理自动化非常有限。Kepler[20]引入了一个MapReduce执行器,允许执行采用MapReduce算法的混合工作流。Hadoop平台通常用来运行数据密集型的科学应用,它所提供的文件操作与POSIX类似,允许随机读,但不允许随机写。在这种情况下,Hadoop平台负责将输入文件切片并分布在各个数据节点。而本文提出的方法主要针对工作流运行在多个不同的执行环境中,代码不能MapReduce的情况。在XSEDE中,任务利用分布式文件系统如GPFS-WAN[21](GeneralParallelFileSystem-WAN)来访问数据,分布式文件系统支持POSIX操作,可以对输入和输出文件进行远程访问。研究表明[22],将大型数据集布局在本地计算节点会更好,但这一策略也会带来新的问题,如不同类型工作流的融合以及数据布局策略算法等。
2.云计算安全:架构、机制与模型评价
3.云计算访问控制技术研究综述
4.云计算采纳行为研究现状分析
5.Google三大云计算技术对海量数据分析流程的技术改进优化研究
6.大数据、云计算技术对审计的影响研究
7.虚拟化云计算平台的能耗管理
8.云计算环境下的分布存储关键技术
9.推动中国云计算技术与产业创新发展的战略思考
10.云计算:体系架构与关键技术
11.我国云计算教育应用的研究综述
12.云计算及云计算实施标准:综述与探索
13.云计算:系统实例与研究现状
14.云计算环境下的联网审计实现方法探析
15.云计算和云数据管理技术
16.基于云计算的多源信息服务系统研究综述
17.云计算安全问题研究综述
18.云计算系统相空间分析模型及仿真研究
19.云计算时代关键技术预测与战略选择
20.云计算方案分析研究
21.基于云计算的B2C电子商务企业价值链优化
22.面向图书馆的云计算研究综述
23.云计算时代的数据中心建设与发展
24.基于Hadoop的云计算辅助教学平台研究
25.云计算研究现状综述
26.基于云计算的智能电网信息平台
27.云计算资源调度研究综述
28.论云计算的服务质量
29.我国云计算教育应用的现状与发展趋势
30.云计算及其关键技术
31.云计算技术发展分析及其应用探讨
32.云计算应用服务模式探讨
33.云计算的发展及其对会计、审计的挑战
34.构建云计算平台的开源软件综述
35.云计算安全研究
36.云计算和虚拟化技术
37.基于企业视角的云计算研究述评与未来展望
38.云计算数据中心的新能源应用:研究现状与趋势
39.云计算环境下的电子文件迁移模型研究
40.云计算:构建未来电力系统的核心计算平台
41.移动云计算的应用现状及存在问题分析
42.云计算中虚拟机放置的自适应管理与多目标优化
43.云计算:概念、技术及应用研究综述
44.基于虚拟散列安全访问路径VHSAP的云计算路由平台防御DDoS攻击方法
45.云计算集群相空间负载均衡度优先调度算法研究
46.电力系统云计算中心的研究与实践
47.云计算初探
48.随机任务在云计算平台中能耗的优化管理方法
49.基于“云计算”的数字图书馆服务模式
50.云计算与信息资源共享管理
51.云计算中调度问题研究综述
52.云计算给图书馆管理带来挑战
53.云计算安全研究综述
54.云计算中数据隐私保护研究进展
55.云计算应用及其安全问题研究
56.基于云计算的电力数据中心基础架构及其关键技术
57.基于云计算和极限学习机的分布式电力负荷预测算法
58.美国联邦政府云计算战略
59.基于云计算平台的新型电子取证研究
60.云计算信息安全分析与实践
61.基于Openstack的科研教学云计算平台的构建与运用
62.云计算安全关键技术分析
63.云计算技术研究与应用综述
64.基于云计算的义务教育学科课程资源共建共享模式
65.面向云计算环境的能耗测量和管理方法
66.基于云计算的实验室管理信息系统设计
67.云计算概念、模型和关键技术
68.云计算环境下的审计业务模式变革研究
69.基于Hadoop的分布式云计算/云存储方案的研究与设计
70.云计算环境中绿色服务级目标的分析、量化、建模及评价
71.基于云计算的图书馆建设与服务发展
72.物联网、大数据及云计算技术在煤矿安全生产中的应用研究
73.基于专利分析的我国云计算技术发展现状研究
74.云计算的价值创造及其机理
75.云计算环境下高校实验教学模式的创新与实践
76.寄心海上云:云计算环境下的知识管理
77.基于云计算的居民用电行为分析模型研究
78.云计算环境下的数据存储
79.基于效用的云计算容错策略和模型
80.云计算环境下的智能决策研究综述
81.云计算安全风险因素挖掘及应对策略
82.我国云计算产业发展趋势及政策建议
83.云计算安全需求分析研究
84.智能电网中虚拟化云计算安全的研究
85.云计算架构下的移动学习
86.基于云计算的终身教育服务平台设计
87.云计算在电力系统数据灾备业务中的应用研究
88.云计算与图书馆:为云计算研究辩护
89.浅谈云计算技术
90.云计算研究现状与发展趋势
91.云计算环境下的著作权制度:挑战、机遇与未来展望
92.基于云计算的数字化信息资源建设模型的研究
93.云计算发展态势与关键技术进展
94.云计算技术在图书馆中的应用探讨
95.国外云计算发展现状综述
96.云计算对知识产权保护的若干影响
97.基于云计算的远程教学资源建设模式——以浙江开放大学为例
98.云计算在智慧校园中的应用研究
99.对云计算技术及应用的研究
100.云计算应用展望与思考
101.云计算给图书馆带来的发展机遇
102.云学习:云计算激发的学习理念
103.云计算环境下的信息资源云服务模式研究
104.云计算研究进展综述
105.云计算及安全分析
106.一种云计算操作系统TransOS:基于透明计算的设计与实现
107.基于等级保护的云计算安全评估模型
108.云计算:从概念到平台
109.云计算环境下信息安全分析
110.云计算技术简述
111.云计算综述与移动云计算的应用研究
112.中国云计算产业结构和商业模式
113.云计算安全问题
114.云计算下的国外图书馆联盟服务研究
115.云计算技术的应用及发展趋势综述
116.云计算在区域信息资源共享中的应用探究
117.基于云计算的图书馆信息平台的构建
118.云计算技术驱动下构建数字图书馆虚拟化环境的探讨
119.云计算支撑信息服务社会化、集约化和专业化
120.云计算环境下基于协同过滤的个性化推荐机制
121.云计算环境下的网络技术研究
122.云计算模式在电力调度系统中的应用
【 Abstract 】 In order to let in a hybrid cloud computing environment computing task confidentiality and privacy protection, avoid malicious nodes or operating environment computing task structure, logical system and target, it is necessary to build a new computing security algorithm security. This algorithm not only according to the computing ability and characteristics of cluster server nodes, but also the relevant aspects of the user terminal nodes is taken into account, the whole calculation task safely and reliably in a hybrid cloud computing environment, the computing tasks of security and privacy protection. In this paper, the definition and connotation of the hybrid cloud computing is discussed, pointing out that the current task of data security and privacy protection for hybrid cloud computing problems, according to the calculation of the relevant aspects of the research on hybrid cloud, we put forward a method that can effectively guarantee the data security and privacy of the task.
【 Keywords 】 hybrid cloud computing; privacy protection; mobile agent technology
1 引言
现阶段对于云计算的要求大都是服务器端具有较强的计算能力和较大的资源储存;而对海量的用户终端节点所包含各种有效资源的开发和利用并没有予以重视,这些广大的用户终端节点也就是公有云。实际上,终端节点自身也具有计算、储存各种信息资源的能力,由于这方面没有引起足够重视,终端节点的这些功能经常得不到利用,处于闲置状态,这使得大量接入互联网的终端节点中所包含的计算和存储资源流失,造成了资源的浪费。通过对终端节点所包含的各种潜在资源的研究、开发和利用,在原有的私有云计算的基础上,利用公有云的资源,建立混合云计算模型,可以将互联网中服务器端和用户终端上资源的收集最大化,这不仅可以提高工作效率,还能够获得更多的收益。当然,由用户终端来执行分配的计算任务时,一定要让计算的安全性和计算任务(例如企业进行大范围的数据分析)的机密性得到保证,阻止恶意节点或竞争对手对该任务的窥探,实现让用户在不知道该任务具体内容的前提下执行该任务的目的,这个安全问题在混合云计算过程中必须得到重视并加以解决。
2 目前混合云计算中存在的问题
2.1 用户终端的安全缺乏保障
在混合云计算环境下,用户终端通过相关云计算平台来实现对计算任务的处理和完成,在这个过程中,就可能会出现负责执行任务的用户终端节点受到计算任务本身包含的病毒和木马的攻击,或者用户的隐私信息(如网络地址、身份信息)被一些服务商或其他恶意节点非法获取等情况。
2.2 对云计算平台的安全管理不足
随着云计算数据量、用户量的增加,相关平台所包含的信息也会越来越多,自然就容易成为黑客攻击的目标。因此,对云计算平台的安全管理非常重要,然而现阶段对该项目的研究还没有取得实质性的进展,因而针对云计算平台的安全管理体系并不健全。
2.3 对计算任务机密性的安全管理不够完善
混合云计算结合了私有云和公有云,作为任务发起者对私有云的安全性可以做到较好的控制,然而公有云是由海量用户节点构成的,根本不能确保没有恶意节点和执行环境的情况出现。因而,一旦缺乏有效地安全管理措施,整个计算任务的机密性和安全性就有可能遭到损害。
3 在混合云计算环境中保障数据安全和隐私的一种有效方案
针对目前混合云计算安全管理中存在的问题,提出了一种可行性方案,也就是将移动Agent技术融入到混合云计算中,这种以移动Agent技术为基础的算法有效地解决这些问题。
3.1 移动Agent的含义和工作原理
移动Agent技术就是在智能Agent技术的基础上,增加了移动性的技术,结合了移动Agent技术编写的操作系统,具备了生存机制、计算机制、安全机制、通信机制、迁移机制,并通过科学合理的协调和完善,形成了一整套体系。无论是根据地理因素还是逻辑因素分布的网络节点都符合这种算法的要求,都能够运用这种计算模式,通过为相关网络节点提供信息服务,使移动Agent技术在各种混合云计算系统中都能得到有效应用。同时,在分配和执行任务的各终端节点上建立移动Agent的执行环境也很重要,也就是移动Agent服务设施(简称MAE),这样才能使移动Agent在各网络节点间自行移动。在混合云计算系统中,所有计算的载体就是移动Agent,移动Agent负责的主要工作就是对计算任务进行封装和分配处理。
3.2 运用了移动Agent技术的混合云计算系统的工作方式
负责处理任务分配工作的节点在接受了用户提交的任务后,将任务进行分割,将大的整体任务分割成一个个子任务,并且要确保各子任务之间存在的相同性、耦合性降到最低。如果能保证各子任务之间不存在任何交集,在独立的环境下被执行,完成任务后,将成果提交至分配任务的服务器节点,这种方式在云计算的环境中,就可能会造成子任务粒度增加的后果,这就使得云系统执行效率的降低,同时也使各子任务执行终端节点的工作量变大,任务负担变重,从而增加了整个流程的循环时间,在工作效率降低的同时,也产生了安全隐患。在混合云计算环境中,这样的安全问题主要表现在:一旦具有较大粒子度的子任务被分配到了执行任务的终端节点中,那么该终端节点就可以很轻易地通过对这个子任务数据和代码的解读和分析,推测出整个任务的执行逻辑和具体目标,在存在恶意节点或主机的情况下,必然会对提交任务用户隐私的机密性和整个云端计算的安全性造成不利影响。
通过尽可能地降低子任务粒度的方式,就可以让各子任务之间的关系保持两种形式: (1)各子任务之间的因果关系:一个子任务的执行要以上一个子任务的完成为前提;(2)各分子任务之间不存在密切的合作关系:各子任务可以同步执行。
根据用户提交的任务要求,将整个任务分割成具体的若干子任务,再把这些子任务分配到云计算系统的各个节点上,当然,这一切工作都是建立在移动Agent技术上。如果主要考虑信息的安全性和可控制性,那么就应该尽可能地把子任务分配到服务器端节点上;如果主要考虑任务的平衡性和网络资源被充分利用,那么就应该尽可能地把子任务分配到终端节点上,因为服务器端节点可利用的计算资源是有限的,而用户终端节点数量非常庞大,这就使得终端节点可利用的计算资源和储存空间比服务器端节点要巨大得多,更有利于网络资源的充分利用。
4 保障混合云计算数据安全和隐私的其他途径
建立和完善第三方认证体系。第三方认证是提高双方信任的一种有效手段,即采用一个中立机构对信双方进行约束。
提高对企业信誉的重视度。企业信誉对于任何一个竞争领域的企业而言都是至关重要的。一般来说,越大的企业对自身信誉看得越重,不会为了利益去窃取客户的数据。
实行合同约束制度。云计算服务商应该提出相关符合自身情况的云计算服务协议,明确自身的服务质量、技术水平、知识产权等方面的情况,从而对双方的权利和义务进行规定。
5 结束语
综上所述,尽管目前在混合云计算数据安全和隐私的保护中存在一些问题,但只要能采用文中所提到的方案和途径,并对其加以研究和探索,将其广泛的应用于混合云计算的项目中,就可以在计算任务更高效地完成的同时,使重要计算数据安全和隐私得到有效保护。
参考文献
[1] 陈克非,翁健.云计算环境下数据安全与隐私保护[J].杭州师范大学学报(自然科学版),2014(6).
[2] 张卓奇,郭卫斌.混合云存储环境下的数据访问隐私保护方案[J].计算机工程与设计,2014(7).
[3] 陈科有.混合云计算数据安全与隐私保护问题研究[D].2013.
一、云计算基本概念
近些年,云计算这一概念在行业内被普遍提及,也随之为这一技术带来了巨大的发展。维基百科()对云计算的定义如下:一种基于互联网的计算机新方式,通过互联网上的异构、自治的服务为个人和企业用户提供按需即取的计算。分析这一概念我们可以了解到,在互联网时代,计算能力已经成为了一种“商品”在进行销售,它就像我们日常生活中的水电、煤气一样,价格便宜,使用方便。目前,国内外的互联网商业巨头纷纷推出自己的云计算平台,如google、微软、IBM、亚马逊等,并将其作为未来发展的重要战略之一。因此,针对云计算的研究不仅是互联网时代业界技术发展的重要趋势,也具有十分重要的应用价值。
二、云计算的体系结构
云计算是一个革命性的举措,它不仅带来了IT模式的变化,也引发了IT服务的变革。在云计算时代,数据是自己的,而对于数据的计算、处理等操作,都可以交给云计算数据中心进行。云计算平台可以看成是一个强大的“云”网络,不仅将众多并发的网格计算和服务连接起来,还利用虚拟化技术对每一个服务器能力进行拓展,这样就通过云计算平台使得各自的资源整合起来,拥有超级计算和存储能力。从总体上看,云计算由三个基础部分组成:基础设施,网络和终端。
三、云计算的关键技术
云计算是以数据为中心的一种数据密集型的超级计算方式,它在数据存储和管理、编程模式和虚拟化等方面都具有自身独特的技术。
(一)数据存储和管理。云计算的数据一般采用分布式方式进行存储和管理。为了保证数据的高吞吐率、可靠性及高利用率,冗余存储的方式也时常采用。此外,鉴于云计算中对数据读取和分析的频率高于数据更新频率,云计算系统的数据管理常采用列存储的数据管理模式---将表按列划分后存储。
(二)编程模式。在云计算系统的编程实现过程中,应当尽可能的简单化。究其原因,主要是因为简单化的编程模式能够为基于云计算服务的开发人员提供便利,可以帮助他们在进行后台并行执行和任务调度时获得相对透明的流程,进一步得帮忙他们专心于业务逻辑。
(三)虚拟化技术。虚拟化技术是云计算有别于一般并行计算的根本性特点,也是云计算中的一个关键技术。采用虚拟机技术对云计算资源进行管理具有以下几点优势:移动性、独立性和高整合性。
四、云计算中的网络拓扑设计
云计算作为基于互联网的商业计算模型,其后端的网络拓扑结构十分复杂。对云计算系统中后端大量的服务器进行有效地组织和管理一直是云计算研究中重要的方面,这是保证云计算系统稳定运行的关键。和一般的企业网络、公网相比,云计算网络结构的特点有以下几方面不同:
(一)云计算系统后端网络的复杂程度远远大于一般公司的网络,因此,合理高效的网络拓扑结构是云计算系统中的关键,其主要的作用在于为网络中数据传输的畅通和稳定提供保证。
(二)云计算系统网络内部的数据流量大,主要由于系统主要面向大量的用户和大规模的业务处理。同时,还可能会有服务等级区分度较大的问题。
(三)云计算系统的中网络需要保证高稳定性,这主要是由于用户所有业务及数据都依赖云来开展。
(四)云计算系统需要有良好的可扩展性。云计算系统的规模较大,不可能一次性建设完成,而且用户规模会随服务的增加持续扩大,因此,如果没有良好的可扩展性很难满足要求。
图 1. 云系统后端网络结构示意图
云计算系统中整个网络的效率、稳定性和复杂度由核心交换层的网络拓扑结构决定。显而易见的,如果核心交换节点直接两两相【摘 要】本文的出发点为云计算的网络需求,针对云计算系统中的网络拓扑结构特点进行研究与分析,提出了云计算系统中网络拓扑结构的基本思想――由中心的主干交换部分和树状子网组成;并给出了相应的实现解决思路。
【关键词】云计算 网络拓扑设计 算法实现
连,由此形成的全连通网络抗稳定性是最优的,网络的畅通性也能够得到保证。但是,这样拓扑结构的网络其建设和维护的成本较高,各个核心交换节点中的路由和管理复杂度极高。另一方面,直接以各自交换节点为根生成最小生成树也可以构建网络,这样的网络拓扑结构相对简单,成本低,但是其稳定性较差,容易造成网络的不连通。
因此,一种合理且有效的方式可以简化为如图1所示的结构。通过对该网络抽象化,将需要研究的问题突出显示,即抽象化每一个子网为一个节点,给每个节点附上交换能力、子网流量和地理位置信息等特性。此时,针对网络主干拓扑结构的设计问题就可以表示为如何在已知若干节点容量、地理位置信息和可能流量等信息的前提下,将这些节点互相连接并形成一个冗余小、网络架设开销小的网络拓扑。
针对云计算网络拓扑设计已有众多研究者进行了深入的研究和讨论,该问题可以表示成图论中的一个数学模型:即抽象化云计算系统中的网络节点和所有可能的链路,表示为图论中图的顶点和边,抽象化带宽、延时、链路长度等表示为图的边权重。
本文针对云计算系统后端网络的特点,给出了云计算网络拓扑结构组成---主干交换部分为中心和树状子网为结构。通过将该问题抽象化为数学模型,并求解该抽象化问题,能够有效地计算出云计算系统的网络拓扑结构。
参考文献:
[1]邓自立, 云计算中的网络拓扑设计和Hadoop平台研究,[D].中国科学技术大学. 2009. 学位论文
中图分类号:TP39文献标识码:ADOI:10.3969/j.issn.10036199.2017.01.031
1简介
云计算的发展基于面向服务的体系结构、 网格计算、 并行计算和分布式计算等,这是一个新的脱颖而出的模式,是以高效的为用户提供服务为前提的模式[1]。由于它的如基础设施服务 ,平台即服务和软件即服务的卓越性能,云计算被人们广泛的接受并使用。通过不断提高了用户的使用效率,同时向不同的消费层次提供各项服务,云计算环境已经成为数据中心的主要力量。
云算中降低数据中心的能源消耗是一个具有挑战性且复杂的问题,这需要性能卓越的服务器。节约能源对于确保未来云计算是可一种持续的资源是相当必要的[2]。近些年绿色计算的宣传提出解决这一问题的很多办法,其中许多工作基于功率效率(电源效率)展开,如节能处理器,硬件支持DVFS技术等,也有其他方法来降低虚拟数据中心的能源消耗[3]。通过虚拟化技术可实现软件应用与底层硬件相隔离,它包括将单个资源划分成多个虚拟资源的裂分模式,也包括将多个资源整合成一个虚拟资源的聚合模式[4]。当虚拟机上运行的移动信息从一个网络节点到另一个网络节点时,需要应用虚拟机的快速迁移技术来平衡工作所产生的负载。
虚拟机管理是提高云计算数据中心效率的关键问题。许多研究工作都围绕这个问题展开,不同的资源分配策略会导致不同的成本和效率水平[5]。因此,如何找到一个高效的资源分配策略,特别是针对有限的能源的分配,同时消耗较低的能源消耗,这是一项艰巨的任务。
这篇文章当中,我们提出了一种改进的遗传算法,该算法重点研究考虑网络延迟和能源消耗的动态资源管理。我们认为在云计算环境中的用户的服务质量是非常重要的,因此应答时间也是这个实验的关键点。这篇论文的贡献在于以下俩点:第一,在相同功率条件下,我们的方法降低了用户请求的响应时间,提高了用户的服务质量;第二,在相同的响应时间内,我们的方法又能有效的降低能量功耗。
计算技术与自动化2017年3月
第36卷第1期李爽:基于云计算服务质量感知的虚拟机节能管理研究
2研究背景和相关工作
在云计算中,能量感知一直是研究的一个重点内容。近期的研究方式是通过关闭不活跃的服务器来达到节约能源的作用。文献[6]定义了一个高效节能云计算解决方案的体系结构框架和原则,然后又介绍了高效节能管理的虚拟机分配算法。王晓莹等[7]提出的资源分配和使用可变时工作负载和异构多级应用的能源管理的自适应模型方法。根据文献[8]的论述,该作者使用新的自适应粒子游动来优化的虚拟机配置,以使空闲服务器的处于省电状态。
很多工作围绕负载平衡结合若干的途径能解决节约能源的问题。前人通过使用关闭计算机电源的方法并不能起到根本的作用,且此种做法只能在理论层面实现。在文献[11]中,作者建议使用局部优化的随机爬山算法来动态分配进入服务器和虚拟机的工作。文献[12]解决了在云计算环境下基于使用映射-规约编程模型的资源管理问题。赵剑锋等人的论文[8]将资源调度模型转化为具有负载均衡目标的有向化多背包问题。文献[14]提出了一种资源调度模型,它使用的概念资源服务比率作为目标函数,而不是任务完成时间,然后采用分布估计算法(EDA)做了验证。研究者通过大量的实验证明了他们提出的调度模型比EDA的资源服务比率算法的效率平均提高了至少1.004,最多1.793倍。
3利用改进遗传算法的资源配置
为了节约能源和提升用户的响应时间,在这部分中,我们首先描述一个系统的模型,然后我们介绍能源损耗的定义,最后,我们提出一种采用改进能量功率的遗传算法的优化算法。
3.1系统模型
本文定义的系统模型与以往有俩种不同:首先,不同于大多数的节能系统如在文献[6][7]中提到的,注重考虑CPU和RAM的负载平衡,本文着重从用户方面考虑网络延迟和应答时间;第二,云计算可以跨越不同的地理数据中心,所以与文献[10]认为数据中心是一个单一的物理位置不同,我们假设数据中心分布在多个地区。
在本文的系统模块中,数据中心层是由不同地区的物理网络连接的,如图1。每一个地区的数据中心一般是由N台如计算机、服务器这样的等独立机器组成的节点集,这些个独立的机器集合被描绘成集合 P= {pm1, pm2, … , pmN}。这些节点集的通讯是通过全互联通讯子系统(如图1)连接的。节点集中每一台节点机器都是独立的,可以单独的打开或关闭。在每一台机器上,都安装了基于内核的虚拟机虚拟化软件,可以运行N个独立的虚拟机管理程序集,这个集合被表示为集合V= {vm1, vm2, …, vmM}。在这个模型中,个人机上面运行的虚拟机管理系统可以被终止、重启、或从其他个人机集合中迁移。如图1中的虚线所示,就像在许多系统中,当执行一个接收资源的任务时,消息可以从一台机器传播到另一台机器。当虚拟机管理集向其他地区移动的时候,我们的模型需要考虑延迟时间。
4实验结论
在这部分中,我们以云分析(cloudAnalyst)基准的评估价值来测量相应时间和能量消耗。
4.1实验环境和设置
考虑到CloudSim和CloudAnalyst是在公开资源已被广泛的使用开放源码,我们选择它们作为基准来仿真实际执行的情况。CloudSim [12]支持新兴的云计算领域的研究和开发,并提供了以下新的特点:(1)支持大规模的云计算基础设施的建模和仿真,包括一个单一的物理计算节点上的数据中心;(2)它是一个用于数据中心建模,服务器,调度和分配政策的独立平台。CloudSim众多的特性中有如下俩点是本次实验的基本点:(a)有助于创建和管理多个、独立的和共同托管的虚拟化服务在数据中心节点上的虚拟化引擎的可用性。(b)在处理内核的空间共享和时间共享分配之间切换到虚拟化服务的灵活性。CloudAnalyst[13] 是墨尔本大学开发的研究项目,目的是根据用户和数据中心的地理分布,去评估社交网络工具的支持率。在这个项目中,用户群和支持社交网络的数据中心都是有一定特点的,那就是都基于他们的位置;而用户体验的参数,是可以通过使用社会网络应用程序和数据中心的负载来获得的记录[14]。
在这个实验中,我们设置了六组用户基数(如表1)。其中“Name”列代表世界六大洲,在不同地区每组用户都是包含在同一个时区,而且每一分钟都会发出新的请求。峰值的时间从3到9。这里假定为十分之一的时间是在非繁忙时间的线路上。每个模拟数据中心的主机由5台虚拟机机构成,配置了512M的内存,10G存储和1000兆的带宽。
4.2实验结果与分析
如4.1部分中提到的场景和配置,我们的模拟实验从两个方面着手:第一、我们证明了网络延迟影响用户的响应时间。第二、我们的算法与DVFS[15,16]从相应时间,能量消耗,虚拟机集的数量和合并适应性方面进行比较
为了在用户响应时间方面提高服务质量,我们分三种情况监测:首先,我们使用一个0区域的数据中心DC1,我们得到的结果总体平均响应时间是292.05毫秒,数据中心处理时间是0.28毫秒。第二,我们使用区域0、1、2的三个数据中心作为用户基数区域,结果如图3(a)所示。最后,我们在每个区域都部署一个数据中心,结果如图3(b)所示。通过这个实验,我们可以得出结论:
(1)当数据中心虚拟资源的数量减少时,响应时间可以大大减少;同时,处理器处理任务的时间不会节省很多。
(2)能源消耗与任务完成时间不成比例。根据以往的经验,我们假设一个毫秒的能量消耗是k,那么平均的能源消耗应该是292.05k < 158.72k*3 (图3a) >50.08k*6 (图3b)。
图3(a)使用三组数据中心
图3 (b)使用六组数据中心
图3实验结论对比图
本文算法与DVFS算法的比较,如图4所示,a图是响应时间,b图是能量的消耗,c图是虚拟机迁移的数量,d 是合并适应性。我们模拟实验的结果比其他两种方法节约了更多的能量,尤其体现在:
(1)通过图4(a)中所示,第1组和第2组测试,我们的算法与DVFS几乎有相同的响应时间,主要原因是因为在开始的虚拟机集中的数据量比较少;在第3组和第4组数据中,我们的算法的响应时间高于DVFS;在接下来的实验中,我们的算法比DVFS慢了一些,主要是因为虚拟机集在不同地区迁移,而DVFS并没有考虑这个因素的影响,所以当小云朵的数量增加到2000的时候,DVFS算法的响应时间下降了。
(2)通过图4(b)的表示可知,我们的算法比DVFS节约更多的能源,当虚拟机集的数量比较大的情况下,我们的算法优势明显。
(3)通过图4(c)中描述,我们的算法数据迁移的数量更少。
(4)通过图4(d)中的结果表明,在合并适应性方面,我们的算法胜过DVFS算法。
(a) 响应时间
(b)能量消耗
(c)虚拟机迁移数量
(d)合并适应性
图4本文算法 与DVFS算法比较图
5结论和展望
在这篇论文中,提出一种在云环境下优化分配动态资源的方法。主要工作集中于在云计算中的能量和响应时间,在CloudSim应用和CloudAnalyst基准的帮助下,我们证明了该算法的优势所在。根据我们的实验数据,我们的实验有俩点优势:它在减少数据中心的能源消耗以及给云计算提高绿色平台方面起到了重要作用,第二,我们使用负载平衡改进了响应时间。这个工作也主要考察了能量消耗和响应时间,我们未来的工作主要将在研究性能集成其他参数,如CPU、内存和网络。此外,未来我们将使用并行计算技术改进我们的方法。
参考文献
[1]李小六,虚拟化云计算数据中心能量感知资源分配机制[J],计算机应用,2013,33( 12),86-90 .
[2]王金海,一种基于能量感知的云计算环境下虚拟机部署策略[J],新疆职业大学学报,2014,22(1),73-76.
[3]英昌甜,云计算环境下能量感知的任务调度算法[J],微电子学与计算机,2012,29(5),188-192.
[4]钟潇柔,基于动态遗传算法的云计算任务节能调度策略研究[D],哈尔滨工I大学,2015.
[5]侯伟,云计算中基于遗传算法的能效管理研究[D],武汉理工大学,2013.
[6]BELOGLAZOV A,ABAWAJY J,BUYYA R.Energyaware resource allocation heuristics for efficient management of data centers for Cloud computing[J].Future Generation Computer Systems, Volume2012,28:758-760.
[7]WANG Xiaoying DU Zhihui,CHEN YiNong .An adaptive modelfree resource and power management approach for multitier cloud environments[J].Journal of Systems and Software,2012,85:163-168.
[8]JEYARANI R,NAGAVENI N,VASANTH R R,Design and implementation of adaptive power-aware virtual machine provisioner (APA-VMP) using swarm intelligence[J].Future Generation Computer Systems, Volume,2012,28:811-821.
[9]SHARIFI M,SALIMI H,NAJAFZADEH M.Powerefficient distributed scheduling of virtual machines using workload-aware consolidation techniques[J].Journal of Supercomputing,2012,1(61):46-66.
[10]MONDAL B,DASGUPTA K,DUTTA P.Load balancing in cloud computing using stochastic hill climbing-a soft computing approach[J].Procedia Technology,2012, (4):785-786.
[11]HUANG Chennjung,GUAN Chihtai.An adaptive resource management scheme in cloud computing[J].Engineering Applications of Artificial Intelligence,2013, 26(1):382-389.
[12]WANG Rui,BAI Qinghua,BAI Youjia,et al.Research on Semantic Metadata Model for Information Resource Management under Cloud Computing Environment[J].JCIT: Journal of Convergence Information Technology,2012,7(21):658-661.
[13]CHEN Danwei,ZHANG Ji,XUE Qinghan.Virtual Resources Scheduling Model for Cloud Computing[J].JCIT: Journal of Convergence Information Technology,2012,7(23):658-661.
经过20多年的发展,我国高校的数字校园建设经历了从系统应用到系统集成的发展过程,而随着新技术的不断发展,尤其是物联网技术、无线移动网络技术的不断演进,更加重视用户的应用体现,表现在用户对数字校园使用的便捷性,对各种事务操作的便利性上来。这种转变,对新一代数字校园中网络基础设施也即校园网络的硬件条件提出了更高的要求,这些要求体现在:
一是运行更加高速、快捷。校园网络的发展从最早的百兆以太网、ATM网已全面发展为以万兆主干的以太网络为主体的校园网络体系,校园网络的运行效率、运行稳定性有了质的飞跃。二是无线网络的全覆盖成为校园网络发展的趋势。为了适应掌上电脑、移动终端、手机用户应用群不断扩大的趋势,建立覆盖整个校园,稳定、可靠的无线网络成为校园网络建设与发展的重点与方向。三是对校园网络的安全性提出了更高的提供论文写作和写作服务lunwen. 1KEJI AN. C OM,欢迎您的光临要求。由于数字校园的建设,将整个院校内部各种人、财、物的数据联网,这一方面为学校的决策管理提供了最直接的数据支撑,另一方面也对信息安全提出了更高的要求。如何在保证信息安全的基础上提高应用效益成为校园网络建设与管理者不得不考虑的问题。
基于新一代数字校园对校园网络提出的更高要求,在进行网络基础设施建设时,必须要进行充分考虑。
第一,在网络架构上,要充分认识到有线网络与无线网络的关系,将两者作为互相补充的有机整体,综合考虑建设、运维的成本,安全性与稳定性等各种要素,综合衡量网络建设的类型与使用范围。第二,在网络链路中需要设计一定的冗余。通过双链路或多链路架构的方式在一定程度上解决网络运行的稳定性问题。第三,考虑到校园内各种用户应用层次的不同,对校园网资源的使用权限也要有所不同;在进行校园网建设时,需要同时考虑到安全体系的建设,不仅仅是加装必要的安全防护设备,同时还需要在网络设备的选择上做好必要的准备。第四,云计算技术的持续发展,为高校的信息化建设与发展提供了机遇,校园网络也必须要考虑到未来的发展,尤其是虚拟桌面、云终端等网络应用对校园网的要求更高,需要充分论证与规划,以适应新技术的发展与应用。
2 基于云计算技术,建设集中化、虚拟化的数字校园数据中心
云计算以其超强的计算能力以及高可靠性、安全性等优势在各个领域都掀起了应用。高校的数字校园,由于其功能的日益完善,所涉及领域的应用更加深入,对数据中心的存储以及计算能力提出了更高的要求,传统的数据中心在一定程度上已经无法满足日益增长的计算、存储需求。因此,为其引入新型的、更具可控性、可扩容以及超强计算能力的云计算技术,成为新一代数字校园在进行数据中心建设时需要考虑的问题。
2.1 通过服务器虚拟化满足各种新功能的需求
在传统的数字校园数据中心建设中,采用服务器集群的方式,由于数字校园各种功能部署的需要,需要采用几十台甚至上百台单片服务器才能满足。而通过服务器虚拟化技术,可以有效、充分地利用服务器资源,通过将单台服务器虚拟出多台的方式,有效解决服务器的硬件投入过大、单台利用效率低下和管理维护以及运行成本过高等问题。通常服务器CPU占用率一般不超过15%,而虚拟化后物理主机的CPU使用率将提高到60~80%。
2.2 通过数据的集中存储,适应数字校园大数据、智能化发展的需求
云计算在进行服务器虚拟化的同时,要求数据中心提供强大的集中存储功能。而数字校园也需要将各个部门的数据统一集中到一个平台中来,不但要便于数据的统一采集与调度,更需便于数据的管理与维护。因此,通过建设必要的数据存储体系,包括容灾备份体系建设等方面。
2.3 坚持在原有基础上的“扬弃”,以满足需求为目标建设数据中心
在进行数据中心建设时应充分考虑院校内已经建成或者正在运行的各种系统、各种物理资源的价值,而不是完全抛弃,应当将其纳入到云计算数据中心建设中来统一考虑,充分利用现有资源,进行必要的整合与集成,做好资产的保护。
与此同时,还应当注意到云计算数据中心所带来的一些负面影响。一是由虚拟服务器应用带来的资源过度利提供论文写作和写作服务lunwen. 1KEJI AN. C OM,欢迎您的光临用,要以保障稳定运行为前提,提前作好充分的论证。二是要防止虚拟主机的随意蔓延。由于增加一台服务器的配置不再像以往那样,需要通过采购、安装、部署等一系列过程,只需要数据中心通过技术虚拟出一个主机即可,这也可能导致各种主机的不断扩张,因此,还需要加强对服务器需要的管理与审批。
3 以智能感知、自动交换、主动推送为目标,加强数字校园平台建设
数字校园建设为院校教学科研与日常管理等活动提供强有力的支撑,本质上是利用现代化的手段对信息进行获取、加工和处理,为以教学科研为中心的院校各项活动提供保障。因此,对校园内信息的获取、处理与利用,在进行新一代数字校园设计与建设时应作为重中之重来进行考量。
3.1 充分利用物联网技术,建设“智能感知”的数字校园数据采集体系
随着物联网技术的不断成熟,射频识别、红外感应、全球定位、激光扫描等信息传感技术的应用越来越广,为数字校园中的对人、财、物的自动感知与信息采集提供了广阔的应用前景。在高校重点可以从几个方面来展开。
一是智能教室、实验室的管理。伴随高校数字化建设水平的提升,对大量不同的教室、实验室设备进行有效管理是急需解决的课题。二是智能文档管理。图书文献,包括由于各种原因无法通过电子文档进行流转的公文、各种档案资料的管理等,通过加贴FRID标签等方式,可以准确掌握这些重要文档资料的流向,让无声的东西变成 “有声”的,便于查找利用。 三是智能校园安保系统。将物联网技术与安保系统进行结合,在原有校园视频监控系统的基础上,让固定的财物能够随时发送位置、状态信息,便于及时了解其去向,也为各种物资的有效利用提供方便。四是远程水电管理系统。通过物联网技术,可以及时发现水电的开关状态,了解实时的使用情况,通过校园网可以有效管理路灯、室内照明以及公共水房等资源,从源头上做到环保节能。
3.2 以应用集成为主线,建立自动交换的数据共享体系
传统的数字校园一般采用系统集成的方式,将高校内部各种应用系统通过数据、身份、门户集成等方式统一到一个平台上。从表面上看,各种系统已经统一在数字校园内,但在其内核应用层面,还没有做到真正的统一,尤其是底层数据的交换,有些复杂的触发机制需要人工干预。而在新一代数字校园的建设中,应当摒弃传统观念,真正从“做事”的角度出发,以应用为主线,划分出清晰的数据流、事务流,根据数据的流向、事务的处理流程来规划数字校园的各项功能,从底层数据库的设计开始,做好数据的统一规划,确保高校内部各个层面的应用都能做到真正的数据共享。
3.3 通过订阅、推送平台,建立主动推送的信息应用体系
传统的数字校园的信息门户,虽然会根据用户身份的不同,有一些差异化的设计,但是实际上这些差异是有限的提供论文写作和写作服务lunwen. 1KEJI AN. C OM,欢迎您的光临、不全面的。新一代的数字校园,这些差异化应当与数据订阅机制、身份认证平台实施联动,将共享数据库中与用户相关的信息及时推送到用户的门户中去。推送的方式,可以根据信息的重要程度、用户的身份特征等进行区别。通过数据订阅与信息推送体系的建设,在最大程度上解决无法找到合适信息以及“垃圾”信息泛滥等问题。
4 强化管理,统一建设,建设安全、可靠的数字校园运行平台
自从互联网进入实际运用以来,网络安全始终是各方关注的重点,尤其是前期“棱镜”监控事件进入公众视野,国家采取了加强对互联信息的管控等一系列措施,对网络安全提出了更高的要求。 因此,在进行新一代数字校园建设时,信息安全也应当作为重要的一个环节。
4.1 适应网络安全新形势,将安全体系建设真正统一纳入到数字校园工程建设中来
从网络初期建设开始,有关部门就对信息安全提出了一系列的要求,但由于网络安全一定程度上并不能产生直接的效益,许多院校在进行数字校园乃至网络基础设计建设时虽然将网络安全纳入了方案,但实际操作中则是能省就省,存在着重应用轻安全的观念。
在进行新一代数字校园建设时,由于各种上网的信息涉及面广,这些信息对某些有心人而言都是具有一定的应用价值。尤其是一些重点高校,加强网络安全体系建设不能仅仅是停在口头上、写在书面上,而应当真正做到实际工作中,将之统一纳入到数字校园建设中来,在网络基础设施、数字中心建设,以及数字校园各种应用系统的开发与应用等环节,充分考虑到信息的安全,通过统一的设计、统一的建设,有效地从源头上管控信息安全。
4.2 强化制度保障,统一数据采集与应用标准,有效管制各种信息的采集与应用
新一代的数字校园,从设计与建设理念上来说,许多信息的采集都需要自动安全,智能采集。而在管理与应用层面,更加强调的是身份认证体系与应用权限,采用主动推送的方式进行。这对数字校园的建设者与管理者来说,必须从开始阶段就做好信息的甄别工作,通过严格的规则制度,确定哪些信息通过何种方式采集与提供使用,同时也应当根据不同人员的身份特征,强化信息的应用范围控制,确保把好数字校园内各种信息的入口与出口关,始终绷紧信息安全之弦。
4.3 坚持内外有别、上下有别,强化数据应用与下载的管控,确保信息安全
数字校园的身份认证体系是决定每个用户提供、使用信息的依据,在加强数字校园的信息安全体系建设时,必须坚持做到内外有别、上下有别,即区分校内、校外用户,领导、教职员工与学生有自己的不同的信息提供与获取权限。要做到这些,应当从几个方面来着手。
一是加强身份认证系统的建设与管理。不仅对身份认证系统的选择要更加科学,注重其安全性;而且要加强对用户身份变更等信息的更新维护,确保每个用户都能获取与其身份相对应的信息。二是区别一般信息与提供论文写作和写作服务lunwen. 1KEJI AN. C OM,欢迎您的光临保密信息的管理与使用。这是通常的信息安全管理措施,对信息的涉密程度进行区分,通过逻辑子网等方式加以管控,有些甚至需要与公共的校园网络进行安全隔离,确保安全。三是区别不同用户对象的使用方式。对重要的用户,即信息使用级别较高的校园网用户,应当控制其使用方式。
一、SDN技术的发展历史
2006年,SDN诞生于美国GENI项目资助的斯坦福大学Clean Slate课题。
2008年,基于Ethane 及其前续项目Sane的启发, Nick McKeown 教授等人提出了OpenFlow 的概念,并于当年在ACM SIGCOMM 发表了题为《OpenFlow: Enabling Innovation in Campus Networks》的论文,首次详细地介绍了OpenFlow 的概念。
2009年12月,OpenFlow规范了具有里程碑意义的可用于商业化产品的1.0版本,之后又进一步修订推出了1.1、1.2、1.3、1.4版本。
在工业界,2010年1月,Google数据中心开始采用OpenFlow技术。
2011年3月,开放网络联盟ONF成立,标志着SDN/ OpenFlow从单纯的学术研究正式过渡到产业化发展的轨道中。
2012年底,AT&T、英国电信(BT)、德国电信、Orange、意大利电信、西班牙电信公司和Verizon联合发起成立了网络功能虚拟化产业联盟(Network Functions Virtualisation,NFV),旨在将SDN的理念引入电信业。除ONF外,包括互联网工程任务组、国际电信联盟、欧洲电信标准协议也在推动SDN的发展和应用。
二、应用场景
目前,SDN主要应用于通信技术领域,具体涉及校园网、移动网络以及云计算网络等,随着SDN技术的深化发展,其应用领域会更加广泛。
2.1应用于校园网
SDN最早诞生于斯坦福大学的Clean Slate课题,该课题主要是用于校园网络的试验创新,旨在改变设计已略显不合时宜,且难以进化发展的现有网络基础架构,从而构建一个灵活高效的校园网。
2012年,国家“863”项目“未来网络体系结构和创新环境” 获得科技部批准。该项目是一个符合SDN思想的项目主要由清华大学牵头负责,清华大学、中科院计算所、北邮、东南大学、北京大学等分别负责各课题,项目提出了未来网络体系结构创新环境FINE(Future Internet innovation Environment)。
2.2应用于移动网
SDN逻辑上集中的控制平面能够更好地实现网络融合,使统一管理成为可能。利用SDN技术可以在固定网络和移动网络中实现无缝控制、提高VPN管理的灵活性等。
在运营商网络中利用SDN技术不但能够降低网络管理难度,还能加快业务部署速度,提高网络服务器的适应能力。
目前,我国三大移动运营商纷纷找有实力的SDN技术研发公司进行合作,如华为与电信运营商的合作,其合作的目的是将现有的网络结构向SDN网络结构转型,以期能够适应时代的潮流,为客户提供更好的服务。
2.3应用于云计算网络
随着网络通信技术的发展以及客户需求的增长,传统的存储处理系统远远达不到数据处理的需求,因此提出了集群及云计算概念。
云计算数据中心的交换机管理结构复杂,因此需要对服务器和虚拟机进行快速配置和数据迁移。如果不能在大量的服务器集群中进行快速高效的寻址与数据传输,就极容易造成网络拥塞,发挥不出网络功能。
在数据中心网络中部署OpenFlow交换机,可以借助SDN技术,实现高效寻址、优化传输路径、负载均衡等功能,提供数据交换的效率。
三、展望
SDN是一种新兴的网络架构,属于下一代网络技术研究范畴,但又与其他下一代网络技术研究方向有很大区别。由于SDN技术刚刚提出,因此目前使用软件定义网络还存在一些问题,如让不同的网络服务提供者互相交换网络信息从商业的角度来说是不容易实现的,在实现数据平面和控制平面的分离时如何实现分离转发和控制面的OpenFlow协议的完善等。
但是相信随着SDN技术的发展,这些问题在不久的将来会得到妥善解决。
参 考 文 献
1体质综合评价标准的研制过程
1.1综合评级标准的制定方法
国内、外在制定体质评级标准过程中所采用的方法主要有:离差法、百分位数法、指数法、相关法等多种方法。因每种方法都有不同的特点,一般在使用时根据样本的分布情况及评价表的性质,采用不同的方法。王文、张矗等分别采用TOPSIS法、秩和比法、密切值法、灰色关联法四种综合评价方法对学生体质进行综合评价,探索出了上述四种方法均可应用于学生体质评价。
江崇民主要应用百分位数法来研制《国民体质测定标准》的,把各单项指标评分进行算数相加制得各年龄段的四级综合评级表。刘文忠将各指标的标准化后的得分和总分用百分位数法进行五级评价。肖翔云,等也是把标准化后的各单项指标得分值相加,再用百分位法把总得分值制得五级综合评价标准表。罗小玲用百分数法和离差法制定评价学生营养状况的身高标准体重度脂法标准。李皿用离差法和百分位法按年级划分制定了6-22岁学生体质综合评价图表,即根据所测的10项指标的成绩为横轴,5级为纵轴画方格,使用时根据测试的数据分别在相应的指标纵轴上标出所对应的10个点,把前4个点用实线连起来,表示该个体形态、机能发育曲线,把后6个点用虚线连接起来,表示该个体运动能力曲线。
赵墨臣,等用离差法和百分比进行综合评价,把用离差法获得的各单项得分进行算数求和,然后除以指标总项数,最后把平均得分与各单项指标的七级标准表对照进行个人综合评价。张宪斌也是把各个指标的对应分值求和,而综合评价标准是根据总分数据利用百分位法制定的。
柳璇采用体质量表对老年人的体质进行综合评价,制定了9个问卷,问卷中每题分值为5分,根据老年人答问卷所得分判定,所用公式为“原始分=各条目分值相加,转化分数=[(原始分数-条目数)/(条目数?)]?00”,最后跟据转化分数判定体质类型。
顾世德应用回归分析法把标准化后的分数建立两级回归方程,先分别建立形态、机能、素质三类的一级回归方程,再根据回归所得形态、机能、素质三类的分数建立二级回归方程,即总的综合评价方程。两级方程都用方差分析法进行了准确性跟可靠性检验,最后把回归计算得到的分数再用百分位数法制定了等级评价标准表。
王世连应用百分位数法和判别分析思想制定标准,柳璇采用体质量表对老年人的体质进行综合评价,罗小玲用百分数法和离差法,李皿用离差法和百分位法按年级划分制定了综合评价图表,赵墨臣,等用离差法和百分比进行综合评价。
1.2体质指标选取及权重确定的方法
选取体质综合评价指标的方法很多,其中王文采用了文献资料法和专家咨询法,张宪斌采用了主成分分析法,刘文忠采用了逐步回归分析法,顾世德采用了聚类分析和主成分分析法,冯宁采用了因子分析、多元线性回归方程和多重回归方程。体质综合评价中权重的确定方法较多,运用文献资料法确定权重的居多。其中王文,张宪斌,于学礼采用文献资料法;林建棣采用逐步回归分析法;江崇民采用了等权的指导思想;冯宁使用专家问卷调查法。
1.3数据标准化方法
数据标准化方法使用中,赵墨臣使用离差法,罗小玲,张宪斌,李皿,赵墨臣使用百分位法结合离差法。刘文忠把各单项指标数据按公式x70[(xi-X)+10]/SyTi转化成标准分。肖翔云把上面的公式改为x70[(xi-X)+15]/SyTi,顾世德用T分法公式70+[10-(xi-X)]/S标准化的。
目前,制定标准时不再进行标准化处理,直接利用百分位法进行单指标评分表的制定。2014年张一民在制定国家标准时也使用了百分位法。
2结论
制定体质综合评价标准过程中,大多是先用百分位数制得各单指标评分表,再对应的给出各指标的分数,把获得的各单项得分乘以权重进行算数求和,最后再利用百分位法制定综合评价标准。
制定单指标标准过程中,百分位法应用较多。权重多采用文献资料法和主成分分析法来确定。数据标准化处理方法大多数专家主要使用百分位法,有的结合百分位法应用其他的几种方法。制定标准时不再进行标准化处理,直接利用百分位法进行单指标评分表的制定。