【学习目标】
(1)了解云端服务系统及其功能。
(2)了解云端服务系统的架构和组成。
(3)了解云端服务系统相关技术。
【学习重点】
(1)云端服务系统的架构和组成。
(2)云端服务系统相关技术。
【学习难点】
(1)云端服务系统的架构和组成。
(2)云端服务系统相关技术。
【拓展视频】
智能快递柜系统集物联网、云计算、大数据这三大核心技术于一体,包括业务中快件存取处理系统和后台中心数据处理两部分。整个智能快递系统的运行依赖于智能快递柜终端和云端服务系统。在第1章中已经介绍过智能快递柜终端,在本章主要介绍云端服务系统。
1.云端服务系统简介
近邻宝云端服务管理平台提供丰富的API接口,能够迅速实现与运营企业的业务运营平台实现快速对接和定制开发,从而提供功能强大、低成本的设备综合管理和扩展开发支撑。通过云端服务管理平台能够实现对快件箱终端的集约化检测、管理和维护,云端服务系统与外部被服务系统关联如图2.1所示。
图2.1 云端服务系统与外部被服务系统关联图
2.云端服务系统功能
云端服务系统主要具备以下功能。
(1)通过强大的统一终端管理能力,对终端实行远程参数配置、升级、维护管理,节省网络管理和终端维护成本。
(2)精细的业务统计报表与分析功能,为商业运营决策提供精准依据。
(3)丰富的网络状况统计功能,实时掌握设备在线、离线、报警状态,提升运维效率。
(4)准确的地理位置查询功能,节省维护人员前往设备现场的时间。
(5)差异化故障报警管理功能,远程故障诊断,降低企业损失。
(6)实时监控智能快递柜周边情况,保障其外部安全。
(7)通过Web界面和嵌入式管理工具,实现云业务与下位机穿透管理。
3.云端服务系统特点
1)基础配置管理
主要负责云平台用户的单点登录、权限的统一管理、业务系统的配置管理、平台公共信息的管理以及平台的系统数据管理等,并通过一系列的接口,实现内部系统和客户端之间的数据交互。
2)资源的管理调度
主要负责对平台中的物理资源和虚拟资源进行统一管理,包括网站服务器、数据库服务器、计算资源池、桌面资源池、存储资源池、网络设备、专用设备等,并实现上述设备的统一监控,以及各资源池的资源统一管理、订单管理和基于时长的内部计费管理。
3)数据资源的统一管理
所有数据、日志信息统一管理和备份,同时历史版本功能和追溯功能可以有效防止数据的误删除和流失。
4)业务应用系统管理
业务应用管理系统实现以下功能。
(1)无缝的集成和支持基于快递的各种业务应用,提供业务应用运行的支撑环境,并以服务的形式暴露给最终用户。
(2)系统会对快件的信息进行跟踪,并根据这些信息进行统计分析,帮助云服务提供者及时了解业务的各种情况,从而有效改善云平台中不同应用的服务质量。
案例2-1
互联网+企业已全面进入云计算时代
2015年8月,在满是酷热的上海,阿里云携手驻云在上海云基地举办了“云时代,企业如何轻松上云”的专题活动,活动邀请了阿里云市场部总监金杰就目前的云市场和新技术展开了分享和讨论。
1.用数据说话:45% VS 4%?
云计算是IT时代的转战互联网+的一大进化,计算能让一个公司在大数据的浪潮中也拥有像阿里巴巴、腾讯一样的技术支撑能力,但在这之前,企业一定要理解和选择品牌云计算厂商。
阿里云运营总监金杰表示:云计算成为国家基础设施从IT到DT(Data Technology),近几年,云服务增长率为45%,传统IT增长率为4%,这些数据表明,用户的习惯已经发生变革。但是想要改变20年“重硬轻软”的惯性还是需要一个时间过度。我们也坚定计算机+软件将会演变为云服务+数据,这说明云计算与大数据支持“创新生态”的模式依然成型。
2.云时代的IT架构管理挑战
几年前,用户对云计算存在一些困惑,各大云计算厂商前期都是在教育用户,了解云计算技术与传统私有IDC相比,是否稳定,了解客户需求的同时也能更好地了解产品。现在计算已经不再是基础架构的问题,而是更深层次的服务。
根据阿里云数据显示:截至目前,152万个客户选择使用阿里云服务。面对如此强大的数据,我们会问什么是RDS, OSS, SLB, ODPS?如何将其应用到自己的系统中?如何平稳上云?OSS应该使用到什么场景?驻云的首席架构师兼CTO肖凯带我们解答了不一样的云计算,肖凯表示如何让新的技术发挥优势,促进业务成熟,如何利用云的优势,把产品细分,变革,那就需要在做转型的同时,了解以下几点要素。
1)如何管理云资源
一个IT系统使用了云计算,已经能为企业节省大量的运维开支。但这不是一切,实际上企业还可能要面对和传统物理服务器及机房一样的挑战,即云服务器中的应用程序仍然需要维护。而且云计算的云盾也许能帮助企业抵挡DDOS攻击,但黑客仍能利用企业系统本身存在的安全漏洞。这个时候企业需要一个专业运维队伍,才能保障自己的业务全天24小时高可用。
2)融合云还是混合云
混合云的现状已经被很多企业接受,以私有云为中心的传统企业的转变,就是在私有云的基础上管理公有云,并行实施,这样既可节省资源浪费,又可达到数据上的安全备份。当然,这仅仅是不同IT系统和架构的组合。
3)融合云才是未来
架构云是以公有云/VPC为中心的企业IT架构,私有IT和公有云系统间的融合交互,同时根据业务需要构建公有云和私有IT架构的融合,以数据的实时及大量交互运算为基础,做好产品和服务。
4)架构云
在互联网和产业界的不断努力下,历经8年发展,云计算已经成为人们按需使用信息处理、信息存储、信息交互资源的重要模式,也是进行大数据处理和深度挖掘的重要平台。同时,架构云在云计算时代作为企业解决IT资源运维管理的服务平台,让企业实现公有云和私有云混合管理模式,管理企业数据多重备份。同时快速部署多重解决方案,定期升级产品服务,可面向多种用户场景,实现自动化、标准化、可视化提升IT运维效率,全面助力企业轻松上云。
云端服务系统基于一个可靠、安全、可扩展、易维护的应用系统平台作为支撑,按照应用系统组成可分为以下子系统:Web前端系统,负载均衡系统,数据库集群系统,缓存系统,分布式存储系统,分布式服务器管理系统,代码分发系统。按照功能模块可分为以下功能模块:登录模块、运营模块、快件管理模块、客服模块、统计模块、合作方快递查询模块、安全报表模块、日志模块、监控模块。云端服务系统的架构如图2.2所示。
图2.2 云端服务系统的架构
1.Web前端系统
云平台为了使各个应用的服务器共享、避免单点故障、集中管理、统一配置等目的,不根据应用划分服务器,而是将所有服务器做统一使用,每台服务器都可以对多个应用提供服务,当某些应用访问量提高时,通过增加服务器节点达到整个服务器集群的性能提高,同时使其他应用也会受益。Web前端系统基于Nginx的虚拟主机平台,提供运行环境。服务器对开发人员是透明的,不需要开发人员介入服务器管理。
2.负载均衡系统
负载均衡(Load Balancing)建立在现有网络结构之上,它提供了一种廉价、有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力,同时能够提高网络的灵活性和可用性。负载均衡系统分为硬件和软件两种。硬件负载均衡效率高,但是价格贵,如F5。软件负载均衡系统价格较低或免费,效率较硬件负载均衡系统低,不过对于流量一般或稍大些网站来讲也足够使用,目前使用最为广泛的负载均衡软件是Nginx、LVS、HAProxy,云端服务系统的负载均衡系统为Nginx,负载均衡系统框架如图2.3所示。
图2.3 负载均衡系统框架
3.数据库集群系统
由于Web前端采用了负载均衡集群结构提高了服务的有效性和扩展性,因此数据库必须也是高可靠的,才能保证整个服务体系的高可靠性。采用的方案有以下几种。
(1)使用MySQL数据库,考虑到Web应用的数据库读多写少的特点,对读数据库做了优化,提供专用的读数据库和写数据库,在应用程序中实现读操作和写操作分别访问不同的数据库。
(2)使用MySQL Replication机制实现快速将主库(写库)的数据库复制到从库(读库)。一个主库对应多个从库,主库数据实时同步到从库,如图2.4所示。
图2.4 数据库集群系统框架
(3)写数据库有多台,每台都可以提供多个应用共同使用,这样可以解决写库的性能瓶颈问题和单点故障问题。
(4)读数据库有多台,通过负载均衡设备实现负载均衡,从而达到读数据库的高性能、高可靠和高可扩展性。
(5)数据库服务器和应用服务器分离。
4.缓存系统
缓存分为文件缓存、内存缓存、数据库缓存。云端服务系统使用的内存缓存工具是Redis/Memcached,如图2.5所示。通过二者结合使用,可实现以下目标。
(1)提高访问效率,提高服务器吞吐能力,改善用户体验。
(2)减轻对数据库及存储集服务器的访问压力。
(3)使用多台服务器,避免单点故障,提供高可靠性和高可扩展性,提高性能。
图2.5 缓存系统框架
5.分布式存储系统
分布式存储系统框架如图2.6所示。分布式存储系统主要有以下两个特点。
(1)存储量很大,高可用。
(2)负载均衡cluster中的每个节点都有可能访问任何一个数据对象,每个节点对数据的处理也能被其他节点共享,因此这些节点要操作的数据从逻辑上是一个整体,不是各自独立的数据资源。
6.分布式服务器管理系统
随着云平台访问流量的不断增加,网络服务都是以负载均衡集群的方式对外提供服务,随着集群规模的扩大,需要集中式地、分组地、批量地、自动化地对服务器进行管理,批量化地执行计划任务。分布式服务器管理系统框架如图2.7所示。
云平台使用分布式服务器管理系统软件中的Cfengine。它可以对服务器进行分组,不同的分组可以分别定制系统配置文件、计划任务等配置。通过Cfengine集中式的服务器管理工具,可实现大规模的服务器集群管理,被管理服务器和Cfengine Server可以分布在任何位置,只要网络可以连通就能实现快速自动化的管理。
图2.6 分布式存储系统框架
图2.7 分布式服务器管理系统框架
7.代码发布系统
代码发布系统框架如图2.8所示,为满足集群环境下程序代码的批量分发和更新,代码发布系统具备以下四种功能。
图2.8 代码发布系统框架
(1)不需要登录服务器即可将程序分发到目标服务器。
(2)开发阶段包括要内部开发、内部测试、生产环境测试、生产环境发布四个部分,发布系统可以介入各个阶段的代码发布。
(3)通过Git实现源代码管理和版本控制。
(4)使用工具Rsync,通过自定义脚本工具实现服务器集群间代码同步分发。
资料卡
Git
Git是一款免费、开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目。Git是Linus Torvalds为了帮助管理Linux内核开发而开发的一个开放源码的版本控制软件。Torvalds开始着手开发Git是为了作为一种过渡方案来替代BitKeeper, BitKeeper之前一直是Linux内核开发人员在全球使用的主要源代码工具。开放源码社区中的有些人觉得BitKeeper的许可证并不适合开放源码社区的工作,因此Torvalds决定着手研究许可证更为灵活的版本控制系统。尽管最初Git的开发是为了辅助Linux内核开发的过程,但是我们已经发现在很多其他自由软件项目中也使用了Git。例如,很多Freedesktop的项目迁移到了Git上。
1.登录模块
登录模块包括后台用户、APP用户、合作方用户管理,系统基础信息设置,通知管理。
2.运营模块
运营模块包括快递公司、物业、小区、学校等基础配置,并对快件管理,实现对快递订单各个环节的信息记录查看。
3.快件管理模块
快件管理模块包括快递柜主屏显示的活动管理,APP上的所有活动管理,以及第三方合作公司管理,柜体基本信息管理等。
4.客服模块
客服模块包括快递维护、客服管理、充值扣费、用户反馈四部分主要功能。
5.统计模块
统计模块包括基础柜体使用率、占用率统计、社区和物流中心派件、揽件数据统计。
6.合作方快递查询模块
合作方快递查询模块包括账号管理、快递公司查询、物业查询等基本功能。
7.安全报表模块
可按事件类型、目标或周期类型等条件进行统计,获得安全报表(报警分类统计报表、报警时段统计报表、报警区域报表)、访问统计报表(访问时段、访问区域及业务类型)及流量趋势报表。
8.日志模块
系统运行日志及安全防护日志,包括网络层访问控制、URL ACL防护、DDoS防护、Web安全、ARP防护及Web访问,可基于时间、IP、端口、协议、动作、事件类型、URL、方法、状态等条件进行日志查询。
9.监控模块
提供安全事件监控、访问情况监控、负载监控及安全缓存监控,可显示接口状态,引擎状态、系统CPU、内存及硬盘使用率,系统当前时间及系统运行时间。
【拓展文本】
云计算是一种利用互联网实现随时随地、按需、便捷地访问共享资源池(如计算设施、存储设备、应用程序等)的计算模式。计算机资源服务化是云计算重要的表现形式,它为用户屏蔽了数据中心管理、大规模数据处理、应用程序部署等问题。它是分布式计算、并行计算、效用计算、网络存储、虚拟化、负载均衡等传统计算机和网络技术发展融合的产物。
1.云计算的特点
(1)弹性服务。服务的规模可快速伸缩,以自动适应业务负载的动态变化。用户使用的资源同业务的需求相一致,避免了因为服务器性能过载或冗余而导致的服务质量下降或资源浪费。
(2)资源池化。资源以共享资源池的方式统一管理。利用虚拟化技术,将资源分享给不同用户,资源的放置、管理与分配策略对用户透明。
(3)按需服务。以服务的形式为用户提供应用程序、数据存储、基础设施等资源,并可以根据用户需求,自动分配资源,而不需要系统管理员干预。
(4)服务可计费。监控用户的资源使用量,并根据资源的使用情况对服务计费。
(5)泛在接入。用户可以利用各种终端设备(如PC、笔记本电脑、智能手机等)随时随地通过互联网访问云计算服务。
资料卡
云计算
云计算是将具有较强计算能力的计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,由于企业数据中心的运行将与互联网更相似。这使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。
2.云计算体系架构
云计算可以按需提供弹性资源,它的表现形式是一系列服务的集合。结合当前云计算的应用与研究,其体系架构可分为核心服务、服务管理、用户访问接口3层,如图2.9所示。核心服务层将硬件基础设施、软件运行环境、应用程序抽象成服务,这些服务具有可靠性强、可用性高、规模可伸缩等特点,满足多样化的应用需求。服务管理层为核心服务提供支持,进一步确保核心服务的可靠性、可用性与安全性。用户访问接口层实现端到云的访问。
云计算核心服务通常可以分为3个子层:基础设施即服务(Infrastructure As A Service, IaaS)、平台即服务(Platform As A Service, PaaS)、软件即服务(Software As A Service, SaaS)。
IaaS提供硬件基础设施部署服务,为用户按需提供实体或虚拟的计算、存储和网络等资源。在使用IaaS层服务的过程中,用户需要向IaaS层服务提供商提供基础设施的配置信息,运行于基础设施的程序代码以及相关的用户数据。由于数据中心是IaaS层的基础,因此数据中心的管理和优化问题近年来成为研究的热点。另外,为了优化硬件资源的分配,IaaS层引入了虚拟化技术。借助于Xen、KVM、VMware等虚拟化工具,可以提供可靠性高、可定制性强、规模可扩展的IaaS层服务。
图2.9 云计算体系架构
【拓展文本】
PaaS是云计算应用程序运行环境,提供应用程序部署与管理服务。通过PaaS层的软件工具和开发语言,应用程序开发者只需上传程序代码和数据即可使用服务,而不必关注底层的网络、存储、操作系统的管理问题。由于目前互联网应用平台(如Facebook、Google、淘宝等)的数据量日趋庞大,PaaS层应当充分考虑对海量数据的存储与处理能力,并利用有效的资源管理与调度策略提高处理效率。
SaaS是基于云计算基础平台所开发的应用程序。企业可以通过租用SaaS层服务解决企业信息化问题,如企业通过GMail建立属于该企业的电子邮件服务。该服务托管于Google的数据中心,企业不必考虑服务器的管理、维护问题。对于普通用户来讲,SaaS层服务将桌面应用程序迁移到互联网,可实现应用程序的泛在访问。
案例2-2
云服务
云服务的商业模式是通过繁殖大量创业公司提供丰富的个性化产品,以满足市场上日益膨胀的个性化需求。其繁殖方式是为创业公司提供资金、推广、支付、物流、客服一整套服务,把自己的运营能力像水和电一样让外部随需使用。
这种服务类型是将网络中的各种资源调动起来,为用户服务。这种服务将是未来的主流,如微软、苹果。
(1)微软正式推出云服务平台——Windows Azure。
Ray Ozzie,微软的软件架构师,在PDC开场演讲中特别强调了服务和“云”。他说,广为普通人所用的服务器需求和在企业内部所用的服务器需求有着本质的不同。由于服务器分散在世界上不同的数据中心,以及因新闻、博客、产品发布、甚至购物季节等带来的巨大变化需求,我们需要很多专业的知识。
(2)苹果于2011年6月7日在苹果全球开发者大会(Worldwide Developers Conference, WWDC)上,正式发布了iCloud云服务。
2009年4月9日,Xcerion发布iCloud,此为世界首台免费联机计算机,可向世界上的任何人提供他们自己的联机计算机,外加可从任何连接到Internet的计算机都可使用的免费存储、应用程序、虚拟桌面和备份访问等特性。2011年6月7日,苹果在旧金山MosconeWest会展中心召开全球开发者大会(简称WWDC 2011)上,正式发布了iCloud云服务,该服务服务可以让现有苹果设备实现无缝对接。iCloud云服务提供英语、中文、俄语、西班牙语、葡萄牙语、德语和菲律宾语多种语言。iCloud的公开发布承载着运行封闭式Beta测试程序和收集来自世界各地iCloud用户反馈信息的愿望。2016年2月,iCloud用户数达到7.82亿。
(3)阿里云创立于2009年,是中国的云计算平台,服务范围覆盖全球200多个国家和地区。
阿里云致力于为企业、政府等组织机构,提供最安全、可靠的计算和数据处理能力,让计算成为普惠科技和公共服务,为万物互联的DT世界,提供源源不断的新能源。阿里云的服务群体中,活跃着微博、知乎、魅族、锤子科技、小咖秀等一大批明星互联网公司。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录。此外,阿里云在金融、交通、基因、医疗、气象等领域输出一站式的大数据解决方案。
2014年,阿里云曾帮助用户抵御全球互联网史上最大的DDoS攻击,峰值流量达到每秒453.8GB。在Sort Benchmark 2015世界排序竞赛中,阿里云利用自研的分布式计算平台ODPS,377s完成100TB数据排序,刷新了Apache Spark 1406s的世界纪录。
(4)百度云(Baidu Cloud)是百度在2012年推出的一项云存储服务。
首次注册即有机会获得2TB的空间,已覆盖主流PC和手机操作系统,包含Web版、Windows版、Mac版、Android版、iphone版和WindowsPhone版,用户可以轻松地将自己的文件上传到网盘上,并可跨终端随时随地查看和分享。2013年8月22日,百度云推出“百度云用户破亿,基础服务震撼升级”活动,宣布提供2TB永久免费容量和无限制离线下载服务。2014年11月,百度云总用户数突破2亿,移动端的发展全面超越PC端。2015年8月,百度开放云获技术创新奖。
【拓展文本】
大数据技术,就是从各种类型的数据中快速获得有价值信息的技术。大数据领域已经涌现出了大量新的技术,它们成为大数据采集、存储、处理和呈现的有力武器。大数据处理关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、大数据分析及挖掘、大数据展现和应用。
1.大数据采集技术
数据是指通过RFID(Radio Frequency Identification)射频数据、传感器数据、社交网络交互数据及移动互联网数据等方式获得的各种类型的结构化、半结构化(或称之为弱结构化)及非结构化的海量数据,是大数据知识服务模型的根本。重点要突破分布式高速、高可靠数据获取或采集、高速数据全映像等大数据收集技术;突破高速数据解析、转换与装载等大数据整合技术;设计质量评估模型,开发数据质量技术。
大数据采集一般分为大数据智能感知层和基础支撑层。大数据智能感知层主要包括数据传感体系、网络通信体系、传感适配体系、智能识别体系及软硬件资源接入系统,实现对结构化、半结构化、非结构化的海量数据的智能化识别、定位、跟踪、接入、传输、信号转换、监控、初步处理和管理等。必须着重攻克针对大数据源的智能识别、感知、适配、传输、接入等技术。基础支撑层提供大数据服务平台所需的虚拟服务器,结构化、半结构化及非结构化数据的数据库及物联网络资源等基础支撑环境。重点攻克分布式虚拟存储技术,大数据获取、存储、组织、分析和决策操作的可视化接口技术,大数据的网络传输与压缩技术,大数据隐私保护技术等。
2.大数据预处理技术
主要完成对已接收数据的辨析、抽取、清洗等操作。
(1)抽取:因获取的数据可能具有多种结构和类型,数据抽取过程可以帮助我们将这些复杂的数据转化为单一的或便于处理的构型,以达到快速分析处理的目的。
(2)清洗:对于大数据,并不全是有价值的,有些数据并不是我们所关心的内容,而另一些数据则是完全错误的干扰项,因此要对数据通过过滤“去噪”从而提取出有效数据。
3.大数据存储及管理技术
大数据存储与管理要用存储器把采集到的数据存储起来,建立相应的数据库,并进行管理和调用。重点解决复杂结构化、半结构化和非结构化大数据管理与处理技术中的问题。主要解决大数据的可存储、可表示、可处理、可靠性及有效传输等几个关键问题。开发可靠的分布式文件系统(Distributed File System, DFS)、能效优化的存储、计算融入存储、大数据的去冗余及高效低成本的大数据存储技术;突破分布式非关系型大数据管理与处理技术,异构数据的数据融合技术,数据组织技术,研究大数据建模技术;突破大数据索引技术;突破大数据移动、备份、复制等技术;开发大数据可视化技术。
开发新型数据库技术,数据库分为关系型数据库、非关系型数据库及数据库缓存系统。其中,非关系型数据库主要指的是NoSQL数据库,它分为键值数据库、列存数据库、图存数据库及文档数据库等类型。关系型数据库包含了传统关系数据库系统和NewSQL数据库。
开发大数据安全技术。改进数据销毁、透明加解密、分布式访问控制、数据审计等技术;突破隐私保护和推理控制、数据真伪识别和取证、数据持有完整性验证等技术。
4.大数据分析及挖掘技术
大数据分析技术。改进已有数据挖掘和机器学习技术;开发数据网络挖掘、特异群组挖掘、图挖掘等新型数据挖掘技术;突破基于对象的数据连接、相似性连接等大数据融合技术;突破用户兴趣分析、网络行为分析、情感语义分析等面向领域的大数据挖掘技术。
【拓展文本】
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们所不知道的、但又是潜在有用的信息和知识的过程。数据挖掘涉及的技术方法有很多,且有多种分类方法。根据挖掘任务可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等。根据挖掘对象可分为关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库及环球网Web。根据挖掘方法可粗分为机器学习方法、统计方法、神经网络方法和数据库方法。机器学习方法中,可细分为归纳学习方法(决策树、规则归纳等)、基于范例学习、遗传算法等。统计方法中,可细分为回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、费歇尔判别、非参数判别等)、聚类分析(系统聚类、动态聚类等)、探索性分析(主元分析法、相关分析法等)等。神经网络方法中,可细分为前向神经网络(BP算法)、自组织神经网络(自组织特征映射、竞争学习等)等。数据库方法主要是多维数据分析或OLAP方法,另外还有面向属性的归纳方法。
从挖掘任务和挖掘方法的角度,要着重突破以下几方面。
(1)可视化分析。数据可视化无论对于普通用户或是数据分析专家,都是最基本的功能。数据图像化可以让数据自己说话,让用户直观地感受到结果。
(2)数据挖掘算法。图像化是将机器语言翻译给人看,而数据挖掘就是机器的母语。分割、集群、孤立点分析还有各种各样五花八门的算法让我们精炼数据、挖掘价值。这些算法一定要能够应付大数据的量,同时还具有很高的处理速度。
(3)预测性分析。预测性分析可以让分析师根据图像化分析和数据挖掘的结果做出一些前瞻性判断。
(4)语义引擎。语义引擎需要涉及有足够的人工智能以便能够从数据中主动地提取信息。语言处理技术包括机器翻译、情感分析、舆情分析、智能输入、问答系统等。
(5)数据质量和数据管理。数据质量与管理是管理的最佳实践,透过标准化流程和机器对数据进行处理可以确保获得一个预设质量的分析结果。
5.大数据展现与应用技术
大数据技术能够将隐藏于海量数据中的信息和知识挖掘出来,为人类的社会经济活动提供依据,从而提高各个领域的运行效率,大大提高整个社会经济的集约化程度。在我国,大数据将重点应用于以下三大领域:商业智能、政府决策、公共服务。例如,商业智能技术,政府决策技术,电信数据信息处理与挖掘技术,电网数据信息处理与挖掘技术,气象信息分析技术,环境监测技术,警务云应用系统(道路监控、视频监控、网络监控、智能交通、反电信诈骗、指挥调度等公安信息系统),大规模基因序列分析比对技术,Web信息挖掘技术,多媒体数据并行化处理技术,影视制作渲染技术,其他各种行业的云计算和海量数据处理应用技术等。
资料卡
数据挖掘
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们所不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是一种崭新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转化、分析和模式化处理,从中提取辅助商业决策的关键知识。
云端服务系统提供丰富的API接口,能够迅速实现与运营企业的业务运营平台快速对接和定制开发,从而提供功能强大、低成本的设备综合管理和扩展开发支撑。
云端服务系统主要功能包括统一终端管理、业务统计报表与分析、网络状况统计、地理位置查询、故障报警管理、监控智能快递柜周边、云业务与下位机穿透管理。
云端服务系统基于一个可靠、安全、可扩展、易维护的应用系统平台作为支撑,按照应用系统组成可分为以下子系统:Web前端系统、负载均衡系统、数据库集群系统、缓存系统、分布式存储系统、分布式服务器管理系统、代码分发系统。按照功能模块可分为以下功能模块:登录模块、运营模块、快件管理模块、客服模块、统计模块、合作方快递查询模块、安全报表模块、日志模块、监控模块。
云端服务系统的相关技术:云计算和大数据。云计算是一种利用互联网实现随时随地、按需、便捷地访问共享资源池(如计算设施、存储设备、应用程序等)的计算模式。大数据技术就是从各种类型的数据中快速获得有价值信息的技术。两者相辅相成。
关键术语
大数据(Big Data)
云计算(Cloud Computing)
Web前端(Web Front-end)
负载均衡(Load Balance)
数据库集群(Database Cluster)
缓存(Cache)
分布式存储(Distributed Storage)
数据中心(Data Center)
数据挖掘(Data Mining)
移动互联网(Mobile Internet)
预测性分析(Prediction Analysis)
语义引擎(Semantic Engines)
一、判断题
1.云端服务系统只是智能快递柜终端的后台系统。( )
2.云端服务系统各个模块和子系统之间是独立的。( )
3.负载均衡系统分为硬件和软件两种。硬件的效率更高,但是软件的价格低。( )
4.云端服务系统使用的负载均衡系统为Nginx、LVS、HAProxy。( )
5.在云平台中通过GitHub实现源代码管理和版本控制。( )
二、选择题
1.Web前端系统是基于( )的虚拟主机平台。
A.jQuery
B.Nginx
C.Spring
D.Hibernate
2.硬件负载均衡是下列的( )。
A.Nginx
B.LVS
C.F5
D.HAProxy
3.使用( )机制实现快速将主库(写库)的数据库复制到从库(读库)。
A.JDBC
B.Handler
C.MySQL Replication
D.AsyncTask
4.分布式服务器管理系统软件是下列中的( )。
A.Linux
B.Android
C.Cfengine
D.iOS
5.云计算核心服务的( )子层是基于云计算基础平台所开发的应用程序。
A.SaaS
B.PaaS
C.IaaS
D.BaaS
三、简答题
1.云端服务系统主要包含哪几个子系统?
2.简要概述云计算服务主要分为哪三个部分?
3.云计算的特点是什么?