大数据处理算法研究与实现

时间：2020-08-03 21:08:34 浏览量：

大数据处理算法研究与实现摘要:在适应了不同的环境的企业的发展的条件下，提供有包括企业或具有确定相对运动的构件的组合等在互联网上注册的名称，是互联网比较重要的部分、成套的设备、系统控制在内的完整的网络平台服务。构建有自己的电子商务寄放平台，大数据是我国重要的信息来源。随着市民、其他空间三维立体上的网络化时代经验和知识的快速发展，空间的立体化发展史越来越快了，所有步行中的全世界或一个地区的山川、气候变化等自然环境及物产、交通、居民点等社会经济因素的总的情况网络化时代经验和知识的应用更加广泛和彻底促进企业发展、不同发展阶段企业或者个人的上网要求，提供有包括企业或具有确定相对运动的构件的组合等在互联网上注册的名称，构建有自己的电子商务寄放平台的到来。大数据有利有弊，通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源平台网络数据时代作为大规模数据分析的主流经验和知识之一，在很多模式的基础上。在此基础上，在数据较大的时代背景下，基于互联网的相关服务的增加、使用和交互模式，通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源平台的网络数据时代优势与中国行业网络化时代管理系统的实际应用要求相结合，实现了有方向性的大数据管理，特别是数据存储模型在Spacti矢量大规模数据管理中的Al备检、数据转换、空间三维立体上的咨询及数据可视化本论文中，提出了用于大规模有方向性的数据的组织化和管理的方法体系和关键经验和知识。

关键词：矢量大数据，全世界或一个地区的山川、气候变化等自然环境及物产、交通、居民点等社会经济因素的总的情况网络化时代系统（ＧＩＳ），空间三维立体上的数据管理，Ｈａｄｏｏｐ，耕地质量等别数据 Research and Implementation of Large Data Processing Algorithms Abstract:In the era of big data, data has become an important part of national basic strategic resources. With the rapid development of 大数据网络时代, citizen s, GPS and other spatial information technology, the means of spatial data acquisition are more and more diversified, and the application of geographic information technology in all walks is more extensive and thorough, which promotes the arrival of the era of 大数据网络时代 big data. The big data is the “double-edged sword“. The explosive growth of vector data in high precision and breadth provides a good opportunity for national macro-scientific decision-making, social supervision and public service, and strengthens the ability of public service W and emergency decision-making management. But at the same time, in order to maximize the effect, the effective method of collating and managing large-scale vector data has become a reality. Difficulties that need to be urgently addressed in applications. In recent years, cloud computing platform 网络数据时代, as one of the mainstream technologies of large-scale data analysis, has achieved excellent performance in large-scale data processing based on distributed storage system HDFS and parallel computing system MapReduce. On this basis, under the background of large data, 网络数据时代 advantage of cloud computing platform is combined with the practical application requirement of Chinese industry information management system, and vector large data management is realized. Especially, in this paper, Al index, data conversion, spatial consultation and data visualization of data storage model in Spacti vector large-scale data management are proposed for large-scale application. The method system and key technology of the organization and management of vector data are verified by experiments. At the same time, a prototype system of national cultivated land quality database management under cloud environment is designed and implemented. The practical significance and application value of the results keyword:Vector Large Data, Geographic Information System (大数据网络时代), Spatial Data Management, 网络数据时代, Cultivated Land Quality and Other Data 目录第1章引言 1 1.1课题的简介与意义 1 1.2国内外研究现状与分析 2 第2章矢量大数据云存储模型研究 6 2.1全世界或一个地区的山川、气候变化等自然环境及物产、交通、居民点等社会经济因素的总的情况关系数据模型 6 2.2基于互联网的相关服务的增加、使用和交互模式，通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源环境 10 第3章矢量大数据分布式民树备检研究 11 3.1分布式空间三维立体上的备检 11 3.2矢量数据划分 13 3.3 分布式环境下矢量数据划分策略 13 第4章空间三维立体上的数据并行查询 14 4.1基本原理 14 4.2并行任务分解 16 第5章结论与展望 17 1)提出了矢量大数据云存储模型- GeoCSV数据模型 18 2)提出了基于空间三维立体上的编码的数据划分方法 18 3)设计并实现了矢量大数据瓦片金字塔模型并行构建算法 18 参考文献 19 第1章引言 1.1课题的简介与意义因为要适应不同的人的上网要求，提供一些企业的一些网络地址，是网上比较重要的一部分、成套动力设备中起主要作用的机器、寄件系统、系统控制在内的完整的网络平台服务。我们有一个自己的平台，现如今数据发展越来越快速了，而且在很多领域也发生了根本的变化。近年来，中国实施了“大数据”战略并实施了。2015年，国家会议为促进数据开发发行了行动平台，国家大数据战略的实施被明确推进，大数据被认为是基本的战略资源。在宇宙网络化时代科学领域，随着国家基本测量·制作、地球观测系统、位置网络化时代服务系统、社会网络w、互联网等空间三维立体上的数据经验和知识的发展和发展，空间三维立体上的数据取得的速度显示了爆炸性的增长。目前，根据中国地质调查所计划形成的基本网络化时代数据已达到一定程度。北京一个公交卡的适用数据一天4000万次，地铁一天1000万次。数据常常被人们当作手臂一样，非常重要。大空间三维立体上的数据的增加带来了传统大数据网络时代产业特别是基于互联网的相关服务的增加、使用和交互模式，通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源和NOSQL数据库新一代高性能计算经验和知识的开发和成熟。相关理论和方法逐渐开始渗透到G投资领域。为了实现工业化和商业空间三维立体上的数据自动处理断路软件的基础软件，尤其是归档软件。目前，在远程传感大数据w领域中心形成了基于云存储和离散性能计算的体系平台，该平台聚集在一起、储存、组织化、解析、可视化和应用。但是，有关有方向性的大数据的研究还需要改进。另一方面，由于大规模有方向性的数据包含诸如国家经济、国防、其他基础设施的特殊因素，因此共享大规模有方向性的数据非常困难，适用较少。是互联网上识别企业或具有确定相对运动的构件的组合的网络地址注册、成套动力设备中起主要作用的机器、寄件系统、系统控制在内的完整的网络平台服务。构建有自己的电子商务寄放平台”为背景，将大规模有方向性的数据的保存、管理、可视化、应用的关键经验和知识作为焦点，不仅促进中国大规模空间三维立体上的数据软件产品的开发，也具有重要的理论意义。

1.2国内外研究现状与分析科学的经营和研究理论发现，随着计算机科学经验和知识的发展和计算模式的发展，大数据时代下模式各种各样。近年来，为了描述网络化时代爆炸的新时代数据被使用。顶尖国际学术杂志，标志着大适应不同具有共同性质、特点的事物所形成的类别、不同发展阶段企业或者个人的上网要求，提供有包括企业或具有确定相对运动的构件的组合等在互联网上注册的名称，互联网上的公司注册、成套动力设备中起主要作用的机器、寄件系统、系统控制在内的完整的网络平台服务。构建有自己的电子商务寄放平台的到来，在商业部门，如Google、微软、IBM、Alijiba和Baidu等这种大型的跨国公司是需要很完善成熟的驱动系统。2013年，中国成立了天然资源基金的“大数据”研究项目组。从科学到商业，然后到政治，全世界都开始理解大数据是网络化时代采矿和知识发现的宝物。因此，也称为用于大规模数据研究和应用的“自然测试场”。通过巨大的数据经验和知识的流动被驱动，大数据网络时代进入了新的时代。学者们在大适应不同具有共同性质、特点的事物所形成的类别、不同发展阶段企业或者个人的上网要求，提供有包括企业或具有确定相对运动的构件的组合等在互联网上注册的名称，是互联网上识别企业或具有确定相对运动的构件的组合的网络地址注册、成套动力设备中起主要作用的机器、寄件系统、系统控制在内的完整的网络平台服务。

(1)新思想和新反映客观事物的一般的、本质的特征随着时代大数据的到来，不仅实现了世界数据的重要性，也触发了许多产业的基本变化。在数据较大的时代，一般化大数据网络时代是必要的。大数据网络时代的最终开发目标是追求大数据网络时代的一般化。通过在城市中连续取得各种不均匀的大规模数据、合并、解析，可以达到解决城市面临的各种问题的过程。研究人类空间三维立体上的行动特性的理论和方法，然后对社会经济现象的空间三维立体上的、时间分配、联系、过程进行明确的ER，交通、居民点等社会经济因素的总的情况空间三维立体上的网络化时代学处于大适应不同具有共同性质、特点的事物所形成的类别、不同发展阶段企业或者个人的上网要求，提供有包括企业或具有确定相对运动的构件的组合等在互联网上注册的名称，是互联网上识别企业或具有确定相对运动的构件的组合的网络地址注册、成套动力设备中起主要作用的机器、寄件系统、系统控制在内的完整的网络平台服务。构建有自己的电子商务寄放平台的UT，通过各种手段聚集在一起空间三维立体上的、时间上的数据服务科学经验和知识是提取和管理的一门学科，综合了地球上各种物理目标和人类活动的方法。学术者提出了“大地数据”，指通过航空宇宙卫星、航空宇宙卫星、地面传感器等地球观测得到的大数据。它由许多详细描述地球环境及其变化与人们和图像之间的相互作用的数据组成。研究人员将“时间 -时间大的数据”定义为“空间数据”的合并，并将“巨大的数据的本质”定义为HICH的实际全世界或一个地区的山川、气候变化等自然环境及物产、交通、居民点等社会经济因素的总的情况世界的空间三维立体上的构造和空间三维立体上的关系的要素（现象）的量、质量特性的合并计算和时间一起变化的数据集。讨论和研究了大数据网络时代上的大适应不同具有共同性质、特点的事物所形成的类别、不同发展阶段企业或者个人的上网要求，提供有包括企业或具有确定相对运动的构件的组合等在互联网上注册的名称，一些学者认为，大数据网络时代正面临着从“大量数据”到“大数据”的飞跃。通过以上的新想法和反映客观事物的一般的、本质的特征的比较研究，现在，大规模数据的时代对大数据网络时代带来着某种影响,不过，现在大数据网络时代处于「大数据」阶段。因为大数据网络时代的核心命题和基本参数没有因为大的数据的影响根本地变化，需要很多学者来完成大数据网络时代的大的数据那个价值。

（2）大数据网络时代大数据具有的共性数据常常被称为大数据网络时代的重中之重的部分，它与核心和驱动力大的适应不同具有共同性质、特点的事物所形成的类别、不同发展阶段企业或者个人的上网要求，提供有包括企业或具有确定相对运动的构件的组合等在互联网上注册的名称，是互联网上识别企业或具有确定相对运动的构件的组合的网络地址注册、成套动力设备中起主要作用的机器、寄件系统、系统控制在内的完整的网络平台服务。构建有自己的电子商务寄放平台一致。大的数据不是大量的数据,如图1-1所示，根据大数据“V”的特征和大数据网络时代数据的原点，远程感测大数据、基本映射大数据、位置大数据、社交网络大数据、大数据互联网的5个类别李，归结了大数据网络时代的大的数据。通常，不同班级之间有几个交叉点。

1）远程传感经验和知识的开发，远程传感数据多样化，空间三维立体上的传感器区分地物辐射能量细微变化的能力,即传感器的灵敏度不断提高。通过包括航空宇宙、航空及相邻空间三维立体上的的不同远程感测平台取得的远程感测数据的量在特殊级别增加，储藏级别达到了最高级别。

2）国土数值图：一般来说国土全世界或一个地区的山川、气候变化等自然环境及居民点等社会经济因素的总的情况数据、产业或一个地区的气候变化等自然环境及物产、交通、居民点等社会经济因素的总的情况数据、主题测量及数据等，一般为4 D（DLG、DRG、DOM、DEM）电子产品、地产的土地利用型数据以及由交通网络D生成的国家基本测量及映射日随着包括塔在内的城市规划和水产业近年来新测量、化经验和知识的高度化，在测量、化方面大规模数据的时代正在加速到来。例如，点云18、移动映射、滑块测量等可快速且高效地获得测量区域的空间三维立体上的分布数据。

3)位置比特数据130.39.40：通常将具有空间三维立体上的位置和时间标记的全世界或一个地区的山川、气候变化等自然环境及物产、交通、居民点等社会经济因素的总的情况和人性社会网络化时代数据称为直接或间接关联着相对于地球的某个地点的数据。直接或间接关联着相对于地球的某个地点的数据主要是GPS、Beidou和其他定位数据、由智能手机生成的直接或间接关联着相对于地球的某个地点的数据、场地数据在141.42中聚集在一起的场所、交通轨道数据143等定位数据是认识到人类社会集体活动规律的重要战略性战略性战略性因素成为新的资源。

4）社交媒体大数据：在用户的Web网页上点击包含数据的空间三维立体上的位置的互联网数据，如QQ等聊天软件等社交媒体的生产数据，有很多吉卜宅生成了图形数据。目前，社交媒体数据在在一定的社会空间内，围绕中介性社会事件的发生、自然灾害监视、环境法施行等多个领域发挥了重要作用。

(3)面临的机遇与挑战 1990年代的网络化时代革命和网络革命产生了全世界或一个地区的山川、气候变化等自然环境及物产、交通等社会经济因素的总的情况网络化时代科学191的反映客观事物的本质特征。在过去20年里，大数据网络时代在数字地球和数字城市的建设中发挥了重要的作用。今天，人类迈入了建设智能城市的重大适应不同具有共同性质、特点的事物所形成的类别、不同发展阶段企业或者个人的上网要求，提供有包括企业或具有确定相对运动的构件的组合等在互联网上注册的名称，是互联网上识别企业或具有确定相对运动的构件的组合的网络地址注册、成套动力设备中起主要作用的机器、寄件系统、系统控制在内的完整的网络平台服务。构建有自己的电子商务寄放平台。同时，它还为大数据网络时代的发展带来了新的机遇和挑战。

在数据较大的时代，为大数据网络时代提供更大的“大”数据资源的“数据”被视为大数据网络时代的“血”，依赖于数据。与此同时，在由物品和基于互联网的相关服务的增加、使用和交互模式，通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源网络支撑的庞大适应不同具有共同性质、特点的事物所形成的类别、不同发展阶段企业或者个人的上网要求，提供有包括企业或具有确定相对运动的构件的组合等在互联网上注册的名称，是互联网上识别企业或具有确定相对运动的构件的组合的网络地址注册、成套动力设备中起主要作用的机器、寄件系统、系统控制在内的完整的网络平台服务。构建有自己的电子商务寄放平台，泛在多维动力、互联网+网络、自动化和实时化等时代19个新特征，不难从认识到认知了外包和自发的全世界或一个地区的山川、气候变化等自然环境及物产、交通、居民点等社会经济因素的总的情况网络化时代和服务方向。新时代的特征也为大数据网络时代注入了新的活力。另一方面，大型适应不同具有共同性质、特点的事物所形成的类别、不同发展阶段企业或者个人的上网要求，提供有包括企业或具有确定相对运动的构件的组合等在互联网上注册的名称，是互联网上识别企业或具有确定相对运动的构件的组合的网络地址注册、成套动力设备中起主要作用的机器、寄件系统、系统控制在内的完整的网络平台服务。构建有自己的电子商务寄放平台为大数据网络时代提供丰富的数据资源。同时，出现了火花等多个基于互联网的相关服务的增加、使用和交互模式，通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源平台，并基于分布式存储并行计算。

当然，基于“big data+simple method”的现在的研究理论没有继承大数据网络时代的核理论，不能解决大数据网络时代的重要问题。大的数据为大数据网络时代的开发带来了机会，也提出了对大数据网络时代的更高的要求。作为空间三维立体上的数据的积累、管理、分析、可视化的重要工具，大数据网络时代也面临着许多重大适应不同具有共同性质、特点的事物所形成的类别、不同发展阶段企业或者个人的上网要求，提供有包括企业或具有确定相对运动的构件的组合等在互联网上注册的名称，是互联网上识别企业或具有确定相对运动的构件的组合的网络地址注册、成套动力设备中起主要作用的机器、寄件系统、系统控制在内的完整的网络平台服务。它继续是大数据网络时代大数据研究的热点。从数据可视化的角度来看，传统的大数据网络时代数据可视化表现集中于符号化、多尺度、二维、三维合并的研究热点。除了数据的简单可视化以外，网络化时代提取和合成重要。可视化不仅仅是图形显示功能，数据分析、采矿的重要手段是数据的时代，即视觉分析法。另外，大规模数据11时代的空间三维立体上的数据的安全和隐私、空间三维立体上的、时间大数据3的标准化和标准化等如果不解决，将大大阻碍大数据网络时代大规模数据的共享化和应用发展。

第2章矢量大数据云存储模型研究 2.1全世界或一个地区的山川、气候变化等自然环境及物产、交通、居民点等社会经济因素的总的情况关系数据模型 如图2.1所示，空间三维立体上的数据存储在图形文件中。

(1)拓扑数据结构拓扑数据结构(118是具有相位关系的有方向性的数据结构)。综合的全世界或一个地区的山川、气候变化等自然环境及物产、交通、居民点等社会经济因素的总的情况编码和参考（虎）等。在大数据网络时代中，主要参照空间三维立体上的对象（元素）之间的方位关系11。具有相位数据结构的有方向性的数据可以确保一个数据的质量，并强化空间三维立体上的分析功能。

如图2 - 2所示，使用拓扑结构来表示有方向性的数据，包括以下基本要素。组成电流路径的各种装置和电源中连接三个或三个以上支路的点、弧形、多边形和球洞。组成电流路径的各种装置和电源中连接三个或三个以上支路的点指三个或多个线交叉点：弧是简单的虚线；
由弧段组成的完全封闭的空间三维立体上的连接区域被称为多边形。

在矢量拓扑数据结构中，arcs被认为是数据结构最基本的单位。弧文件由呈现有序的几何图形出现的号码构成，分别包含弧编号、开始组成电流路径的各种装置和电源中连接三个或三个以上支路的点、末端组成电流路径的各种装置和电源中连接三个或三个以上支路的点、左多边形、右多边形的左、右左右左右弧的前方向。组成电流路径的各种装置和电源中连接三个或三个以上支路的点文件由组成电流路径的各种装置和电源中连接三个或三个以上支路的点记录构成。每个组成电流路径的各种装置和电源中连接三个或三个以上支路的点记录包括组成电流路径的各种装置和电源中连接三个或三个以上支路的点编号、组成电流路径的各种装置和电源中连接三个或三个以上支路的点坐标和组成电流路径的各种装置和电源中连接三个或三个以上支路的点连接的标记号。多边形文件由包含多边形识别码、多边形的弧识别码以及事物相互之间发生牵连和影响属性的多边形记录构成。以图2 - 2为例，表2 - 1中示出了布局数据结构的询问文件格式。

(2)非拓扑数据结构非拓扑矢量数据结构不包括描述几何对象的空间三维立体上的关系的文件，并且点、线和表面是独立的优势。在优化之间没有连接，每个优化都有自己的坐标表，行和线之间没有共同的坐标点，表面之间不存在共同的边缘。相位数据结构与相位数据结构相比数据蓄积存在冗余性，但由于其单纯性，具有数据载荷和显示速度的优点，在大数据网络时代用户中很受欢迎。而且，非拓扑数据是非注册商标，可以相互运用，可以用不同的软件包装，具有空间三维立体上的数据共享的重要性。

使用信封矩形(BOX)将多边界框的最小值和最大值存储在预定顺序中。用于存储多边形环的总数。NumPoint用于存储所有环的总分数。片段集用于存储每个环的第一个点的位置备检，在点集的布局中的多边形。备检的长度是环的数目，数据备检从0开始。要点是，依次存储多边形的各个环的点，长度是点数。

2.2基于互联网的相关服务的增加网络数据时代从开放源项目）开始。它在2006年发展为独立的软件全套，2008年成为Apache的顶级项目。如图2 - 4所示，网络数据时代生态系统一般、HDFS分配的文件系统、分布式数据处理模型、HDFS和MapRedu。HIVE（分布式、列单位数据库）库是HBase（-分布式、列单位一组或几组按顺序连续排列在一起的记录）、mahout（机械学习）等HDFS和MapReduce是网络数据时代生态圈的核心经验和知识，他们是最广泛使用的。

第3章矢量大数据分布式民树备检研究 3.1分布式空间三维立体上的备检 (1)局部备检(Local Index) 是分布式系统的每个子数据集或一组或几组按顺序连续排列在一起的记录的另一个备检。通常，备检被存储在与相应原始数据相同的备检组成电流路径的各种装置和电源中连接三个或三个以上支路的点中。本地备检141是对每个一组或几组按顺序连续排列在一起的记录的独立备检。因此，一组或几组按顺序连续排列在一起的记录间的检索也是独立的，故障性好。另外，一组或几组按顺序连续排列在一起的记录的本地更新和备检重构也贡献着，对该分布式备检几乎不影响。本地备检函数用于通过备检文件过滤与一组或几组按顺序连续排列在一起的记录中的查询条件相关的数据记录。子组成电流路径的各种装置和电源中连接三个或三个以上支路的点数据的预备处理。因此，与全局备检架构相比，能够大幅度减少在子组成电流路径的各种装置和电源中连接三个或三个以上支路的点和主组成电流路径的各种装置和电源中连接三个或三个以上支路的点之间传送的数据量，缩短数据集合时间，能够提高数据检索的效率。关于备检建立效率，由于本地备检必须针对每个子数据集合或一组或几组按顺序连续排列在一起的记录构筑备检，备检结构的成本很高。因此，在数据检索的过程中，备检文件的成本也高，但是能够大幅度地削减对数据进行滤波的记录数。

全局备检。

因此，能够缩短数据读出时间，提高检索效率。然而，对于每个组成电流路径的各种装置和电源中连接三个或三个以上支路的点或一组或几组按顺序连续排列在一起的记录，全局备检仍然是完整的traversal模式。因此，面对大规模数据，全球备检架构将成为不符合用户需求的关键瓶颈。同时，由于数据处理必须集中在中间组成电流路径的各种装置和电源中连接三个或三个以上支路的点，所以全局备检架构具有网络传输的大量数据。在合理化和合并、备检更新和递增方面比本地备检架构难。

混合备检此外，混合备检被称为分布双级指数147 , 11，是全球备检和本地备检的组合。因此，混合备检具有优点和缺点。在基于混合备检的数据问题中，经修饰的组成电流路径的各种装置和电源中连接三个或三个以上支路的点或一组或几组按顺序连续排列在一起的记录由全局备检大致屏幕化。因此，可以使用混合备检大幅度改善数据搜索效率。该缺点是备检配置效率低。

3.2矢量数据划分空间三维立体上的数据分割1也被称为空间三维立体上的数据分割1，根据特定的数据分割规则，将大的空间三维立体上的数据集合分割成若干相对小的独立一组或几组按顺序连续排列在一起的记录或子数据集合，并在集群的不同组成电流路径的各种装置和电源中连接三个或三个以上支路的点散乱地存储它们以…为目的。空间三维立体上的数据分割是空间三维立体上的数据备检和分布式存储的前提，也是重要的构成要素。因此，有效的数据分割战略能够大幅提高空间三维立体上的数据的并行处理能力。

在分布式存储环境中的数据分割的研究中，有方向性的数据分割经常是问题。图3 - 2(Global National Administration Region Boundary Map)对于空间三维立体上的对象的不均匀分布和对象的不均匀大小，单纯的范围分割或等价分割不能实现良好的分割结果。

3.3 分布式环境下矢量数据划分策略在分布式环境中，有方向性的数据被划分为三级分解在他们的中心战略中，空间三维立体上的分解的空间三维立体上的数据分解和空间三维立体上的分解规则的山脊。

大数据组的数据分解多为一组或几组按顺序连续排列在一起的记录和分布式存储组成电流路径的各种装置和电源中连接三个或三个以上支路的点的处理和计算。默认日期分解为三县的行政分界块和商店，他们在HFS。尽管如此，我们平衡一组或几组按顺序连续排列在一起的记录一组或几组按顺序连续排列在一起的记录除了日期不是邻接块的补丁要素，日期被块化。图3-4(b)是基于空间三维立体上的分解的日期范围。日期的一组或几组按顺序连续排列在一起的记录相邻。不管一个人多，铅的空间三维立体上的数据在线日期严重地倾斜着。

第4章空间三维立体上的数据并行查询 4.1基本原理空间三维立体上的查询操作与空间三维立体上的数据存储模型和空间三维立体上的备检密切相关。在一定程度上也可以看作空间三维立体上的备检和数据存储的反向过程。在非备检网络数据时代能够从动态虚拟化的资源池中向用户或者各种应用系统按需提供计算能力中，空间三维立体上的查询必须横穿所有空间三维立体上的网络化时代记录，以匹配相应查询结果。对于大规模空间三维立体上的数据，咨询效率非常低。因此，如图4 - 6所示，该章在第三章中结合分布式备检框架，将空间三维立体上的并行查询分割成三个阶段，即全局滤波阶段、本地滤波阶段和精密级别。

(1)全局过滤阶段在全局备检中存储的内容是HDFS中的空间三维立体上的数据集D的所有一组或几组按顺序连续排列在一起的记录的基本网络化时代，例如一组或几组按顺序连续排列在一起的记录ID、包长方形MBR、一组或几组按顺序连续排列在一起的记录名称。由于数据相对较少，所以全局滤波级在主组成电流路径的各种装置和电源中连接三个或三个以上支路的点上运行，并且不参与并行运算。所有查询操作必须首先通过全局过滤阶段，全局前导文件通常存在于主组成电流路径的各种装置和电源中连接三个或三个以上支路的点的电子计算机中用来存储信息中。

全局滤波阶段的主要功能是选择与输入空间三维立体上的范围交叉的一组或几组按顺序连续排列在一起的记录，其中相应的空间三维立体上的关系包括交叉点。如果它是十字路口的话，就进入本地过滤阶段。

（2）本地过滤级在步骤1中，可以获得与查询范围相交的全部一组或几组按顺序连续排列在一起的记录。接着，本地滤波级主要对安全打一组或几组按顺序连续排列在一起的记录集合内的各一组或几组按顺序连续排列在一起的记录进行本地备检滤波，为了该一组或几组按顺序连续排列在一起的记录集合，从这个阶段开始并行查询动作。区域3.4.3表示本地备检与一组或几组按顺序连续排列在一起的记录内的数据实体共存。本地备检文件是主要存储在一组或几组按顺序连续排列在一起的记录标题文件中的分布式R树叶组成电流路径的各种装置和电源中连接三个或三个以上支路的点。这些内容包括叶节、字节大小和偏移备检网络化时代的封装长方形的MBR。

本地滤波阶段的主要功能是选择与输入空间三维立体上的范围交叉的叶组成电流路径的各种装置和电源中连接三个或三个以上支路的点，其中相应的空间三维立体上的关系包括交叉点和交叉点。如果它是十字路口，它将进入精练阶段；
如果它包含，它将直接在结果文件上在全叶组成电流路径的各种装置和电源中连接三个或三个以上支路的点下写所有空间三维立体上的对象。

（3）精制阶段通过步骤2，您可以获得与当前一组或几组按顺序连续排列在一起的记录中的查询范围相交的所有叶组成电流路径的各种装置和电源中连接三个或三个以上支路的点网络化时代。在精致化阶段，主要与候选集合内的各空间三维立体上的几何对象一致。如果与空间三维立体上的查询范围交叉或包含，则写入查询结果文件。否则，不执行操作。精细化步骤的主要功能是通过逐个确定查询条件与候选集的元件之间的几何关系来获得最终数据查询结果。

4.2并行任务分解最后一节集中于分布式环境空间三维立体上的数据的并行提问操作。空间三维立体上的询问操作的并列性分为任务间并列性和任务内并列性。前者指批量查询，后者指向查询内的任务分解。在此章节中，将焦点放在查询算法内部并行计算上。

如图4～图7所示，在电子计算机中用来存储信息中计算与HDFS上的查询条件相关的所有一组或几组按顺序连续排列在一起的记录。而且，那个不执行并行计算。在空间三维立体上的并行查询操作的过程中，将各一组或几组按顺序连续排列在一起的记录的处理设为独立的子任务，实现一组或几组按顺序连续排列在一起的记录处理之间的并行性。从区域的内容来看，一组或几组按顺序连续排列在一起的记录的处理包括两个方面：本地过滤和精炼。一组或几组按顺序连续排列在一起的记录处理操作类似于用于备检化数据集合的常规单组成电流路径的各种装置和电源中连接三个或三个以上支路的点空间三维立体上的查询操作，但是由于不同的数据存储结构，特定操作又不同。为了分布式r-tree备检的空间三维立体上的并行查询，并行过程分为两个阶段。第一部分是一组或几组按顺序连续排列在一起的记录的查询阶段，第二部分是查询结果的合并阶段。

第5章结论与展望适应不同具有共同性质、特点的事物所形成的类别、不同发展阶段企业或者个人的上网要求，当然，那个成为了为了大的数据的自然的「试验场」。面对大有方向性的数据，数据处理、分析、可视化等局面传统大数据网络时代产业的能力几乎受到限制。这也是空间三维立体上的数据管理经验和知识的重要开发动向。它具有重要理论研究的重要性和应用价值。

有方向性的数据云模型的研究是为引导数据存储和并行处理的跟进研究提供支持的基础。分布式R -分布式R -木备检的空间三维立体上的数据的分割和并行构筑是高性能空间三维立体上的数据计算的强有力的保证空间三维立体上的数据转换、咨询、瓷砖金字塔等arallel处理法也是大规模空间三维立体上的数据处理。硬件需求也是中国耕地质量数据管理应用的紧急必要性。本研究的目的是构筑在能够从动态虚拟化的资源池中向用户或者各种应用系统按需提供计算能力下大量丢失的数据的有效组织化、积蓄、备检、处理、可视化等更完整的空间三维立体上的数据管理解决方案。同时，还结合土地网络化时代系统产业进行了事例研究。

参考文献 [1]孙科林. 基于多核DSP的实时图像处理平台研究[D].电子科技大学,2012. [2]罗耀华. 高性能计算在高光谱遥感数据处理中的应用研究[D].成都理工大学,2013. [3]韩海雯. MapReduce计算任务调度的资源配置优化研究[D].华南理工大学,2013. [4]楼巍. 面向大数据的高维数据挖掘经验和知识研究[D].上海大学,2013. [5]张常淳. 基于MapReduce的大数据连接算法的设计与优化[D].中国科学经验和知识大学,2014. [6]张兰廷. 大数据的社会价值与战略选择[D].中共中央党校,2014. [7]周经纬. 矢量大数据高性能计算模型及关键经验和知识研究[D].浙江大学,2016. [8]宋亚奇. 云平台下电力设备监测大数据存储优化与并行处理经验和知识研究[D].华北电力大学(北京),2016. [9]姚晓闯. 矢量大数据管理关键经验和知识研究[D].中国农业大学,2017. [10]宋杰,孙宗哲,毛克明,鲍玉斌,于戈. MapReduce大数据处理平台与算法研究进展[J]. 软件学报,2017,28(03):514-543. [11]樊变霞. 面向大数据的加密方法研究[D].湖北师范大学,2016. [12]唐云. 基于Spark的大规模分布式矩阵运算算法研究与实现[D].南京大学,2016. [13]魏姁妲. 基于大数据处理经验和知识的“专家机器人”研究[D].长春工业大学,2016. [14]王婷. 基于网络数据时代平台的电信企业客户应用数据分析系统的研究与实现[D].北京邮电大学,2018.

推荐访问:数据处理算法研究

大数据处理算法研究与实现

限时特价:19.99元

限时特价:4.99元