HDFS究竟是什么?HDFS是怎样储存数据的?
作者:广州电脑培训甘发布时间:2020-10-16分类:软件开发培训浏览:750
HDFS,全称Hadoop Distributed File System,意思是分布式文件系统。Hadoop分布式文件系统是指被设计成适合du运行在通用硬件(commodity hardware)上的分zhi布式文件系统。HDFS 源于 Google 在2003年10月份发表的GFS论文。
接下来,我们从传统的文件系统入手,开始学习分布式文件系统,以及分布式文件系统是如何演变而来。传统的文件系统对海量数据的处理方式是将数据文件直接存储在一台服务器上传统的文件系统在存储数据时,会遇到两个问题,具体如下:
1、当数据量越来越大时,会遇到存储瓶颈,就需要扩容;
2、由于文件过大,上传和下载都非常耗时;
为了解决传统文件系统遇到的存储瓶颈问题,那么首先考虑的就是扩容,扩容有两种形式,一种是纵向扩容,即增加磁盘和内存;另一种是横向扩容,即增加服务器数量。通过扩大规模从而达到分布式存储,这种存储形式就是分布式文件存储的雏形
解决了分布式文件系统的存储瓶颈问题之后,那么还需要解决文件上传与下载的效率问题,常规的解决办法是将一个大的文件切分成多个数据块,将数据块以并行的方式进行存储。这里以30G的文本文件为例,将其切分成3块,每块大小10G(实际上每个数据块都很小只有100M左右),将其存储在文件系统中。
原先一台服务器要存储30G的文件,此时每台服务器只需要存储10G的数据块就完成了工作,从而解决了上传下载的效率问题。但是文件通过数据块分别存储在服务器集群中,那么如何获取一个完整的文件呢?针对这个问题,就需要再考虑增加一台服务器,专门用来记录文件被切割后的数据块信息以及数据块的存储位置信息。
- 上一篇:大数据的Hadoop是什么?
- 下一篇:大数据能干什么?浅谈大数据的应用场景
- 软件开发培训排行
- 最近发表
-
- 梅州信息:凝聚共识裁审同行梅州市召开劳动人事争议裁审衔接工作研讨会|||计算机网络培训学校
- 东莞信息:虎门镇民营企业招聘月活动|||广州市北大青鸟计算机职业培训学校
- 东莞信息:(塘厦)塘厦镇举办“筑劳知识”之“阳光经营第一课”劳务派遣政策法规宣讲会|||计算机职业技能培训班
- 东莞信息:(塘厦)塘厦镇举办2024年全市首场名城名企OpenDay活动启动仪式|||计算机软件培训学校
- 东莞信息:(南城)南城开展“民营企业招聘月”直播带岗活动|||中专学计算机平面设计女生可以学计算机网络技术好吗
- 湛江信息:专家、大咖云集献策!国家高层次人才服务行活动走进湛江|||计算机培训学校招生
- 东莞信息:(万江)万江人社分局组织企业参加东莞云聘周周招直播带岗活动|||计算机培训学校招生
- 东莞信息:(莞城)深入园区送政策精准服务助发展|||计算机网络培训学校
- 汕头信息:市人社局加强公共服务下沉基层赋能“百千万工程”|||计算机专业维修学校
- 东莞信息:(东坑)东坑再添一家“广东省博士工作站”|||计算机专业维修学校
- 标签列表
-