网站首页 > 品牌新闻 正文
HANA全称为高性能分析设备。虽然HANA已经发布了五年左右,但是IT界对HANA的了解却很少,甚至很多人都没有听说过。想必大家熟知的数据库如MySQL和Oracle,HANA以及这两个数据库都是数据关系型数据库。
因为大家对mysql肯定比较熟悉,所以我就以mysql为例,以mysql为代表来讲解HANA。
大家一定知道现在的数据库有两种,关系型数据库和非关系型数据库。常见的关系数据库有Mysql、Oracle等。和非关系数据库,如HBase和Redis。其中,HBase与传统关系型数据库的区别不仅在于是否是关系型数据库,还在于与MySQL等关系型数据库的区别,即HBase是列存储,而MySQL是行存储。
所以现在大家都有一个疑问,为什么要用列存储?相比线存储有什么优势?现在让我们看看行存储和列存储之间区别。如图所示,行存储和列存储实际上都存储在内存地址中。
从图中可以看出,行存储是按行为单元存储在数据库中的,而列存储是按列单元存储的。当我们向数据库中逐行插入数据时,行存储明显有优势,当我们从数据库中逐行读取数据时,行存储也有优势。如果我们不想取出一整行,如果我们选择一列,那么基于列的存储是主要的,当我们进行聚合时,它也是基于列的。在当今的大型企业中,据统计数据库中有近35%的列是无用的,所以我们在分析数据时,行存储的效率低于列存储的效率。
为什么列存储在数据分析中效率更高?原因之一是查询时无法查询不必要的列,减少了数据传输;第二个原因是,既然是数据分析,就要进行聚合运算,比如max,min等,而聚合操作是对列执行的。列存储是按列存储的,所以在数据分析中比行存储效率高。
近年来,随着IT行业硬件的发展,技术路线发生了明显的变化。以前硬件厂商致力于提供更高时速的处理器,也就是提高单个CPU的计算能力。但近年来,硬件服务器的处理器时速提升并不明显。SAP HANA的整体架构支持基于处理器平台的多个服务器和处理器的高效并行处理。在应用层的架构设计中,数据处理和操作也可以拆分部署到多个处理器上。通过并行处理机制,提高了计算能力。
- 上一篇: 黄河水利职业技术学院举办中马跨文化交流活动
- 下一篇: 电子采购系统平台降低采购成本
猜你喜欢
- 2023-09-05 WKG综合格斗赛圆满落幕,O2arK高压氧舱全程助力!
- 2023-08-20 三千茶业启动名牌战略,引领茶行业高质量发展!
- 2023-07-25 暴雨蓝色预警!平安产险北京分公司启动大灾应急预案
- 2023-07-06 国家商务部授予江苏嘉禄嘉锋制冷设备有限公司“诚信档案企业”荣誉称号
- 2023-05-23 想吃汉堡,麦当劳or肯德基?小孩子才做选择,光大要你全都要~
- 2023-05-11 天九共享在阿布扎比获评“最具社会影响力独角兽”奖
- 2023-03-22 坚守爱与承诺 服务更有温度 平安养老险北分主动服务让理赔更顺畅
- 2023-01-05 夜空彩虹用“艺术灯光+珠宝”,营造深圳金展珠宝广场新时尚
- 2022-12-01 淘宝海量数据库OceanBase系统架构
- 2022-11-26 江山欧派重庆生产基地年产120万套木门项目正式批量投产