专业的十大品牌排行榜、行业好品牌资讯网站
客服电话:400-8070889
广告位火热招商中

网站首页 > 品牌新闻 正文

HANA入门-列存储的优势介绍

haopp 2022-11-11 品牌新闻 107 ℃

 

HANA全称为高性能分析设备。虽然HANA已经发布了五年左右,但是IT界对HANA的了解却很少,甚至很多人都没有听说过。想必大家熟知的数据库如MySQLOracleHANA以及这两个数据库都是数据关系型数据库。

因为大家对mysql肯定比较熟悉,所以我就以mysql为例,以mysql为代表来讲解HANA

大家一定知道现在的数据库有两种,关系型数据库和非关系型数据库。常见的关系数据库有MysqlOracle等。和非关系数据库,如HBaseRedis。其中,HBase与传统关系型数据库的区别不仅在于是否是关系型数据库,还在于与MySQL等关系型数据库的区别,即HBase是列存储,而MySQL是行存储。

所以现在大家都有一个疑问,为什么要用列存储?相比线存储有什么优势?现在让我们看看行存储和列存储之间区别。如图所示,行存储和列存储实际上都存储在内存地址中。

从图中可以看出,行存储是按行为单元存储在数据库中的,而列存储是按列单元存储的。当我们向数据库中逐行插入数据时,行存储明显有优势,当我们从数据库中逐行读取数据时,行存储也有优势。如果我们不想取出一整行,如果我们选择一列,那么基于列的存储是主要的,当我们进行聚合时,它也是基于列的。在当今的大型企业中,据统计数据库中有近35%的列是无用的,所以我们在分析数据时,行存储的效率低于列存储的效率。

为什么列存储在数据分析中效率更高?原因之一是查询时无法查询不必要的列,减少了数据传输;第二个原因是,既然是数据分析,就要进行聚合运算,比如maxmin等,而聚合操作是对列执行的。列存储是按列存储的,所以在数据分析中比行存储效率高。

近年来,随着IT行业硬件的发展,技术路线发生了明显的变化。以前硬件厂商致力于提供更高时速的处理器,也就是提高单个CPU的计算能力。但近年来,硬件服务器的处理器时速提升并不明显。SAP HANA的整体架构支持基于处理器平台的多个服务器和处理器的高效并行处理。在应用层的架构设计中,数据处理和操作也可以拆分部署到多个处理器上。通过并行处理机制,提高了计算能力。

热门文章
    程序调用,不用修改
最近发表