数据库的索引_稠密索引和稀疏索引的区别-程序员宅基地

(一)顺序索引

1. 聚集索引(主索引)和非聚集索引(辅助索引)

(1)聚集索引:包含记录的文件按照某个搜索码的顺序排序。

(2)非聚集索引:搜索码制定的顺序与文件中记录的物理顺序不同(搜索码不是候选码)。

 

2. 稠密索引和稀疏索引

(1)稠密索引:文件中的每个搜索码值都有一个索引项。在稠密聚集索引中,索引项包括搜索码值以及指向具有该搜索码值的第一条数据记录的指针;在稠密非聚集索引中,索引必须存储指向所有具有相同搜索码值的指针列表。

(2)稀疏索引:只为搜索码的某些值建立索引项。只有索引是聚集索引时才能使用稀疏索引。

 

3. 多级索引:在原始的内层索引上构造一个稀疏的外层索引。

 

4. 静态索引的更新

 

(二)散列索引

1. 静态散列:将散列函数作用于搜索码以确定对应的桶,然后将此搜索码以及相应指针存入到此桶(或溢出桶)中。

 

2. 动态散列(可扩充散列)

(1)可扩充散列是在把记录插入文件时按需建桶的,可以通过桶的分裂或合并来适应数据库大小的变化。开始时,我们不使用散列值的全部b位,任意时刻我们使用的位数i满足0\leq i\leq b。这样的i个位用作附加的桶地址表中的偏移量。i的值随着数据库大小的变化而增大或减小。此外,我们给每一个桶附加一个整数值i_j,用来表示第j个桶的散列前缀长度。

 

(2)动态索引的查询和更新

(a)查询:系统先取得h(K_l)的前i个高位,然后为这个位串查找对应的表项,再根据表项中的指针得到桶的位置。

(b)插入:如果该桶有剩余空间,系统将该记录直接插入该桶;否则,如果桶j已满,系统必须分裂这个桶,并将该i=i_j桶中已有的记录和新纪录一起进行重新分配。

首先,如果i=i_j,那么在桶地址表只有一个表项指向该桶,所以系统需要增加桶地址表的大小(i=i+1);如果i> i_j,那么在桶地址表有多个表项指向该桶,系统则不需要扩大桶地址表,就能直接分裂。

分裂时加入新桶k,并且令i_k=i_j=i_j+1,根据散列值的前i_j(即i_k)位重新分配已有记录。

系统现在再次尝试插入该新纪录,通常这一尝试会成功。但是,如果桶j中原有的所有记录和新纪录都具有相同的散列值前缀,该桶就必须再次分裂。如果桶j中所有记录具有相同的搜索码,那么多少次分裂也不能解决问题。在这种情况下,就需要采用溢出桶来存储记录。

(c)删除:相当于插入的逆过程,系统不仅要把搜索码从桶中删除,还要把记录从桶中删除。如果这时桶成为空的,那么桶也需要删除。与桶的合并不同,若桶地址表很大,则改变该表的大小是一个开销很大的操作。因此只有桶数目减少很多时,减小桶地址表的大小才是必要的。

 

(三)对比总结

(1)利用稠密索引通常可以比稀疏索引更快地定位一条记录。但是,稀疏索引也有比稠密索引优越的地方:它所占空间较小,并且插人和删除时所需的维护开销也较小。

(2) 按聚集索引顺序对文件进行顺序扫描是非常有效的,因为文件中记录的物理存储顺序和索引顺序一致。但是,我们不能(除了极少数特殊情况外)使存储文件的物理顺序既和聚集索引的搜索码顺序相同,又和辅助索引的搜索码顺序相同。由于辅助码的顺序和物理码的顺序不同,因此如果我们想要按辅助码的顺序对文件进行顺序扫描,那么每读一条记录都很可能需要从磁盘读入一个新的块,这是很慢的。辅助索引能够提高使用聚集索引搜索码以外的码的查询性能。但是,辅助索引显著增加了数据库更新的开销。

(3)顺序文件组织的一个缺点是我们必须访问索引结构来定位数据,或者必须使用二分法搜索,这将导致过多的I/O操作。基于散列(hashing)技术的文件组织使我们能够避免访问索引结构。散列函数的设计需要认真仔细。一个糟糕的散列函数可能导致查找所花费的时间与文件中搜索码数目成正比;一个设计良好的散列函数一般情况下查找所花费时间是一个(较小的)常数,而与文件中搜索码的个数无关。

(4)可扩充散列最主要的优点是其性能不随文件的增长而降低。此外,其空间开销是最小的。尽管桶地址表带来了额外的开销,但该表为当前前缀长度的每个散列值存放一个指针,因此该表较小。可扩充散列与其他散列形式相比,主要的空间节省是不必为将来的增长保留桶;桶的分配是动态的。可扩充散列的一个缺点在于查找涉及一个附加的间接层,因为系统在访问桶本身之前必须先访问桶地址表。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/gosick_geass_gate/article/details/85876668

智能推荐

oracle 12c 集群安装后的检查_12c查看crs状态-程序员宅基地

文章浏览阅读1.6k次。安装配置gi、安装数据库软件、dbca建库见下:http://blog.csdn.net/kadwf123/article/details/784299611、检查集群节点及状态:[root@rac2 ~]# olsnodes -srac1 Activerac2 Activerac3 Activerac4 Active[root@rac2 ~]_12c查看crs状态

解决jupyter notebook无法找到虚拟环境的问题_jupyter没有pytorch环境-程序员宅基地

文章浏览阅读1.3w次,点赞45次,收藏99次。我个人用的是anaconda3的一个python集成环境,自带jupyter notebook,但在我打开jupyter notebook界面后,却找不到对应的虚拟环境,原来是jupyter notebook只是通用于下载anaconda时自带的环境,其他环境要想使用必须手动下载一些库:1.首先进入到自己创建的虚拟环境(pytorch是虚拟环境的名字)activate pytorch2.在该环境下下载这个库conda install ipykernelconda install nb__jupyter没有pytorch环境

国内安装scoop的保姆教程_scoop-cn-程序员宅基地

文章浏览阅读5.2k次,点赞19次,收藏28次。选择scoop纯属意外,也是无奈,因为电脑用户被锁了管理员权限,所有exe安装程序都无法安装,只可以用绿色软件,最后被我发现scoop,省去了到处下载XXX绿色版的烦恼,当然scoop里需要管理员权限的软件也跟我无缘了(譬如everything)。推荐添加dorado这个bucket镜像,里面很多中文软件,但是部分国外的软件下载地址在github,可能无法下载。以上两个是官方bucket的国内镜像,所有软件建议优先从这里下载。上面可以看到很多bucket以及软件数。如果官网登陆不了可以试一下以下方式。_scoop-cn

Element ui colorpicker在Vue中的使用_vue el-color-picker-程序员宅基地

文章浏览阅读4.5k次,点赞2次,收藏3次。首先要有一个color-picker组件 <el-color-picker v-model="headcolor"></el-color-picker>在data里面data() { return {headcolor: ’ #278add ’ //这里可以选择一个默认的颜色} }然后在你想要改变颜色的地方用v-bind绑定就好了,例如:这里的:sty..._vue el-color-picker

迅为iTOP-4412精英版之烧写内核移植后的镜像_exynos 4412 刷机-程序员宅基地

文章浏览阅读640次。基于芯片日益增长的问题,所以内核开发者们引入了新的方法,就是在内核中只保留函数,而数据则不包含,由用户(应用程序员)自己把数据按照规定的格式编写,并放在约定的地方,为了不占用过多的内存,还要求数据以根精简的方式编写。boot启动时,传参给内核,告诉内核设备树文件和kernel的位置,内核启动时根据地址去找到设备树文件,再利用专用的编译器去反编译dtb文件,将dtb还原成数据结构,以供驱动的函数去调用。firmware是三星的一个固件的设备信息,因为找不到固件,所以内核启动不成功。_exynos 4412 刷机

Linux系统配置jdk_linux配置jdk-程序员宅基地

文章浏览阅读2w次,点赞24次,收藏42次。Linux系统配置jdkLinux学习教程,Linux入门教程(超详细)_linux配置jdk

随便推点

matlab(4):特殊符号的输入_matlab微米怎么输入-程序员宅基地

文章浏览阅读3.3k次,点赞5次,收藏19次。xlabel('\delta');ylabel('AUC');具体符号的对照表参照下图:_matlab微米怎么输入

C语言程序设计-文件(打开与关闭、顺序、二进制读写)-程序员宅基地

文章浏览阅读119次。顺序读写指的是按照文件中数据的顺序进行读取或写入。对于文本文件,可以使用fgets、fputs、fscanf、fprintf等函数进行顺序读写。在C语言中,对文件的操作通常涉及文件的打开、读写以及关闭。文件的打开使用fopen函数,而关闭则使用fclose函数。在C语言中,可以使用fread和fwrite函数进行二进制读写。‍ Biaoge 于2024-03-09 23:51发布 阅读量:7 ️文章类型:【 C语言程序设计 】在C语言中,用于打开文件的函数是____,用于关闭文件的函数是____。

Touchdesigner自学笔记之三_touchdesigner怎么让一个模型跟着鼠标移动-程序员宅基地

文章浏览阅读3.4k次,点赞2次,收藏13次。跟随鼠标移动的粒子以grid(SOP)为partical(SOP)的资源模板,调整后连接【Geo组合+point spirit(MAT)】,在连接【feedback组合】适当调整。影响粒子动态的节点【metaball(SOP)+force(SOP)】添加mouse in(CHOP)鼠标位置到metaball的坐标,实现鼠标影响。..._touchdesigner怎么让一个模型跟着鼠标移动

【附源码】基于java的校园停车场管理系统的设计与实现61m0e9计算机毕设SSM_基于java技术的停车场管理系统实现与设计-程序员宅基地

文章浏览阅读178次。项目运行环境配置:Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX(Webstorm也行)+ Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。项目技术:Springboot + mybatis + Maven +mysql5.7或8.0+html+css+js等等组成,B/S模式 + Maven管理等等。环境需要1.运行环境:最好是java jdk 1.8,我们在这个平台上运行的。其他版本理论上也可以。_基于java技术的停车场管理系统实现与设计

Android系统播放器MediaPlayer源码分析_android多媒体播放源码分析 时序图-程序员宅基地

文章浏览阅读3.5k次。前言对于MediaPlayer播放器的源码分析内容相对来说比较多,会从Java-&amp;amp;gt;Jni-&amp;amp;gt;C/C++慢慢分析,后面会慢慢更新。另外,博客只作为自己学习记录的一种方式,对于其他的不过多的评论。MediaPlayerDemopublic class MainActivity extends AppCompatActivity implements SurfaceHolder.Cal..._android多媒体播放源码分析 时序图

java 数据结构与算法 ——快速排序法-程序员宅基地

文章浏览阅读2.4k次,点赞41次,收藏13次。java 数据结构与算法 ——快速排序法_快速排序法