MySQL InnoDB索引介绍_mysql innodb 主键索引-程序员宅基地

技术标签: MySQL  mysql  

MySQL InnoDB索引介绍

什么是索引

索引简单来说就是一个目录,能够标记该内容的在书中的位置,启动快速查询内容的目的。而MySQL的索引是一种单独的数据结构,由数据表中的一列或多列组合而成,可以用来快速查询数据表中有某一特定值的记录。

InnoDB索引的特点

聚簇索引

聚簇索引(Clustered Index)是InnoDB特殊的索引,直接存储了行数据。通常情况下聚簇索引与主键索引具有相同的含义。由于,通过聚簇索引可以直接访问包含行数据的数据页,能够减少磁盘的I/O次数。
InnoDB选取聚簇索引的规则:
1. 如果定义了主键索引,则InnoDB会将该主键索引作为聚簇索引;
2. 如果没有定义主键索引,InnoDB则会选择第一个所有列都不能为NULL的唯一索引作为主键索引。
3. 如果即没有主键索引,也没有合适的唯一索引,InnoDB会在包含row ID的列上增加一个名为GEN_CLUST_INDEX的隐藏聚簇索引。其中行 ID 是一个 6 字节字段,随着新行的插入而单调增加,因此,表数据是按行ID排序就是按插入顺序排列的。

辅助索引

在InnoDB中,其他非聚簇索引都称为辅助索引(Secondary Index)。每个表最多包含64个辅助索引。每一个辅助索引记录都是由索引所包含的列数据和主键索引包含的列数据组成,其中主键索引包含的列数据用于查找聚簇索引上的行数据。可以看出主键索引的列被冗余存储,所以其值的长度越小,可以节省辅助索引的存储空间。 

B+树

InnDB使用B+树索引。B+树能够支持 =, >, >=, <, <=, BETWEEN 和非%开头的like操作。

MySQL如何使用索引

  1. MySQL通过索引与where条件快速匹配查找数据;
  2. 当有多个索引时,MySQL通常选择返回行数最少的索引;
  3. 一个索引包含多个列时,MySQL只能使用索引的最左前缀来查找数据,例如:索引包含三列(col1, col2, col3),则只有该三种情况(col1), (col1, col2)和 (col1, col2, col3)可以使用索引。
  4. 在联合查询中,MySQL对于类型和字段大小相同的列能够更有效的使用索引。如果 VARCHAR 和 CHAR 声明为相同的大小,则将它们视为相同。例如:对于VARCHAR(10) 和 CHAR(10) 的大小相同,但 VARCHAR(10) 和 CHAR(15) 的大小不同。
  5. 在联合查询中,对于非二进制字符串的列,必须使用相同的字符集才能使用索引,如UTF-8与latin1不能使用索引。
  6. 如果查询的值(select中的列值)都包含在整个索引中,此时MySQL直接使用索引中的值,而不会再次获取查询行数据(叫做覆盖索引Covering Index)。
  7. 有时 MySQL 不使用索引,即使有可用的索引。因为在一些情况下,优化器评估使用索引将需要 MySQL 访问表中很大比例的行,此时表扫描可能会更快,因为它需要更少的查找。但是,如果查询结果只需要某些列的值,MySQL 无论如何都会使用索引,因为它可以直接使用索引值返回。

查询优化

主键优化

主键由一个或者多个非NULL列组成,并代表了最主要的查询,而且创建时默认会关联创建一个唯一索引。由于非NULL特性和索引能够提供更好的查询效率。如果一个表没有一个或者一组列可作为主键,可以额外创建一个具有自动增量值的单独列作为主键,该自增唯一ID也可以作为连接查询时的外键使用,提高查询效率。 

外键优化

一个大表如果有许多列,且会查询许多不同列的组合,则可以将不常用的数据拆分到每个包含少量字段的单独小表中。每个小表可通过复制主表的主键ID与主表进行关联。这样,每个小表都可以通过主键来快速查找其数据,并可以使用联接操作仅查询所需的列集。为了最大限度地提高性能,MySQL会尝试从磁盘读取尽可能少的数据块。而对于小表来说,每个数据块中可以容纳更多行,这样MySQL一次性读取的数据就更多,只需更少的IO操作和占用更少的内存。

索引前缀

对于字符类型的列,可以通过colname(N) 来制定前N个字符作为索引。而BLOB和TEXT类型的列,则必须为索引指定前缀的长度。InnoDB支持最大前缀长度为767字节(innodblarge_prefix打开时最大支持3072字节)。
如果查询条件的长度大于索引前缀长度,MySQL会先通过索引来排出不满足条件的行,然后再对剩余的行进行匹配。 

多列索引

多列索引即由多个列组成的索引(只包含一个列的索引,称为单列索引),也可以称为组合索引。MySQL中一个多列索引最多包含16列。查询条件必须满足最左前缀才能使用索引,特别是or关联的查询条件,不用用于左前缀匹配。

索引的使用成本

  • 索引需要占用额外的存储空间;
  • 在插入、删除、更新数据时,都需要更新索引;
  • Mysql在查询过程中,需要花时间来判断使用哪个索引,索引增多就增加了选择索引的时间成本。

由于使用索引存在成本,索引不是建立的索引越多越好,要在查询效率和索引使用成本之间取得平衡。

更多内容参见
懒蚂蚁 · 技术漫谈

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/happyLazyAnt/article/details/132081787

智能推荐

Linux下使用crontab定时任务进行Tomcat日志分割_crontab多个任务如何分割-程序员宅基地

文章浏览阅读722次。Linux下使用crontab定时任务进行Tomcat日志分割_crontab多个任务如何分割

AGV小车导航控制 研一《智能控制》课程文献阅读作业_四轮agv传递函数-程序员宅基地

文章浏览阅读1w次,点赞4次,收藏55次。摘要AGV(即自动导向小车)是一种集控制、定位、各种传感器技术于一体的设备。随着智能车技术的不断发展,智能车的应用范围和功能都将大为拓展,现已逐渐用于工业与民用领域。但是由于负载变化、使用环境条件恶劣等原因,在实际运用时AGV小车在定位及控制上依然有许多难点需要攻克。本文即针对上述难点,研究并设计了一种新型的驱动方式和控制系统,利用模糊控制与PID控制相结合的方法,在开机初期误差矫正快,后期平稳,可以迅速跟踪期望轨迹。在实验状态下,运行速度为1米每秒时,0.5米的误差约5秒即可消除,达到稳定状态。引言_四轮agv传递函数

Android XML文件使用-程序员宅基地

文章浏览阅读230次。转自:http://www.cnblogs.com/zhengtao/articles/1924940.html一、布局文件:在layout目录下,使用比较广泛;  我们可以为应用定义两套或多套布局,例如:可以新建目录layout_land(代表手机横屏布局),layout_port(代表手机竖屏布局),系统会根据不同情况自动找到最合适的布局文件,但是在同一界面的两套不同布局文

std::thread和std::this_thread的详细说明-程序员宅基地

文章浏览阅读2.5k次,点赞3次,收藏13次。std::thread类来表示执行的各个线程。执行线程是实际上是执行一系列指令,可以在多线程环境中与其他此类序列同时执行,同时共享相同的地址空间。std::this_thread命名空间包含了对当前线程的一些基本操作,如获取当前线程id、休眠当前线程、让渡当前线程的时间片给其他线程等。_std::this_thread

jQuery 父元素选择器 parent() 和 parents()_jquery父元素选择器-程序员宅基地

文章浏览阅读7.7k次。jQuery的父元素选择器小编很少使用,但却看到不少web开发者们经常使用。小编个人是不太推荐使用父元素选择器的。因为如果是列表的情况下,在循环时可以将当前的索引绑定给需要点击的按钮,通过索引查找元素。本篇文章在小编不推荐的情况下,还是决定写一篇。先来一段 HTML结构代码<table class="table table-bordered" id="user..._jquery父元素选择器

杰理之MCLK 主时钟【篇】_mclk wclk 区别-程序员宅基地

文章浏览阅读84次。也称IIS系统时 钟,一般是采样频率的256倍、512倍,384倍。假设采样率是48K,MCLK输出的时钟是采样的256倍,则MCLK会输出 48K*256 = 12.288MHz。_mclk wclk 区别

随便推点

正则化的作用以及L1和L2正则化的区别_l1l2正则化原理和区别-程序员宅基地

文章浏览阅读3.5w次,点赞103次,收藏505次。0 正则化的作用正则化的主要作用是防止过拟合,对模型添加正则化项可以限制模型的复杂度,使得模型在复杂度和性能达到平衡。常用的正则化方法有L1正则化和L2正则化。L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓『惩罚』是指对损失函数中的某些参数做一些限制。 L1正则化的模型建叫做Lasso回归,使用L2正则化的模型叫做Ridge回归(岭回归。但是使用正则化来防止过拟合的原理是什么?L1和L..._l1l2正则化原理和区别

【Win10】打开控制面板提示:操作系统当前的配置不能运行此应用程序-程序员宅基地

文章浏览阅读1.2w次,点赞2次,收藏19次。win10系统,打开控制面板,提示 操作系统当前的配置不能运行此应用程序_操作系统当前的配置不能运行此应用程序

神经网络压缩 剪枝 量化 嵌入式计算优化NCNN mobilenet squeezenet shufflenet_基于数据压缩的mec网络中系统能效的优化方法-程序员宅基地

文章浏览阅读1.1w次,点赞5次,收藏58次。性能提升方法本文github链接1. 小模型 mobilenet , 更精细模型的设计,紧致网络设计 mobilenet squeezenet shufflenet 123MobileNet逐通道卷积 + 普通点卷积 SqueezeNet 1∗1 和3∗3 卷积较少通道数量 ShuffleNet..._基于数据压缩的mec网络中系统能效的优化方法

高并发场景以及应对技巧-程序员宅基地

文章浏览阅读2.7k次。业务系统高并发(High Concurrency)限流: 鉴于只有少部分用户能够秒杀成功,所以要限制大部分流量,只允许少部分流量进入服务后端。分流:负载就是问题,高并发问题。均衡就是解决手段。削峰:对于秒杀系统瞬时会有大量用户涌入,所以在抢购一开始会有很高的瞬间峰值。高峰值流量是压垮系统很重要的原因,所以如何把瞬间的高流量变成一段时间平稳的流量也是设计秒杀系统很重要的思路。实现削峰的常用的方法有利用缓存和消息中间件等技术。异步处理:秒杀系统是一个高并发系统,采用异步处理模式可以极大地提高系统并_高并发场景

登录界面转换实现html,一个登录界面的PS设计和HTML/CSS实现-程序员宅基地

文章浏览阅读341次。这样的登录界面可用在网站、桌面软件、Web软件等上面,你可以根据自己的需求改变界面配色。好的,先看看界面最终设计的效果:1、创建登录界面的背景在Photoshop中,选择“圆角矩形工具”,设置半径为10px。将前景色设置为#aeaeae。然后绘制如下的矩形框。尺寸大小取决于你自己。下面为这个登录背景框添加图层样式:透明度为 40%添加阴影:渐变叠加:从黑到白,具体参数如下:这时背景框的效果如下:2..._登录框效果图如何做成html

EM算法 - 2 - EM算法在高斯混合模型学习中的应用_em算法在高斯混合模型中的应用-程序员宅基地

文章浏览阅读8k次,点赞5次,收藏15次。声明: 1,本篇为个人对《2012.李航.统计学习方法.pdf》的学习总结,不得用作商用,欢迎转载,但请注明出处(即:本帖地址)。 2,由于本人在学习初始时有很多数学知识都已忘记,所以为了弄懂其中的内容查阅了很多资料,所以里面应该会有引用其他帖子的小部分内容,如果原作者看到可以私信我,我会将您的帖子的地址付到下面。 3,如果有内容错误或不_em算法在高斯混合模型中的应用

推荐文章

热门文章

相关标签