巨页的配置和修改_hugepages_total-程序员宅基地

技术标签: linux  内存管理  

巨页

背景知识

Linux中把页面作为管理内存的基本单位,一个页面为4KB。如果一个程序在运行过程中会用到很多的内存,那么必然会导致很多的TLB未命中和缺页异常的情况,因为一个页最大只能是4KB所以也就造成了这种问题的发生。如果直接修改默认的页面大小,那么又容易造成内存浪费,显然是不可取的。Linux引入了巨页(Huge page)的概念。允许一个页面的大小超过4KB,默认为2MB。

说到这里其实你也应该知道为什么默认为2MB了。 Linux的采取4级页表管理虚拟地址到物理地址的转换,32位系统中页表项占4个字节,64位中占8个字节。4级页表从高到低,依次为pgd,pud,pmd,pte,pte指向真正的4kb划分的物理页。倒数第二级为pmd,包含512个pte页表项,指向的2MB的物理页。采用大页内存划分时,内核页表为三级,基本的分页单位为2MB,此时pmd直接指向一个2MB的大页面,作为最后一级页表。

4级页表

3级页表

页表项有标志位_PAGE_PSE,MMU以此来区分该页表项映射的是4KB的小页内存,还是2MB的大页内存。

#define _PAGE_PSE	0x080	/* 2MB page */

在系统启动期间,你能用“大内存页”为应用程序预留一部分内存。这部分内存,即被“大内存页”占用的这些存储器永远不会被交换出内存。它会一直保留其中,除非你修改了配置。这会极大地提高像 Oracle 数据库这样的需要海量内存的应用程序的性能。

特点

大页的优点

  • 减少页表大小。每个Huge Page对应的是连续的2MB物理内存,这样12GB的物理内存只需要48KB的页表,与原来的24MB相比减少很多。
  • Huge Page内存只能锁定在物理内存中,不能被交换到交换区,避免了交换引起的性能影响。
  • 由于页表数量的减少,使得CPU中的TLB(可理解为CPU对页表的CACHE)命中率大大提高。
  • Huge Page的页表在各进程之间可以共享,也降低了Page Table的大小。

大页的缺点

  • 要预先分配
  • 不够灵活,需要重启主机生效
  • 如果分配过多,会造成浪费,不能被其他程序使用。

查看巨页信息

grep Huge /proc/meminfo

image-20210531105227453

  • HugePages_Total表示大页面池的大小
  • HugePages_Free表示池中尚未分配的大页面数
  • HugePages_Rsvd表示保留的大页面数,这些页面尚未分配
  • HugePages_Surp是“盈余”页面,如果默认配置100,现在修改为80,则会显示20

巨页配置

配置有多种方式,可以修改启动项重新启动机器,也可以修改内核参数。这里以后者为例。

修改文件

HugePages_Total 对应内核参数 vm.nr_hugepages,也可以在运行中的系统上直接修改 /proc/sys/vm/nr_hugepages,修改的结果会立即影响空闲内存 MemFree的大小,因为HugePages在内核中独立管理,只要一经定义,无论是否被使用,都不再属于free memory。如下:

image-20210531112151820

image-20210531105444397

image-20210531112205652

image-20210531105523485

image-20210531112244933

修改sysctl.conf

image-20210531112356197

大页面缺页中断处理函数调用流程

image-20210531152653279

vm_fault_t hugetlb_fault(struct mm_struct *mm, struct vm_area_struct *vma,
			unsigned long address, unsigned int flags)
{
	...
	if (huge_pte_none(entry)) {
		ret = hugetlb_no_page(mm, vma, mapping, idx, address, ptep, flags);
		goto out_mutex;
	}

	...
}
static vm_fault_t hugetlb_no_page(struct mm_struct *mm,
			struct vm_area_struct *vma,
			struct address_space *mapping, pgoff_t idx,
			unsigned long address, pte_t *ptep, unsigned int flags)
{
	...

		page = alloc_huge_page(vma, haddr, 0);
		...
}

总体的流程其实是与普通的页分配类似的。在进程访问到尚未建立虚实映射的大页面内存区域时,就会产生缺页中断,缺页中断的处理函数是do_page_fault()函数。从do_page_fault()到函数handle_mm_fault()是缺页中断处理的公共流程,不是我们关注的重点,在此不作介绍。在函数handle_mm_fault()中首先会检查产生缺页中断的内存区域是否是大页面区域,即VM_HUGETLB标志是否设置,如果是,则调用函数hugetlb_fault()进行大页面的映射,这是大页面缺页中断处理的入口函数,其处理过程大致如下:

​ hugetlb_fault()

  • 根据产生 Page Fault 的虚拟地址查找或分配相应的 PMD 表项;
  • 调用hugetlb_no_page()以分配物理内存、建立虚实映射;
  • 如果引发缺页中断的内存操作是写操作,且该大页面被设置为只读,则预先做一次 Copy on Write 操作,以避免因“违规操作”再次产生 Page Fault 而影响性能。

​ hugetlb_no_page()

  • 在产生 Page Fault 的虚存区域所映射的 hugetlb 特殊文件的页面缓存(PageCache)中查找引发中断的虚拟地址所在的文件页面,如果找到则跳转到第三部;
  • 分配大页面,这是通过函数alloc_huge_page()完成的。分配成功后,将该页面加入到该 hugetlb 文件对应的 Page Cache 中,以便可以与其它进程共享该大页面。
  • 设置相应的 PMD 表项,需要强调的是,为了区分大页面与 4KB 页面需要设置页表项的_PAGE_PSE标志位,使得 MMU 在进行虚实地址转换时能将此 PMD 表项作为最后一级映射,得到大页面的物理地址。

​ alloc_huge_page()

​ 在前面提到,系统初始化时为每个 NUMA node 都初始化了相应的空闲大页面链表——hugepage_freelists[],并分配了全部的大页面,因此,在系统运行过程中分配大页面的操作即为从该链表中获取空闲大页面的过程。至于大页面的解除映射以及释放,与分配与建立映射的过程相反,就不多说了。

总结

巨页的出现满足了很多对于大内存有需要的进程,对于不同的情况,操作系统会选择不同的处理方式,不仅仅是固定的处理方式,采取更灵活的方法也是性能优化的目的。

参考

http://blog.chinaunix.net/uid-31410005-id-5783976.html

https://blog.csdn.net/niu91/article/details/116429354

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_48101150/article/details/117824127

智能推荐

台式计算机cpu允许温度,玩游戏cpu温度多少正常(台式电脑夏季CPU一般温度多少)...-程序员宅基地

文章浏览阅读1.1w次。随着炎热夏季的到来,当玩游戏正爽的时候,电脑突然死机了,自动关机了,是不是有想给主机一脚的冲动呢?这个很大的原因是因为CPU温度过高导致的。很多新手玩家可能都有一个疑虑,cpu温度多少以下正常?有些说是60,有些说是70,到底多高CPU温度不会死机呢?首先我们先看看如何查看CPU的温度。下载鲁大师并安装,运行鲁大师软件,即可进入软件界面,并点击温度管理,即可看到电脑各个硬件的温度。鲁大师一般情况下..._台式机玩游戏温度多少正常

小白自学Python日记 Day2-打印打印打印!_puthon打印任务收获-程序员宅基地

文章浏览阅读243次。Day2-打印打印打印!我终于更新了!(哭腔)一、 最简单的打印最最简单的打印语句: print(“打印内容”)注意:python是全英的,符号记得是半角下面是我写的例子:然后进入power shell ,注意:你需要使用cd来进入你保存的例子的文件夹,保存时名字应该取为xxx.py我终于知道为什么文件夹取名都建议取英文了,因为进入的时候是真的很麻烦!如果你没有进入正确的文件夹..._puthon打印任务收获

Docker安装:Errors during downloading metadata for repository ‘appstream‘:_"cenerrors during download metadata for repository-程序员宅基地

文章浏览阅读1k次。centos8问题参考CentOS 8 EOL如何切换源? - 云服务器 ECS - 阿里云_"cenerrors during download metadata for repository \"appstream"

尚硅谷_谷粒学苑-微服务+全栈在线教育实战项目之旅_基于微服务的在线教育平台尚硅谷-程序员宅基地

文章浏览阅读2.7k次,点赞3次,收藏11次。SpringBoot+Maven+MabatisPlusmaven在新建springboot项目引入RELEASE版本出错maven在新建springboot项目引入RELEASE版本出错maven详解maven就是通过pom.xml中的配置,就能够从仓库获取到想要的jar包。仓库分为:本地仓库、第三方仓库(私服)、中央仓库springframework.boot:spring-boot-starter-parent:2.2.1.RELEASE’ not found若出现jar包下载不了只有两_基于微服务的在线教育平台尚硅谷

java 实现 数据库备份_java数据备份-程序员宅基地

文章浏览阅读1k次。数据库备份的方法第一种:使用mysqldump结合exec函数进行数据库备份操作。第二种:使用php+mysql+header函数进行数据库备份和下载操作。下面 java 实现数据库备份的方法就是第一种首先我们得知道一些mysqldump的数据库备份语句备份一个数据库格式:mysqldump -h主机名 -P端口 -u用户名 -p密码 --database 数据库名 ..._java数据备份

window10_ffmpeg调试环境搭建-编译64位_win10如何使用mingw64编译ffmpeg-程序员宅基地

文章浏览阅读3.4k次,点赞2次,收藏14次。window10_ffmpeg调试环境搭建_win10如何使用mingw64编译ffmpeg

随便推点

Linux常用命令_ls-lmore-程序员宅基地

文章浏览阅读4.8k次,点赞17次,收藏51次。Linux的命令有几百个,对程序员来说,常用的并不多,考虑各位是初学者,先学习本章节前15个命令就可以了,其它的命令以后用到的时候再学习。1、开机 物理机服务器,按下电源开关,就像windows开机一样。 在VMware中点击“开启此虚拟机”。2、登录 启动完成后,输入用户名和密码,一般情况下,不要用root用户..._ls-lmore

MySQL基础命令_mysql -u user-程序员宅基地

文章浏览阅读4.1k次。1.登录MYSQL系统命令打开DOS命令框shengfen,以管理员的身份运行命令1:mysql -u usernae -p password命令2:mysql -u username -p password -h 需要连接的mysql主机名(localhost本地主机名)或是mysql的ip地址(默认为:127.0.0.1)-P 端口号(默认:3306端口)使用其中任意一个就OK,输入命令后DOS命令框得到mysql>就说明已经进入了mysql系统2. 查看mysql当中的._mysql -u user

LVS+Keepalived使用总结_this is the redundant configuration for lvs + keep-程序员宅基地

文章浏览阅读484次。一、lvs简介和推荐阅读的资料二、lvs和keepalived的安装三、LVS VS/DR模式搭建四、LVS VS/TUN模式搭建五、LVS VS/NAT模式搭建六、keepalived多种real server健康检测实例七、lvs持久性工作原理和配置八、lvs数据监控九、lvs+keepalived故障排除一、LVS简介和推荐阅读的资料 学习LVS+Keepalived必须阅读的三个文档。1、 《Keepalived权威指南》下载见http://..._this is the redundant configuration for lvs + keepalived server itself

Android面试官,面试时总喜欢挖基础坑,整理了26道面试题牢固你基础!(3)-程序员宅基地

文章浏览阅读795次,点赞20次,收藏15次。AIDL是使用bind机制来工作。java原生参数Stringparcelablelist & map 元素 需要支持AIDL其实Android开发的知识点就那么多,面试问来问去还是那么点东西。所以面试没有其他的诀窍,只看你对这些知识点准备的充分程度。so,出去面试时先看看自己复习到了哪个阶段就好。下图是我进阶学习所积累的历年腾讯、头条、阿里、美团、字节跳动等公司2019-2021年的高频面试题,博主还把这些技术点整理成了视频和PDF(实际上比预期多花了不少精力),包含知识脉络 + 诸多细节。

机器学习-数学基础02补充_李孟_新浪博客-程序员宅基地

文章浏览阅读248次。承接:数据基础02

短沟道效应 & 窄宽度效应 short channel effects & narrow width effects-程序员宅基地

文章浏览阅读2.8w次,点赞14次,收藏88次。文章目录1. 概念:Narrow Width Effect: 窄宽度效应Short Channel effects:短沟道效应阈值电压 (Threshold voltage)2. 阈值电压与沟道长和沟道宽的关系:Narrow channel 窄沟的分析Short channel 短沟的分析1. 概念:Narrow Width Effect: 窄宽度效应在CMOS器件工艺中,器件的阈值电压Vth 随着沟道宽度的变窄而增大,即窄宽度效应;目前,由于浅沟道隔离工艺的应用,器件的阈值电压 Vth 随着沟道宽度_短沟道效应