性能基础之速读【性能之巅:洞悉系统、企业与云计算】_重新传输的数据包 netstat-程序员宅基地

技术标签: 性能测试  

引言

综合来讲,这是一本介绍方法论的书,作者通过概念、模型、观测、实验手段来进行问题的剖析。另外本书的涉及范围之广,从内存、CPU、文件系统、存储硬件、网络等各个方面。并且本书通常以一个实例入手,深入的介绍系统原理,特别是在一些重点细节上,往往有超出一般的认识和方法。
本书函盖范围太广,更适合作为工具书时常翻阅,所以在阅读过程中也关注自己当前需要的方面。

第一章 绪论

系统性能是对整个系统的研究,包括了所有的硬件组件和整个软件栈。所有数据路径上和软硬件上所发生的事情都包括在内,因为这些都有可能影响性能。

通用系统软件栈

性能的事情列表

性能领域包括了以下的事情:

  • 设置性能目标和建立性能模型

  • 基于软件或硬件原型进行性能特征归纳

  • 对开发代码进行性能分析(软件整合之前)

  • 执行软件非回归性测试(软件发布前或发布后)

  • 针对软件发布版本的基准测试

  • 目标环境中的概念验证测试

  • 生产环境部署的配置优化

  • 监控生产环境中运行的软件

  • 特定问题的性能分析

两种性能分析视觉:资源分析和负载分析

术语容量规划 ( capacity planning) 指的是一系列事前行动。在设计阶段,包括通过研究开发软件的资源占用情况,来得知原有设计在多大程度上能满足目标需求。在部署后,包括监控资源的使用情况,这样问题在出现之前就能被预测。 !

  • 资源分析指标:IOPS,吞吐量,使用率,饱和度

  • 工作负载指标:吞吐量和延时。

性能分析必须量化问题的重要程度,有一个指标非常合适,就是延时(latency)。

动态跟踪技术把所有的软件变得可以监控,而且能用在真实的生产环境中。这项技术利用内存中的 CPU 指令并在这些指令之上动态构建检测数据。这样能从任何运行的软件中都可以获得定制话的性能统计数据,从而提供了远超系统的自带统计所能给予的观测性。

DTrace 对用户态和内核态的软件都提供了静态跟踪和动态跟踪,并且数据是实时产生的

受测系统

扰动(perturbation)是会影响结果的,扰动包括定时执行的系统活动、系统的其他用户以及其他的工作负载。现代环境的另一个困难是系统很可能由若干个网络化的组件组成,都用于处理输入工作负载,包括负载平衡、Web 服务器、数据库服务器、应用程序服务器,以及存储系统。

排队系统

排队理论以及使用率响应时间关系

方法

在取得数据之前就把事情理论化是一个严重的错误。不理智的人扭曲事实来适应理论,而不是改变理论来适应事实。

面对一个性能不佳且复杂的系统环境时,首先需要知道的挑战就是从什么地方开始分析、收集什么样的数据,以及如何分析这些数据。

通用的性能分析方法

第四章 观测工具

性能观测工具可以按照系统级别和进程级别来分类,多数的工具要么基于计数器要么基于跟踪:

进程级别:

一般来说,上述这些工具是从 /proc 文件系统里读取统计信息的

跟踪

跟踪收集每一个事件的数据以供分析。跟踪框架一般默认是不启用的,因为跟踪捕获数据会有 CPU 开销,另外还需要不小的存储空间来存放数据。

系统级别:

进程级别:

第五章 应用程序

性能调整离工作所执行的地方越近越好:最好在应用程序里,包括 Web 服务器、应用服务器、负载均衡器、文件服务器,等等。

设立性能目标能为你的性能分析工作指明方向,并帮助你选择要做的事情。没有清晰的目标,性能分析容易沦为随机的『钓鱼探险』。 常见目标:

应用程序性能技术:选择 I/O 尺寸、缓存、缓冲区、轮训(epoll)、并发和并行、非阻塞 I/O、处理器绑定

编程语言相关:编译语言使用编译器优化、解释语言一般不是首选、虚拟机、垃圾回收

第六章 CPU - 第九章 磁盘

CPU分析工具

  • 街灯讹方法(奇葩的命名)

    • 在熟悉的工具或流程中试错,比较盲目

  • Ad Hoc核对清单法

    • 保证所有人知道如何检查最糟糕的问题,覆盖全面,但必须保持清单及时更新

  • 诊断循环

    • 假设--仪器检验--数据--假设

  • USE方法

    本书重点方法,对于所有资源,查看它的使用率、饱和度、错误

  • 第三章 操作系统

    了解操作系统和它的内核对于系统性能分析是至关重要的。你会经常需要进行针对系统行为的开发和测试,如系统调用是如何执行的、CPU 是如何调度线程的、有限大小的内存是如何影响性能的,或者是文件系统是如何处理 I/O 的。

    这部分的内容本书主要介绍了基本的概念,最好还是结合《深入理解计算机系统》来弄懂,不然真的很容易一知半解,列举如下:

  • 内核:内核执行、时钟、内核态

  • 栈:用户栈和内核栈

  • 中断和中断线程

  • 中断优先级

  • 进程:进程创建、进程生命周期、进程环境

  • 系统调用

  • 虚拟内存

  • 内存管理

  • 调度器

  • 文件系统:VFS、I/O 栈

  • 缓存(括号内为例子):应用程序缓存、服务器缓存(Apache 缓存)、缓存服务器(Redis)、数据库缓存(MySQL 缓冲区高速缓存)、目录缓存(DNLC)、文件元数据缓存(inode 缓存)、操作系统缓冲区高速缓存(segvn)、文件系统主缓存(ZFS ARC)、文件系统次缓存(ZFS L2ARC)、设备缓存(ZFS vdev)、块缓存(缓冲区高速缓存)、磁盘控制器缓存(RAID 卡缓存)、存储阵列缓存、磁盘内置缓存

  • 网络

  • 设备驱动

  • 多处理器:CPU 交叉调用

  • 抢占

  • 资源管理

  • 观测性

  • 计数器

    内核维护了各种统计数据,称为计数器,用于对事件计数。通常计数器实现为无符号的整型数,发生事件时递增。

    系统级别的计数器有:

  • vmstat: 虚拟内存和物理内存的统计,系统级别

  • mpstat: 每个 CPU 的使用情况

  • iostat: 每个磁盘 I/O 的使用情况,由块设备接口报告

  • netstat: 网络接口的统计,TCP/IP 栈的统计,以及每个连接的一些统计信息

  • sar: 各种各样的统计,能归档历史数据

  • ps: 进程状态,显示进程的各种统计信息,包括内存和 CPU 的使用

  • top: 按一个统计数据排序,显示排名高的进程

  • pmap: 将进程的内存段和使用统计一起列出

  • tcpdump: 网络包跟踪(libpcap lib)

  • blktrace: 块 I/O 跟踪

  • DTrace: 跟踪内核的内部活动和所有资源的使用情况,支持静态和动态的跟踪

  • SystemTap: 同上

  • perf: Linux 性能事件,跟踪静态和动态的指针

  • strace: 系统调用跟踪

  • gbd: 源码级别的调试器

  • 延时

  • 吞吐量

  • 资源使用率

内存分析工具

文件系统分析工具

磁盘分析工具

CPU调优

  • 多少CPU可用?是核吗?是硬件线程?

  • CPU 架构是单还是多处理器?

  • CPU 缓存大小是多少?共享?

  • CPU 时钟频率是多少?是动态?甚于BIOS?

  • CPU 有其它特性?

  • CPU 勘误表上有硬件上的bug?

  • BIOS 版本有bug?

  • CPU 使用软件限制?

内存调优

  • 主存有多少?

  • 配置允许应用程序使用的内存大小?

  • 使用哪个分配器?

  • 主存速度?

  • 系统架构?NUMA? UMA?

    NUMA 共享存储器物理上是分布在所有处理机的本地存储器上 UMA 均匀存储器存取

  • 内存总线大小?

  • 是否配置使用了大页面?

  • 是否支持和配置过度提交?

  • 使用了哪些内存可调参数?

  • 软件强制内存限制?

文件系统调优

  • 当前挂载并使用的文件系统数量?

  • 文件系统记录大小?

  • 启用了访问时间戳?

  • 是否有其它参数(压缩?加密?)

  • 缓存大小?二级缓存?

  • 存储设备数量?何配置?RAID?

  • 哪种文件系统?版本?

  • 启用I/O控制?

磁盘调优

  • 盘数量?类型?

  • 磁盘固件版本?

  • 多少个磁盘控制器?版本?接口类型?

  • 是否为调速插槽?

  • 配置了RAID?

  • 是否启用多路径?

  • 磁盘设备驱动?

  • 启用I/O控制?

第十章 网络

网络通信是由一组协议栈组成的,其中的每一层实现一个特定的目标:

一些网络通信和网络性能相关概念:网络和路由、协议、封装、包长度、延时(主机名解析延时、ping 延时、连接延时、首字节延时、往返时间、连接生命周期)、缓冲、连接积压队列、接口协商、使用率、本地连接。

对于日常监测来说,最常用的还是各种工具,如: 

  • netstat -s: 查找高流量的重新传输和乱序数据包

  • netstat -i: 检查接口的错误计数器

  • ifconfig: 检查『错误』『丢弃』和『超限』

  • ip(8): 检查传输和接收的字节率

  • tcpdump/snoop: 尽管需要大量的 CPU 开销,短期使用可能就足以发现谁在使用网络并且定位可以消除的不必要操作

  • dtrace/stap/perf: 用来检查包括内核状态在内的应用程序与线路间选中的数据

第十一章 云计算 - 第十二章 基准测试

这两章主要介绍相关底层概念,很多时候只是作为选择云服务提供商的依据(毕竟不能自己开发),省略。

术语

方法

  • IOPS: 每秒发生的输入/输出操作的次数,是数据传输的一个度量方法。对于磁盘的读写,IOPS 指的是每秒读和写的次数

  • 吞吐量: 评价工作执行的速率,尤其是在数据传输方面,这个术语用于描述数据传输速度。在某些情况下(如数据库),吞吐量指的是操作的速度(每秒操作数或每秒业务数)

  • 响应事件: 一次操作完成的事件。包括用于等待和服务的事件,也包括用来返回结果的时间

  • 延时: 描述操作里用来等待服务的事件。在某些情况下,它可以指的是整个操作时间,等同于响应时间

  • 使用率: 对于服务所请求的资源,使用率描述在所给定的时间区间内资源的繁忙成都。对于存储资源来说,使用率指的就是所消耗的存储容量(例如,内存使用率)

  • 饱和度: 指的是某一资源无法满足服务的排队工作量

  • 瓶颈: 在系统性能力,瓶颈指的是限制系统性能的那个资源。分辨和移除系统瓶颈是系统性能的一项重要工作

  • 工作负载: 系统的输入或者是对系统所施加的负载叫做工作负载。对于数据库来说,工作负载就是客户端发出的数据库请求和命令

  • 缓存: 用于复制或者缓冲一定量数据的高速存储区域,目的是为了避免对较慢的存储层级的直接访问,从而提高性能。

操作系统

  • 操作系统: 这里指的是安装在系统上的软件和文件,使得系统可以启动和运行程序。操作系统包括内核、管理工具,以及系统库

  • 内核: 内核是管理系统的程序,包括设备(硬件)、内存和 CPU 调度。它运行在 CPU 的特权模式,允许直接访问硬件,称为内核态

  • 进程: 是一个操作系统的抽象概念,是用来执行程序的环境。程序通常运行在用户模式,通过系统调用或陷阱来进入内核模式

  • 线程: 可被调度的运行在 CPU 上的可执行上下文。内核有多个线程,一个进程有一个或多个线程

  • 任务: 一个 Linux 的可运行实体,可以指一个进程(含有单个线程),或一个多线程的进程里的一个线程,或者内核线程

  • 内核空间: 内核的内存地址空间

  • 用户空间: 进程的内存地址空间

  • 上下文切换: 内核程序切换 CPU 让其在不同的地址空间上做操作

  • 系统调用: 一套定义明确的协议,为用户程序请求内核执行特权操作,包括设备 I/O

  • 陷阱: 信号发送到内核,请求执行一段系统程序(特权操作)。陷阱类型包括系统调用、处理器异常以及中断

  • 中断: 由物理设备发送给内核的信号,通常是请求 I/O 服务

USE 法 Linux 检查清单

软件资源

小结

本书作者是著名的性能大师,他有一篇60秒分析性能的文章,其中有一个著名的性能checklist如下:

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/zeeslo/article/details/118255029

智能推荐

攻防世界_难度8_happy_puzzle_攻防世界困难模式攻略图文-程序员宅基地

文章浏览阅读645次。这个肯定是末尾的IDAT了,因为IDAT必须要满了才会开始一下个IDAT,这个明显就是末尾的IDAT了。,对应下面的create_head()代码。,对应下面的create_tail()代码。不要考虑爆破,我已经试了一下,太多情况了。题目来源:UNCTF。_攻防世界困难模式攻略图文

达梦数据库的导出(备份)、导入_达梦数据库导入导出-程序员宅基地

文章浏览阅读2.9k次,点赞3次,收藏10次。偶尔会用到,记录、分享。1. 数据库导出1.1 切换到dmdba用户su - dmdba1.2 进入达梦数据库安装路径的bin目录,执行导库操作  导出语句:./dexp cwy_init/[email protected]:5236 file=cwy_init.dmp log=cwy_init_exp.log 注释:   cwy_init/init_123..._达梦数据库导入导出

js引入kindeditor富文本编辑器的使用_kindeditor.js-程序员宅基地

文章浏览阅读1.9k次。1. 在官网上下载KindEditor文件,可以删掉不需要要到的jsp,asp,asp.net和php文件夹。接着把文件夹放到项目文件目录下。2. 修改html文件,在页面引入js文件:<script type="text/javascript" src="./kindeditor/kindeditor-all.js"></script><script type="text/javascript" src="./kindeditor/lang/zh-CN.js"_kindeditor.js

STM32学习过程记录11——基于STM32G431CBU6硬件SPI+DMA的高效WS2812B控制方法-程序员宅基地

文章浏览阅读2.3k次,点赞6次,收藏14次。SPI的详情简介不必赘述。假设我们通过SPI发送0xAA,我们的数据线就会变为10101010,通过修改不同的内容,即可修改SPI中0和1的持续时间。比如0xF0即为前半周期为高电平,后半周期为低电平的状态。在SPI的通信模式中,CPHA配置会影响该实验,下图展示了不同采样位置的SPI时序图[1]。CPOL = 0,CPHA = 1:CLK空闲状态 = 低电平,数据在下降沿采样,并在上升沿移出CPOL = 0,CPHA = 0:CLK空闲状态 = 低电平,数据在上升沿采样,并在下降沿移出。_stm32g431cbu6

计算机网络-数据链路层_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输-程序员宅基地

文章浏览阅读1.2k次,点赞2次,收藏8次。数据链路层习题自测问题1.数据链路(即逻辑链路)与链路(即物理链路)有何区别?“电路接通了”与”数据链路接通了”的区别何在?2.数据链路层中的链路控制包括哪些功能?试讨论数据链路层做成可靠的链路层有哪些优点和缺点。3.网络适配器的作用是什么?网络适配器工作在哪一层?4.数据链路层的三个基本问题(帧定界、透明传输和差错检测)为什么都必须加以解决?5.如果在数据链路层不进行帧定界,会发生什么问题?6.PPP协议的主要特点是什么?为什么PPP不使用帧的编号?PPP适用于什么情况?为什么PPP协议不_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输

软件测试工程师移民加拿大_无证移民,未受过软件工程师的教育(第1部分)-程序员宅基地

文章浏览阅读587次。软件测试工程师移民加拿大 无证移民,未受过软件工程师的教育(第1部分) (Undocumented Immigrant With No Education to Software Engineer(Part 1))Before I start, I want you to please bear with me on the way I write, I have very little gen...

随便推点

Thinkpad X250 secure boot failed 启动失败问题解决_安装完系统提示secureboot failure-程序员宅基地

文章浏览阅读304次。Thinkpad X250笔记本电脑,装的是FreeBSD,进入BIOS修改虚拟化配置(其后可能是误设置了安全开机),保存退出后系统无法启动,显示:secure boot failed ,把自己惊出一身冷汗,因为这台笔记本刚好还没开始做备份.....根据错误提示,到bios里面去找相关配置,在Security里面找到了Secure Boot选项,发现果然被设置为Enabled,将其修改为Disabled ,再开机,终于正常启动了。_安装完系统提示secureboot failure

C++如何做字符串分割(5种方法)_c++ 字符串分割-程序员宅基地

文章浏览阅读10w+次,点赞93次,收藏352次。1、用strtok函数进行字符串分割原型: char *strtok(char *str, const char *delim);功能:分解字符串为一组字符串。参数说明:str为要分解的字符串,delim为分隔符字符串。返回值:从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。其它:strtok函数线程不安全,可以使用strtok_r替代。示例://借助strtok实现split#include <string.h>#include <stdio.h&_c++ 字符串分割

2013第四届蓝桥杯 C/C++本科A组 真题答案解析_2013年第四届c a组蓝桥杯省赛真题解答-程序员宅基地

文章浏览阅读2.3k次。1 .高斯日记 大数学家高斯有个好习惯:无论如何都要记日记。他的日记有个与众不同的地方,他从不注明年月日,而是用一个整数代替,比如:4210后来人们知道,那个整数就是日期,它表示那一天是高斯出生后的第几天。这或许也是个好习惯,它时时刻刻提醒着主人:日子又过去一天,还有多少时光可以用于浪费呢?高斯出生于:1777年4月30日。在高斯发现的一个重要定理的日记_2013年第四届c a组蓝桥杯省赛真题解答

基于供需算法优化的核极限学习机(KELM)分类算法-程序员宅基地

文章浏览阅读851次,点赞17次,收藏22次。摘要:本文利用供需算法对核极限学习机(KELM)进行优化,并用于分类。

metasploitable2渗透测试_metasploitable2怎么进入-程序员宅基地

文章浏览阅读1.1k次。一、系统弱密码登录1、在kali上执行命令行telnet 192.168.26.1292、Login和password都输入msfadmin3、登录成功,进入系统4、测试如下:二、MySQL弱密码登录:1、在kali上执行mysql –h 192.168.26.129 –u root2、登录成功,进入MySQL系统3、测试效果:三、PostgreSQL弱密码登录1、在Kali上执行psql -h 192.168.26.129 –U post..._metasploitable2怎么进入

Python学习之路:从入门到精通的指南_python人工智能开发从入门到精通pdf-程序员宅基地

文章浏览阅读257次。本文将为初学者提供Python学习的详细指南,从Python的历史、基础语法和数据类型到面向对象编程、模块和库的使用。通过本文,您将能够掌握Python编程的核心概念,为今后的编程学习和实践打下坚实基础。_python人工智能开发从入门到精通pdf