技术标签: java
随着业务规模的不断的增大, 系统的复杂度也越来越高, 我们的软件架构也进入到了分布式的阶段, 服务按照不同的维度进入到了分布式的阶段, 服务按照不同的维度进行拆分, 每一次的请求可能跨越多个微服务, 这样就导致我们每一次请求都有可能出现异常. 传统的日志监控方式无法满足调用链路追踪, 这就导致定位/诊断服务异常变得异常复杂.
1)功能性需求:
① 请求链路追踪,快速定位故障,缩短故障的排除时间 以及 判断故障影响范围 ② 可视化链路各阶段的耗时,进行性能分析,排除业务瓶颈 ③ 梳理服务依赖关系以及优化依赖的合理性 ④ 系统指标监控,吞吐量(TPS)、响应时间及错误记录等。 (2)非功能性需求:
探针的性能消耗:服务调用埋点本身会带来性能损耗,这就需要组件对业务系统的性能影响小 代码的侵入性:对业务系统尽可能少入侵或者无入侵其他,对于使用方透明,减少开发人员的负担。
skywalking 是一个优秀的国产开源APM组件,是一个对 Java 分布式应用程序集群的业务运行情况进行追踪、告警和分析的系统。2015年由个人吴晟开源 , 2017年加入Apache孵化器。短短两年就被Apache收入麾下,实力可见一斑。
skywalking 支持 SpringBoot、SpringCloud、dubbo 集成,代码无侵入,通信方式采用 GRPC,性能较好,实现方式是 Java 探针,支持告警,支持JVM监控,支持全局调用统计等等,功能较完善。
在官方下载两个压缩包
下载完之后在本机上面运行, 将两个压缩包压缩到一个没有中文路径的文件中
接下来进入到skywaliking-apm的包下, 进入wenapp下
更改application.yml文件中的路径, 8080可以进行更改,也可以不更改, 下面的12800因为是在本机运行,所以我们的地址就不用动( 虚拟机的话改为自己虚拟机的地址 )
进入到bin的文件中, 双击startup.bat启动, 就OK了( 服务器的话启动startup.sh就OK了 )
解压命令: tar -zxvf 名字
镜像的启动和安装
安装skywalking-oap-server:
docker run \
--name skywalking-oap \
--restart always \
-p 11800:11800 \
-p 12800:12800 -d \
--privileged=true \
-e TZ=Asia/Shanghai \
-e SW_STORAGE=elasticsearch7 \
-e SW_STORAGE_ES_CLUSTER_NODES=182.42.92.23:9200 \
-v /etc/localtime:/etc/localtime:ro \
apache/skywalking-oap-server:8.6.0-es7
安装skywalking-ui
docker run \
--name skywalking-ui \
--restart always \
-p 8081:8080 -d \
--privileged=true \
--link skywalking-oap:skywalking-oap \
-e TZ=Asia/Shanghai \
-e SW_OAP_ADDRESS=182.42.92.23:12800 \
-v /etc/localtime:/etc/localtime:ro \
apache/skywalking-ui:8.6.0
只需要在idea的springboot配置中增加
# 指定服务的状针的路径
-javaagent:E:\apache\skywalking-agent\skywalking-agent.jar
# 指定服务的名称
-DSW_AGENT_NAME=skywalking-bawei-system
# 指定它的端口( 服务器就用服务器的端口 )
-DSW_AGENT_COLLECTOR_BACKEND_SERVICES=101.43.11.8:11800
在主项目中加入记录日志的一个依赖
<!-- 项目日志的记录-->
<dependency>
<groupId>org.apache.skywalking</groupId>
<artifactId>apm-toolkit-logback-1.x</artifactId>
<version>8.10.0</version>
</dependency>
<dependency>
<groupId>org.apache.skywalking</groupId>
<artifactId>apm-toolkit-trace</artifactId>
<version>8.10.0</version>
</dependency>
在每一个springcloud微服务中添加一个logback.xml的一个日志的文件
然后再日志里面加上以下代码
<!-- 引用 Spring Boot 的 logback 基础配置 -->
<include resource="org/springframework/boot/logging/logback/defaults.xml" />
<!-- 变量 yudao.info.base-package,基础业务包 -->
<springProperty scope="context" name="kirin.info.base-package" source="kirin.info.base-package"/>
<!-- 格式化输出:%d 表示日期,%X{tid} SkWalking 链路追踪编号,%thread 表示线程名,%-5level:级别从左显示 5 个字符宽度,%msg:日志消息,%n是换行符 -->
<property name="PATTERN_DEFAULT" value="%d{${LOG_DATEFORMAT_PATTERN:-yyyy-MM-dd HH:mm:ss.SSS}} | %highlight(${LOG_LEVEL_PATTERN:-%5p} ${PID:- }) | %boldYellow(%thread [%tid]) %boldGreen(%-40.40logger{39}) | %m%n${LOG_EXCEPTION_CONVERSION_WORD:-%wEx}"/>
<!-- 控制台 Appender -->
<appender name="STDOUT" class="ch.qos.logback.core.ConsoleAppender">
<encoder class="ch.qos.logback.core.encoder.LayoutWrappingEncoder">
<layout class="org.apache.skywalking.apm.toolkit.log.logback.v1.x.TraceIdPatternLogbackLayout">
<pattern>${PATTERN_DEFAULT}</pattern>
</layout>
</encoder>
</appender>
<!-- 文件 Appender -->
<!-- 参考 Spring Boot 的 file-appender.xml 编写 -->
<appender name="FILE" class="ch.qos.logback.core.rolling.RollingFileAppender">
<encoder class="ch.qos.logback.core.encoder.LayoutWrappingEncoder">
<layout class="org.apache.skywalking.apm.toolkit.log.logback.v1.x.TraceIdPatternLogbackLayout">
<pattern>${PATTERN_DEFAULT}</pattern>
</layout>
</encoder>
<!-- 日志文件名 -->
<file>${LOG_FILE}</file>
<rollingPolicy class="ch.qos.logback.core.rolling.SizeAndTimeBasedRollingPolicy">
<!-- 滚动后的日志文件名 -->
<fileNamePattern>${LOGBACK_ROLLINGPOLICY_FILE_NAME_PATTERN:-${LOG_FILE}.%d{yyyy-MM-dd}.%i.gz}</fileNamePattern>
<!-- 启动服务时,是否清理历史日志,一般不建议清理 -->
<cleanHistoryOnStart>${LOGBACK_ROLLINGPOLICY_CLEAN_HISTORY_ON_START:-false}</cleanHistoryOnStart>
<!-- 日志文件,到达多少容量,进行滚动 -->
<maxFileSize>${LOGBACK_ROLLINGPOLICY_MAX_FILE_SIZE:-10MB}</maxFileSize>
<!-- 日志文件的总大小,0 表示不限制 -->
<totalSizeCap>${LOGBACK_ROLLINGPOLICY_TOTAL_SIZE_CAP:-0}</totalSizeCap>
<!-- 日志文件的保留天数 -->
<maxHistory>${LOGBACK_ROLLINGPOLICY_MAX_HISTORY:-30}</maxHistory>
</rollingPolicy>
</appender>
<!-- 异步写入日志,提升性能 -->
<appender name="ASYNC" class="ch.qos.logback.classic.AsyncAppender">
<!-- 不丢失日志。默认的,如果队列的 80% 已满,则会丢弃 TRACT、DEBUG、INFO 级别的日志 -->
<discardingThreshold>0</discardingThreshold>
<!-- 更改默认的队列的深度,该值会影响性能。默认值为 256 -->
<queueSize>256</queueSize>
<appender-ref ref="FILE"/>
</appender>
<!-- SkyWalking GRPC 日志收集,实现日志中心。注意:SkyWalking 8.4.0 版本开始支持 -->
<appender name="GRPC" class="org.apache.skywalking.apm.toolkit.log.logback.v1.x.log.GRPCLogClientAppender">
<encoder class="ch.qos.logback.core.encoder.LayoutWrappingEncoder">
<layout class="org.apache.skywalking.apm.toolkit.log.logback.v1.x.TraceIdPatternLogbackLayout">
<pattern>${PATTERN_DEFAULT}</pattern>
</layout>
</encoder>
</appender>
<!-- 本地环境 -->
<springProfile name="local">
<root level="INFO">
<appender-ref ref="STDOUT"/>
<appender-ref ref="GRPC"/> <!-- 本地环境下,如果不想接入 SkyWalking 日志服务,可以注释掉本行 -->
<appender-ref ref="ASYNC"/> <!-- 本地环境下,如果不想打印日志,可以注释掉本行 -->
</root>
</springProfile>
<!-- 其它环境 -->
<springProfile name="dev,test,stage,prod,default">
<root level="INFO">
<appender-ref ref="STDOUT"/>
<appender-ref ref="ASYNC"/>
<appender-ref ref="GRPC"/>
</root>
</springProfile>
然后启动项目 如下图出现一些标志,说明已经成功了
Skyworking 默认是不支持网关的, 需要在skywalking-agent文件中进行一些配置, 如下图
找到这两个包, 进行一个配置, gateway的包有版本,根据自己项目当中使用的gateway版本 如下图
我使用的是3.4的, 所以把它的jar移动到plugins文件中去 plugins是支持的插件 optional-plugins是可选的插件
这样网关就可以在链路追踪上面显示了
1、查看 config/alarm-settings.yml文件
查看 config/alarm-settings.yml文件,Skywalking提供了一些默认的规则,只要我们的应用服务请求符合 alarm-setting.yml文件中的某一条规则就会触发告警通知。
rules: # Rule unique name, must be ended with `_rule`. service_resp_time_rule: metrics-name: service_resp_time op: ">" threshold: 1000 period: 10 count: 3 silence-period: 5 message: Response time of service {name} is more than 1000ms in 3 minutes of last 10 minutes. service_sla_rule: # Metrics value need to be long, double or int metrics-name: service_sla op: "<" threshold: 8000 # The length of time to evaluate the metrics period: 10 # How many times after the metrics match the condition, will trigger alarm count: 2 # How many times of checks, the alarm keeps silence after alarm triggered, default as same as period. silence-period: 3 message: Successful rate of service {name} is lower than 80% in 2 minutes of last 10 minutes
metrics-name:度量名称,也是OAL脚本中的度量名。默认配置中可以用于告警的度量有:服务,实例,端点,服务关系,实例关系,端点关系。它只支持 long,double和 int类型。 op:操作符。 threshold:阈值。 period:多久告警规则需要被检查一下。这是一个时间窗口,与后端部署环境时间相匹配。 count:在一个周期窗口中,如果按op计算超过阈值的次数达到count,则发送告警 silence-period:在时间N中触发报警后,在N -> N + silence-period这段时间内不告警。 message:该规则触发时,发送的通知消息。
默认报警规则:它包括以下规则:
过去 3 分钟内服务平均响应时间超过 1 秒。 最后2分钟服务成功率低于80%。 过去 3 分钟内超过 1 秒的服务响应时间百分比 服务实例最近 2 分钟平均响应时间超过 1 秒,并且实例名称与正则表达式匹配。 过去 2 分钟内端点平均响应时间超过 1 秒。 过去 2 分钟内数据库访问平均响应时间超过 1 秒。 过去 2 分钟内端点关系平均响应时间超过 1 秒。
测试告警
在应用服务中编写一个接口(慢查询)来测试告警。
@GetMapping("/timeout")
public UserDO timeout(Long seconds) throws InterruptedException {
if(seconds == null){
throw new RuntimeException("seconds 不能为空");
}
#测试他的时长
TimeUnit.SECONDS.sleep(seconds);
UserDO userDO = userService.getById(11L);
return userDO;
}
创建一个监控的springboot的项目进行一个监控
创建一个监控的controller的类来进行发送消息的警告处理 代码如下
package com.bwie.monder.controller;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.mail.javamail.JavaMailSender;
import org.springframework.mail.javamail.MimeMessageHelper;
import org.springframework.web.bind.annotation.RequestBody;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;
import javax.mail.internet.MimeMessage;
/**
* @ClassName: SkywalkingAlarmController
* @Description:
* @Description:
* @Author: YourName
* @Date: 2023/6/7
*/
@RestController
@RequestMapping("/sw/alarm")
public class SkywalkingAlarmController {
/**
* Skywalking告警通知回调接口:http://127.0.0.1:18081/sw/alarm/notify/
*
* @param obj
* @return
*/
@RequestMapping("/notify")
public String notify(@RequestBody Object obj) {
// TODO 将告警信息通知给负责人。比如:通过发短信,钉钉消息,邮件,微信通知等方式发送给技术负责人
System.err.println("收到Skywalking告警信息:" + obj.toString());
return "notify successfully";
}
/**
* 发送邮件
*
* Skywalking告警通知回调接口:http://127.0.0.1:18081/sw/alarm/notify2/
*
* @param obj
* @return
*/
@RequestMapping("/notify2")
public String notify2(@RequestBody Object obj) {
// TODO 将告警信息通知给负责人。比如:通过发短信,钉钉消息,邮件,微信通知等方式发送给技术负责人
System.err.println("notify2 收到Skywalking告警信息:" + obj.toString());
sendSimpleMail("[email protected]", "Skywalking告警信息", obj.toString());
return "notify successfully";
}
private static final String SENDER = "[email protected]";
@Autowired
private JavaMailSender javaMailSender;
/**
* 发送普通邮件
*
* @param to 收件人邮箱
* @param subject 主题(标题)
* @param content 内容
*/
public void sendSimpleMail(String to, String subject, String content) {
// 发生邮件
MimeMessage mimeMessage = javaMailSender.createMimeMessage();
try{
MimeMessageHelper mimeMessageHelper = new MimeMessageHelper(mimeMessage, true);
mimeMessageHelper.setFrom(SENDER);
mimeMessageHelper.setTo(to);
mimeMessageHelper.setSubject(subject);
mimeMessageHelper.setText(content);
javaMailSender.send(mimeMessage);
}catch (Exception e){
e.printStackTrace();
}
}
}
配置回调接口
在 config/alarm-settings.yml中配置回调接口(我们应用服务的接口),并重启 skywalking服务。
webhooks:
# - http://127.0.0.1/notify/
# - http://127.0.0.1/go-wechat/
- http://127.0.0.1:18081/sw/alarm/notify/
- http://127.0.0.1:18081/sw/alarm/notify2/
配置完成之后, 将监控服务进行一个启动来进行监控( 注意, 它监控到异常之后, 它是一个异步的一个操作, 不要慌 )
等一会, 就会出现报警信息, 并开始进行发送邮件的操作, 这样告警服务就OK了
SkyWalking自定义链路追踪
第一步, 在项目当中导入一个依赖
<!-- SkyWalking工具类 因为我们本地启动的SkyWalking服务是8.5版本的,所以这里的依赖版本也最好依赖-->
<dependency>
<groupId>org.apache.skywalking</groupId>
<artifactId>apm-toolkit-trace</artifactId>
<version>8.12.0</version>
</dependency>
第二步,将@Trace
注解加入到Service层的方法上
@Service
@Slf4j
public class OrderServiceImpl implements OrderService {
@Autowired
private OrderMapper orderMapper;
@Autowired
private StockFeignService stockFeignService;
@Override
@GlobalTransactional
@Trace
public void addOrder(Order order) {
// 创建订单
orderMapper.addOrder(order);
// 扣减库存
stockFeignService.deduction(order.getProductId());
log.info("远程服务调用扣减库存");
}
}
接下来重启服务,调用接口,再查看SkyWalking的链路追踪
如果想在SkyWalking的追踪菜单中看这个方法的入参与出差的话,就可以使用@Tag
或者@Tags
注解
@Override
@Trace
@Tag(key = "result", value = "returnedObj")
public List<Order> getAll() {
return orderMapper.getAll();
}
@Override
@Trace
@Tags({@Tag(key = "param", value = "arg[0]"),
@Tag(key = "result", value = "returnedObj")})
public Order get(Integer id) {
return orderMapper.getById(id);
}
文章浏览阅读4.8k次。shell脚本操作数据库如下。_shell脚本操作数据库
文章浏览阅读349次,点赞10次,收藏7次。crontab定时任务无结果问题_crontab执行了不出结果
文章浏览阅读2.8k次。demo<!DOCTYPE html><html><head> <meta charset="utf-8"> <title>Vuejs</title> <script src="https://cdn.bootcss.com/vue/2.2.2/vue.min.js"></...
文章浏览阅读2.4k次。以下是整理的一个大体步骤,做个记录底层index页面a是b和c还有map的父组件(created钩子函数执行顺序是从父元素到子元素,挨个执行,mounted钩子函数执行顺序是从子元素到父元素倒叙进行)一,加载顺序:1,进入页面,先初始化,当map 渲染挂载完成之后(mounted),使用事件监听的方式,触发色斑图组件c进行dom的操作,将canvas画上2,进入要展示色斑图的页面b时,获取色斑图要展示的数据,获取到之后,事件监听发送给底层index,然后再给色斑图组件赋值二,画c_vue色斑图
文章浏览阅读7.2k次。在windows上对源程序进行一键编译时,突然出现MSB1009项目不存在,***.sln开关的错误,手足无措,由于原代码在VS2017中正常编译运行,通过查看.bat文件发现一键编译中生成的项目名称与CMakeLists中的项目名称不一致。错误记录一下。..._msbuild : error msb1009: 项目文件不存在。
文章浏览阅读222次。文 | 邻章昨晚,华为召开了鸿蒙操作系统及华为全场景新品发布会。在发布会上,华为再次展示了鸿蒙操作系统的种种特征。对昨晚的发布会,邻章有几点下几点看法。首先声明一下,这几点看法,不是讨人欢喜博取流量的打鸡血、豪言壮语,所以想看豪言壮语的,可以先绕道,这几点看法,是自己对鸿蒙操作系统的真实所虑,也算是提供一种不同的声音,供大家参考吧。1、关于大一统构想:华为一直强调鸿蒙操作系统是面向物联网时代的操作..._看了“华为发布开源操作系统鸿蒙”的新闻,你对华为开源鸿蒙如何看待?(好处和坏处)
文章浏览阅读529次,点赞2次,收藏4次。之前一直以为 Qt Quick 里 Canvas 才可以自绘,后来发觉不是,原来还有好几种方式都可以绘图!可以使用原始的 OpenGL(Qt Quick 使用 OpenGL 渲染),可以构造QSGNode 来绘图,还可以使用 QPainter !哇, QPainter 我很熟悉啊。于是,我用 QPainter 结合 QML 实现了一个简单的涂鸦程序: PaintedItem 。它有下列功能:设..._qquickpainteditem
文章浏览阅读5.2k次,点赞15次,收藏98次。一、什么是中台中台是2019年开始火起来的一个概念,它最早是由阿里在2015年提出的“大中台,小前台”战略中延伸出来的概念,灵感来源于一家芬兰的小公司Supercell——一家仅有300名员工,却接连推出爆款游戏,是全球最会赚钱的明星游戏公司。2015年年中,马云带领阿里巴巴集团高管,拜访了位于芬兰赫尔辛基的这家移动游戏公司,这家看似很小的公司,设置了一个强大的技术平台,来支持众多的小团队进行游戏研发。这样一来,他们就可以专心创新,不用担心基础却又至关重要的技术支撑问题。恰恰是这家小公司,开创了中台的“玩_数据不出中台是什么意思
文章浏览阅读5.4k次。作为一款专业的数据分析软件,IBM SPSS Statistics为用户提供了全面的、多方位的数据分析手段,我们可以在其中使用各种分析方法对数据进行统计分析,对数据分析师、医药学分析都有非常大的好处。接下来小编就为大家介绍一下如何使用IBM SPSS Statistics的交叉表分析来统计两个变量的交叉频率分布及其百分比分布。一、交叉表分析概述图1:数据窗口数据分析是基于数据表中的变量来进行的,我们可以探究一个变量中的数据之间的相互关系,也可以探究两个甚至更多变量之间的交叉关系,交叉表分_spss双变量频数怎么做
文章浏览阅读211次。好像支持php5.4的比较少推荐你用:万网虚拟主机-普及版(1G网页空间,送50M SQL数据库,支持HTML/ASP/NET/PHP/MYSQL/MSSQL),需要备案:150元/年。 可以加咱,在线上。PHP5.4的虚拟主机,最好是免备案的,域名在国外,貌似无法备案。各位前。国外空间都不备案的,,虚拟主机都支持上传了一个程序到网站,要求php5.4,而我空间php5.2.17版本太旧,求升级。..._虚拟主机php环境要求5.4以上
文章浏览阅读382次。解决方案 :强制上传 git push -f origin master如果github或gitee没有其他人在修改,用这个没什么影响,但是如果还有其他人修改了,用-f命令会覆盖掉他的修改,慎用。_ios ! [rejected] main -> master (non-fast-forward)
文章浏览阅读1.6k次,点赞2次,收藏7次。PoseCNN:用卷积神经网络估计杂乱场景中目标6D姿态—2017(笔记)文章提出了新的PoseCNN姿态估计网络,通过CNN提取图像特征,然后分三路进行目标分割标签标注、平移估计和姿态估计得到目标6D姿态,其中通过应用新型损失函数,能够较好地估计对称目标。 ----------------- Occlusion、symmetric object、only RGB摘要..._posecnn: a convolutional neural network for 6d object pose estimation in clu