CPU飙高系统反应慢怎么排查?

382 阅读2分钟

什么是CPU

CPU是整个电脑的核心计算资源,对于一个应用程序来说,CPU是最小执行单元是线程

导致CPU飙高的原因

  1. CPU的上下文切换过多,对于CPU来说,同一个时刻下每个CPU核心只能运行一个线程,如果有多个线程要去被执行怎么办,CPU只能通过上下文切换的方式来执行调度不同的线程,上下文切换需要做两个事情,第一个是保存运行中线程的执行状态,第二个是处于等待中的线程恢复执行,这两个过程需要CPU执行内核相关指令,去实现状态的保存和恢复,如果较多的上下文切换,会占据大量的CPU资源,从而使得CPU无法执行用户进程中的真正指令,导致响应速度下降,在java中文件IO,网络IO,锁等待这些都会造成线程阻塞,而线程阻塞就会导致CPU的上下文切换
  2. CPU资源过度消耗,也就是在程序中创建了大量的线程,或者有线程一直占据CPU资源无法被释放,比如说像死循环,CPU利用率过高之后,导致CPU程序中的线程无法去获得CPU的调度从而影响程序的执行效率,所以既然是这两个问题导致CPU利用率较高,可以通过top命令找到利用率较高的进程,在通过Shift+H找到进程中CPU消耗过高的线程,这里有两种情况,第一种情况CPU利用率过高的线程一直是同一个,也就是线程ID没有变化,说明在程序中存在长期占用CPU没有释放的一个情况,那么这种情况直接通过jstack获得线程Dump日志,定位到线程日志后,就可以找到问题的代码。第二个是CPU利用率过高的线程ID不断变化,那么说明线程创建过多,需要去挑选几个线程ID,通过jstack获得线程Dump中去进行排查,最后有可能定位的结果是程序正常,只是在CPU飙高的那一刻,用户访问量非常大导致系统资源不够,那么这个时候,我们采取的手段是,去增加系统资源