运维面试题

如何排查报警

首先报警一般是通过邮件,或者钉钉微信 等方式通知, 一般情况下报警主要是两大类, 一个是基础资源报警,一个是服务报警
基础资源一般是服务器的cpu 内存 磁盘 的负载, 程序的报警一般是 服务故障,502 等情况, 一般情况下cpu和内存报警 大多数都是程序引起的, 这个时候一般用top查看总体的一个负载情况, 如果负载很高, 然后再看具体某个进程的占用情况, 如果某个单一进程消耗资源很多,使用pidstat 查看具体的一些进程使用情况, 然后杀掉进程, 去看这个程序的日志 如果看不出来,

nginx 性能优化


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!