- 前言
- 为什么要写这本书
- 读者对象
- 如何阅读本书
- 勘误和支持
- 致谢
- 第一部分 安全运维篇
- 第 1 章 Linux 服务器安全运维
- 第 2 章 Linux 网络安全运维
- 第 3 章 数据安全工具 DRBD、extundelete
- 第二部分 运维故障排查篇
- 第 4 章 Linux 系统运维故障排查思路
- 第 5 章 Linux 故障排查案例实战
- 第三部分 自动化运维篇
- 第 6 章 轻量级运维利器 pssh、pdsh 和 mussh
- 第 7 章 分布式监控系统 Ganglia
- 第 8 章 基于 nagios 的分布式监控报警平台 Centreon
- 第 9 章 通过 Ganglia 与 Centreon 构建智能化监控报警平台
- 第四部分 集群架构篇
- 第 10 章 高性能 Web 服务器 Nginx
- 第 11 章 高性能集群软件 Keepalived
- 第 12 章 千万级高并发负载均衡软件 HAProxy
- 第 13 章 构建高性能的 MySQL 集群系统
- 第 14 章 高性能负载均衡集群软件 HAProxy
文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
4.3 Linux 系统无响应(死机)问题分析
Linux 服务器在长期运行后,难免出现无响应现象,俗称“死机”。在系统死机后,屏幕一般会输出故障信息,键盘失去响应,这种情况的常见处理办法就是重启系统,不过在重启前,要重点关注下屏幕的输出信息,因为其提示的可能是引起死机的主要原因,对解决问题有大帮助。其实还有另一种方法,就是通过串口直连线连接客户机和服务器,将服务器的出错详细信息发送到客户机上。
引起服务器死机的原因有很多,但主要有两个方面:软件问题和硬件问题。下面总结了造成 Linux 系统死机的常见原因和解决问题的思路。
1)系统硬件问题,主要是由 SCSI 卡、主板、RAID 卡、HBA 卡、网卡、硬盘等硬件设备导致的。在这种情况下需要定位硬件故障细节,通过更换硬件来解决问题。
2)外围硬件问题,主要是网络问题导致的。此时就需要从网络设备、网络参数等方面查找和解决问题。
3)软件问题,主要是系统内核 bug、应用软件 bug、驱动程序 bug 等。在这种情况下就需要从升级内核、修复程序 bug、更新驱动程序等方面来解决问题。
4)系统设置问题:主要是系统参数设置不当导致的,可以通过恢复系统到默认状态,关闭防火墙等方面来解决问题。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论