解决阿里云服务器不定时卡死的问题

11

解决阿里云服务器不定时卡死的问题

程序员小山与Bug 得到的解决方案

遇到的问题

服务器不定时卡死,SSH 和 VNC 连接无反应。

尝试的解决方案

  1. 查看磁盘读写速度。
  2. 安装 iotop 查看进程读写情况。
  3. 查看内存使用情况。

发现的问题根源

内存不足,导致系统卡死。

解决步骤

  1. 手动执行 makecache

      dnf makecache
    
  2. 关闭定时任务

    • 查看定时任务:
      systemctl list-timers
      
    • 禁用并停止 dnf-makecache.timer
      systemctl disable dnf-makecache.timer
      systemctl stop dnf-makecache.timer
      
  3. 配置交换空间

    • 创建交换文件:
      sudo fallocate -l 2G /swapfile
      
    • 设置权限:
      sudo chmod 600 /swapfile
      
    • 启用交换空间:
      sudo swapon /swapfile
      
    • 查看交换空间:
      free -h
      
    • 临时调整内核使用交换空间的倾向:
      sysctl vm.swappiness=60
      
    • 永久调整内核使用交换空间的倾向:
      • 编辑 /etc/sysctl.conf 文件:
        vim /etc/sysctl.conf
        
      • 在文件中添加或修改 vm.swappiness=60 行。

验证

再次执行 dnf makecache,查看是否成功。

结论

通过配置交换空间,成功解决了内存不足导致的问题。