博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
针对云主机卡死问题的定位分析方法
阅读量:5878 次
发布时间:2019-06-19

本文共 757 字,大约阅读时间需要 2 分钟。

此文已由作者杨延亮授权网易云社区发布。

欢迎访问,了解更多网易技术产品运营经验。

问题背景

云主机在运行或者启动的过程中,可能会存在卡死的情况。往往在云主机重启之后又恢复正常,但是问题现场得不到保留,不利于问题的分析定位。本文提供了一种方法,可以通过在云主机所在的物理节点(宿主机)上执行相关命令,来获取云主机卡死时的内存栈信息,以便分析定位(本文只针对Linux虚拟机)。

方法步骤

  1. 假如卡住的云主机UUID为:d1467712-a022-41c9-9963-8f41c6a4b2bd,在宿主机上执行如下命令,可以获取云主机对应的宿主机信息()

  2. 登录云主机对应的宿主机,执行如下命令,来生成对应的core文件。

    virsh dump d1467712-a022-41c9-9963-8f41c6a4b2bd d1467712-a022-41c9-9963-8f41c6a4b2bd.core 或者
    virsh dump d1467712-a022-41c9-9963-8f41c6a4b2bd d1467712-a022-41c9-9963-8f41c6a4b2bd.core --memory-ony
    ——需要指出的是,core文件生成的路径需要保留至少和虚拟机内存大小相当的空间,以防core文件生成失败,或生成core文件不完整。此处生成的core文件即包含了云主机卡死时的内存调用栈信息。

  3. 执行crash vmliux vmcore命令即可对生成的core文件进行分析定位

    ——其中vmliux需要云主机对应的kernel-debuginfo和kernel-debuginfo-common这两个包,vmcore即为步骤2中生成的core文件。

更多网易技术、产品、运营经验分享请。

相关文章:

【推荐】 

转载地址:http://kqdix.baihongyu.com/

你可能感兴趣的文章
修改校准申请遇到的问题
查看>>
Linux 进程中 Stop, Park, Freeze【转】
查看>>
文件缓存
查看>>
远程协助
查看>>
Scrum实施日记 - 一切从零开始
查看>>
关于存储过程实例
查看>>
配置错误定义了重复的“system.web.extensions/scripting/scriptResourceHandler” 解决办法...
查看>>
PHP盛宴——经常使用函数集锦
查看>>
重写 Ext.form.field 扩展功能
查看>>
Linux下的搜索查找命令的详解(locate)
查看>>
福利丨所有AI安全的讲座里,这可能是最实用的一场
查看>>
开发完第一版前端性能监控系统后的总结(无代码)
查看>>
Python多版本情况下四种快速进入交互式命令行的操作技巧
查看>>
MySQL查询优化
查看>>
【Redis源码分析】如何在Redis中查找大key
查看>>
android app启动过程(转)
查看>>
安装gulp及相关插件
查看>>
如何在Linux用chmod来修改所有子目录中的文件属性?
查看>>
Applet
查看>>
高并发环境下,Redisson实现redis分布式锁
查看>>