启动故障求解答!

启动讨论 grub/grub2/syslinux/grub4dos/Lilo
chenglx2006
帖子: 25
注册时间: 2018-03-16 21:44
系统: ubuntu

启动故障求解答!

#1

帖子 chenglx2006 » 2018-04-18 15:45

先说一下系统,联想昭阳k27,单系统,装了ubuntu17.10,现在升级了也不知道是什么版本,显示Ubuntu Bionic Beaver (development branch)。
经常重启电脑后,卡在紫色屏幕上不动,只能按住电源键强行关机。
关机后再开机,会出现grub引导界面,选ubuntu,重启后出现kernel panic-not syncing fatal exception in interrupt,再次强行关机,基本上会正常进入系统,下次开机又可能再次出现这样三连。
最后成功启动的时候会显示/dev/sda1 clean ,然后就成功进入系统了
多处求教后,有位大神给了个命令搜索log文件,用fgrep failed /var/log/*.log命令后,得到如下结果:
/var/log/kern.log:Apr 16 22:07:51 chenglx-ubuntu kernel: [ 0.182424] acpi PNP0A08:00: _OSC failed (AE_ERROR); disabling ASPM
/var/log/kern.log:Apr 16 22:07:51 chenglx-ubuntu kernel: [ 12.721432] platform regulatory.0: Direct firmware load for regulatory.db failed with error -2
/var/log/kern.log:Apr 16 22:07:51 chenglx-ubuntu kernel: [ 12.721436] cfg80211: failed to load regulatory.db
/var/log/kern.log:Apr 18 09:04:38 chenglx-ubuntu kernel: [ 0.173597] acpi PNP0A08:00: _OSC failed (AE_ERROR); disabling ASPM
/var/log/kern.log:Apr 18 09:04:38 chenglx-ubuntu kernel: [ 24.051978] platform regulatory.0: Direct firmware load for regulatory.db failed with error -2
/var/log/kern.log:Apr 18 09:04:38 chenglx-ubuntu kernel: [ 24.051983] cfg80211: failed to load regulatory.db
/var/log/kern.log:Apr 18 15:17:52 chenglx-ubuntu kernel: [ 0.185234] acpi PNP0A08:00: _OSC failed (AE_ERROR); disabling ASPM
/var/log/kern.log:Apr 18 15:17:52 chenglx-ubuntu kernel: [ 27.155193] platform regulatory.0: Direct firmware load for regulatory.db failed with error -2
/var/log/kern.log:Apr 18 15:17:52 chenglx-ubuntu kernel: [ 27.155197] cfg80211: failed to load regulatory.db
/var/log/Xorg.1.log:[ 65.520] _XSERVTransSocketUNIXCreateListener: ...SocketCreateListener() failed
/var/log/Xorg.1.log:[ 383.350] (WW) xf86CloseConsole: KDSETMODE failed: Input/output error
/var/log/Xorg.1.log:[ 383.350] (WW) xf86CloseConsole: VT_GETMODE failed: Input/output error
/var/log/Xorg.1.log:[ 383.350] (WW) xf86CloseConsole: VT_ACTIVATE failed: Input/output error
还请论坛上各位大神帮忙分析解决,谢谢!

/var/log/kern.log.1:Apr 9 21:29:25 chenglx-ubuntu kernel: [ 0.180081] acpi PNP0A08:00: _OSC failed (AE_ERROR); disabling ASPM
/var/log/kern.log.1:Apr 9 21:29:25 chenglx-ubuntu kernel: [ 22.868645] platform regulatory.0: Direct firmware load for regulatory.db failed with error -2
/var/log/kern.log.1:Apr 9 21:29:25 chenglx-ubuntu kernel: [ 22.868649] cfg80211: failed to load regulatory.db
/var/log/kern.log.1:Apr 10 20:01:00 chenglx-ubuntu kernel: [ 0.175302] acpi PNP0A08:00: _OSC failed (AE_ERROR); disabling ASPM
/var/log/kern.log.1:Apr 10 20:01:00 chenglx-ubuntu kernel: [ 23.349219] platform regulatory.0: Direct firmware load for regulatory.db failed with error -2
/var/log/kern.log.1:Apr 10 20:01:00 chenglx-ubuntu kernel: [ 23.349224] cfg80211: failed to load regulatory.db
/var/log/kern.log.1:Apr 11 20:11:07 chenglx-ubuntu kernel: [ 0.178377] acpi PNP0A08:00: _OSC failed (AE_ERROR); disabling ASPM
/var/log/kern.log.1:Apr 11 20:11:07 chenglx-ubuntu kernel: [ 23.970562] platform regulatory.0: Direct firmware load for regulatory.db failed with error -2
/var/log/kern.log.1:Apr 11 20:11:07 chenglx-ubuntu kernel: [ 23.970565] cfg80211: failed to load regulatory.db
/var/log/kern.log.1:Apr 16 21:48:40 chenglx-ubuntu kernel: [ 0.020000] tsc: Fast TSC calibration failed
/var/log/kern.log.1:Apr 16 21:48:40 chenglx-ubuntu kernel: [ 0.182076] acpi PNP0A08:00: _OSC failed (AE_ERROR); disabling ASPM
/var/log/kern.log.1:Apr 16 21:48:40 chenglx-ubuntu kernel: [ 13.403825] platform regulatory.0: Direct firmware load for regulatory.db failed with error -2
/var/log/kern.log.1:Apr 16 21:48:40 chenglx-ubuntu kernel: [ 13.403829] cfg80211: failed to load regulatory.db
/var/log/repowerd.log.1:2018-02-09T14:44:05.395154+08:00 chenglx-Rev-1-0 repowerd[811]: LogindSessionTracker: dbus_get_session_by_pid() failed: GDBus.Error:org.freedesktop.login1.NoSessionForPID: PID 1228 does not belong to any known session
/var/log/repowerd.log.1:2018-02-09T14:44:22.798096+08:00 chenglx-Rev-1-0 repowerd[811]: LogindSessionTracker: dbus_get_session_by_pid() failed: GDBus.Error:org.freedesktop.login1.NoSessionForPID: PID 1716 does not belong to any known session

以上的故障信息,我觉得都是关于kernel panic-not syncing fatal exception in interrupt的,没有卡紫屏的相关信息,难道是我不该强行关机?
fuhuizn
帖子: 947
注册时间: 2006-01-06 22:55
系统: ubuntu
联系:

Re: 启动故障求解答!

#2

帖子 fuhuizn » 2018-04-19 15:28

cfg80211是配置无线网络的,意思应该是因为强行关机,导致了regulatory.db这个文件损坏或丢失。
头像
aerowolf
帖子: 1778
注册时间: 2006-02-25 17:09
来自: 西安

Re: 启动故障求解答!

#3

帖子 aerowolf » 2018-04-19 17:50

在Bing搜索错误信息之后,也没有看到直接的解决方法。
综合来看,似乎硬件兼容和内核版本的可能性比较大。

建议尝试在BIOS中停用网卡登录、无关的USB设置,甚至无线网卡,再重启试试。
另,在Grub菜单中看,如果有多个版本的内核,尝试用旧内核启动试试。
早起的鸟儿有虫吃
早起的虫儿被鸟吃

http://aerowolf.blog.sohu.com/
亲,点一下免费获得Dropbox空间!
chenglx2006
帖子: 25
注册时间: 2018-03-16 21:44
系统: ubuntu

Re: 启动故障求解答!

#4

帖子 chenglx2006 » 2018-04-19 20:53

aerowolf 写了:在Bing搜索错误信息之后,也没有看到直接的解决方法。
综合来看,似乎硬件兼容和内核版本的可能性比较大。

建议尝试在BIOS中停用网卡登录、无关的USB设置,甚至无线网卡,再重启试试。
另,在Grub菜单中看,如果有多个版本的内核,尝试用旧内核启动试试。
其实我在论坛上也发现了N年前就有人问这个问题,看来这是ubuntu的老毛病了,

我的网卡登录也关闭了,无线网卡还没有试过,回头再试试,不过这种现象不是经常出现,有时候一连几天都好好的。
chenglx2006
帖子: 25
注册时间: 2018-03-16 21:44
系统: ubuntu

Re: 启动故障求解答!

#5

帖子 chenglx2006 » 2018-04-19 20:56

fuhuizn 写了:cfg80211是配置无线网络的,意思应该是因为强行关机,导致了regulatory.db这个文件损坏或丢失。
我现在越来越感觉是我强行关机造成的后面那些内核错误,但是卡紫屏这错误就没有记录,真不知道该从哪里下手了。
fuhuizn
帖子: 947
注册时间: 2006-01-06 22:55
系统: ubuntu
联系:

Re: 启动故障求解答!

#6

帖子 fuhuizn » 2018-04-20 18:05

把 /etc/default/grub 里的启动参数 splash quiet 删掉,重新 update-grub,就可以看清楚启动时卡在什么服务上了。
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 启动故障求解答!

#7

帖子 poloshiao » 2018-04-20 19:23

基本上会正常进入系统
正常进入系统後
1. 把下面指令 複製 貼進終端機 執行
1-1. sudo efibootmgr -v
1-2. sudo parted -l print
1-3. sudo ls -al /dev/disk/by-uuid/*
1-4. sudo ls -al /dev/disk/by-partuuid/*
1-5. echo $DESKTOP_SESSION
1-6. sudo lshw -numeric -class video
把結果直接複製貼上來
chenglx2006
帖子: 25
注册时间: 2018-03-16 21:44
系统: ubuntu

Re: 启动故障求解答!

#8

帖子 chenglx2006 » 2018-04-23 11:13

poloshiao 写了:
基本上会正常进入系统
正常进入系统後
1. 把下面指令 複製 貼進終端機 執行
1-1. sudo efibootmgr -v
1-2. sudo parted -l print
1-3. sudo ls -al /dev/disk/by-uuid/*
1-4. sudo ls -al /dev/disk/by-partuuid/*
1-5. echo $DESKTOP_SESSION
1-6. sudo lshw -numeric -class video
把結果直接複製貼上來
chenglx@chenglx-ubuntu:~$ sudo efibootmgr -v
EFI variables are not supported on this system.
chenglx@chenglx-ubuntu:~$ sudo parted -l print
Model: ATA HITACHI HTS72323 (scsi)
磁盘 /dev/sda: 320GB
Sector size (logical/physical): 512B/512B
分区表:msdos
Disk Flags:

数字 开始: End 大小 类型 文件系统 标志
1 1049kB 25.0GB 25.0GB primary ext4 启动
2 25.0GB 320GB 295GB extended
5 25.0GB 30.0GB 4999MB logical linux-swap(v1)
6 30.0GB 31.0GB 1023MB logical ext4
7 31.0GB 320GB 289GB logical ext4


chenglx@chenglx-ubuntu:~$ sudo ls -al /dev/disk/by-uuid/*
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-uuid/6e19813a-7304-4dbf-9068-6fae2dc96d65 -> ../../sda5
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-uuid/6e41fb6a-7fa5-4c20-88e2-c35f56258170 -> ../../sda6
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-uuid/c4eef636-295b-488f-ab3c-4bda3d7e040d -> ../../sda7
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-uuid/e403ada7-3dad-4e0b-8c83-ec348e3ee4f5 -> ../../sda1
chenglx@chenglx-ubuntu:~$ sudo ls -al /dev/disk/by-partuuid/*
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-partuuid/51bc2ff1-01 -> ../../sda1
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-partuuid/51bc2ff1-02 -> ../../sda2
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-partuuid/51bc2ff1-05 -> ../../sda5
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-partuuid/51bc2ff1-06 -> ../../sda6
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-partuuid/51bc2ff1-07 -> ../../sda7

chenglx@chenglx-ubuntu:~$ echo $DESKTOP_SESSION
ubuntu
chenglx@chenglx-ubuntu:~$ sudo lshw -numeric -class video
*-display
description: VGA compatible controller
product: 2nd Generation Core Processor Family Integrated Graphics Controller [8086:116]
vendor: Intel Corporation [8086]
physical id: 2
bus info: pci@0000:00:02.0
version: 09
width: 64 bits
clock: 33MHz
capabilities: msi pm vga_controller bus_master cap_list rom
configuration: driver=i915 latency=0
resources: irq:26 memory:f4000000-f43fffff memory:e0000000-efffffff ioport:1800(size=64) memory:c0000-dffff
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 启动故障求解答!

#9

帖子 poloshiao » 2018-04-23 14:34

sudo parted -l print
Model: ATA HITACHI HTS72323 (scsi)
磁盘 /dev/sda: 320GB
Sector size (logical/physical): 512B/512B
分区表:msdos
Disk Flags:
1. 分區表 msdos
sudo ls -al /dev/disk/by-partuuid/*
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-partuuid/51bc2ff1-01 -> ../../sda1
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-partuuid/51bc2ff1-02 -> ../../sda2
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-partuuid/51bc2ff1-05 -> ../../sda5
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-partuuid/51bc2ff1-06 -> ../../sda6
lrwxrwxrwx 1 root root 10 4月 23 11:08 /dev/disk/by-partuuid/51bc2ff1-07 -> ../../sda7
2. 為何有 partuuid ?
2-1. 通常 這是 gpt 分割表 才會有.

3. 安裝/啟動 grub
在 msdos 與 在 gpt 有區別.
chenglx2006
帖子: 25
注册时间: 2018-03-16 21:44
系统: ubuntu

Re: 启动故障求解答!

#10

帖子 chenglx2006 » 2018-04-23 15:34

2. 為何有 partuuid ?
2-1. 通常 這是 gpt 分割表 才會有.
这个不太清楚,我是用的U盘安装的系统,安装时把所有分区删除了,而且之前的系统是win7应该也没有gpt分区表。

关闭了splash quiet之后,居然连续N次启动都正常,也没有看到之前每次成功启动时显示的
/dev/sda1 clean
chenglx2006
帖子: 25
注册时间: 2018-03-16 21:44
系统: ubuntu

Re: 启动故障求解答!

#11

帖子 chenglx2006 » 2018-04-23 15:40

故障出来了!
附件
第三次启动
第三次启动
第二次启动
第二次启动
第一次启动
第一次启动
上次由 chenglx2006 在 2018-04-23 15:49,总共编辑 1 次。
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 启动故障求解答!

#12

帖子 poloshiao » 2018-04-23 15:46

能否出現 grub 2 開機選單 ?
如果可以 選擇
Memory test (memtest86+)
讓它最少跑過 3 passes 看看
能否順利跑完
chenglx2006
帖子: 25
注册时间: 2018-03-16 21:44
系统: ubuntu

Re: 启动故障求解答!

#13

帖子 chenglx2006 » 2018-04-24 8:08

昨天下午跑到现在,跑了16个小时,没发现异常。
附件
4.jpg
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 启动故障求解答!

#14

帖子 poloshiao » 2018-04-24 10:55

故障出来了!
1. 下一回 成功開機時 檢閱你的 journal 開機記錄 看看故障訊息

2. journal 紀錄 預設 只能看到 開機當次的記錄
要看以前幾次的開機舊紀錄 需要預先更改設定
2-1. sudo vim.tiny /etc/systemd/journald.conf
把這一行
#Storage=persistent
改為
Storage=persistent
2-2. 重新開機
2-3. 要查出現故障該次的記錄 要記得
出現故障該次 到 你要查閱時 中間已經開機幾次
chenglx2006
帖子: 25
注册时间: 2018-03-16 21:44
系统: ubuntu

Re: 启动故障求解答!

#15

帖子 chenglx2006 » 2018-04-24 11:01

把這一行
#Storage=persistent
改為
Storage=persistent
我这里是这样的
[Journal]
#Storage=auto

刚才把journalctl 的结果输出到了文本文件,有40多M,应该从中找哪些关键字?
上次由 chenglx2006 在 2018-04-24 11:22,总共编辑 1 次。
回复