2018.02.08更新后ubuntu1604LTS后不能使用nvidia卡做gpu运算的问题

系统安装、升级讨论
版面规则
我们都知道新人的确很菜,也喜欢抱怨,并且带有浓厚的Windows习惯,但既然在这里询问,我们就应该有责任帮助他们解决问题,而不是直接泼冷水、简单的否定或发表对解决问题没有任何帮助的帖子。乐于分享,以人为本,这正是Ubuntu的精神所在。
OUC_LiuX
帖子: 26
注册时间: 2018-02-06 20:12
系统: ubuntu 16.04 LTS

Re: 2018.02.08更新后ubuntu1604LTS后不能使用nvidia卡做gpu运算的问题

#31

帖子 OUC_LiuX » 2018-02-11 14:56

poloshiao 写了:
1. 使用 nvidia 搜尋
Feb 11 11:11:40 liuxiang-Lenovo-XiaoXin-700-15ISK kernel: nvidia: loading module not compiled with retpoline compiler.
Feb 11 11:11:40 liuxiang-Lenovo-XiaoXin-700-15ISK kernel: nvidia: module verification failed: signature and/or required key missing - tainting kernel
Feb 11 11:11:40 liuxiang-Lenovo-XiaoXin-700-15ISK kernel: nvidia: Unknown symbol swiotlb_map_sg_attrs (err 0)
1-1. 先查查 retpoline compiler
1-1-1. http://rglinuxtech.com/?p=2205
There is further protection – retpoline – that depends on compiler features, which have already been incorporated into beta GCC 8.X, and are due to be ‘backported’ to the next mainstream 7.X release – GCC 7.3.
1-1-1-1. 這需要 GCC 8
1-1-1-2. https://packages.ubuntu.com/search?suit ... chon=names
目前 gcc-8 還未進入 ubuntu 官方套件庫
uname -a
Linux liuxiang-Lenovo-XiaoXin-700-15ISK 4.15.0-999-generic #201802062100 SMP Wed Feb 7 02:02:26 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux
2. https://packages.ubuntu.com/search?suit ... chon=names
4.15 的 kernel 版本 還沒進入 Ubuntu 官方套件庫
2-1. 意思是 你在體驗測試版本, 會碰到問題是可以預期的

3. 補充說明
nvidia Optimus 顯卡 需要 linux kernel 及 nvidia-xxx 閉源驅動 相容 或說 相搭
單方面 提昇版本 可能會破壞這種相容相搭關係
3-1. 參見
https://wiki.ubuntu.com/X/Config/Hybrid ... quirements
Feb 11 11:11:40 liuxiang-Lenovo-XiaoXin-700-15ISK kernel: nvidia: module verification failed: signature and/or required key missing - tainting kernel
3-2. https://www.linuxquestions.org/question ... ost5314496
All that means, is that you're loading a kernel module that hasn't been fully tested/integrated with the kernel you're running. This message was intended to identify conditions which may make it difficult to properly troubleshoot a kernel problem.

4. 建議
如果是 Ubuntu 16.04.3
最新的 Ubuntu 官方支援版本 Linux kernel 4.4
目前最新版本 4.4.0-104-generic
4-1. https://wiki.ubuntu.com/XenialXerus/Rel ... kernel_4.4
4-2. https://packages.ubuntu.com/xenial/linu ... 04-generic
4-3. 如果你要使用 Ubuntu 17.04/17.10/18.04 的 kernel 版本 在目前的 16.04 系統
請參見
https://wiki.ubuntu.com/Kernel/RollingL ... ementStack
RollingLTSEnablementStack
4-4. 避免 直接安裝不適合的 kernel 版本
除非你是有興趣體驗或研發
否則不要使用非穩定版本的核心
你好,内核版本号已更改。
问题并未得到解决。
选区_001.png
OUC_LiuX
帖子: 26
注册时间: 2018-02-06 20:12
系统: ubuntu 16.04 LTS

Re: 2018.02.08更新后ubuntu1604LTS后不能使用nvidia卡做gpu运算的问题

#32

帖子 OUC_LiuX » 2018-02-11 15:18

2018.02.11

kernel 使用 4.4.0.104;实测16.04.03LTS默认的4.10无效
gcc 降级为 gcc-5

禁用nouveau, 删除所有nvidia组件并在gcc-5环境下重装后,所有问题得以解决。

再次对@poloshiao在这三天时间里不断给予我帮助表达感谢!
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 2018.02.08更新后ubuntu1604LTS后不能使用nvidia卡做gpu运算的问题

#33

帖子 poloshiao » 2018-02-11 16:29

禁用nouveau, 删除所有nvidia组件并在gcc-5环境下重装后,所有问题得以解决。
謝謝分享
回复