首页 » 硬件 » 正文

Ubuntu 18.04 + RTX 2070 驱动安装排坑记录

硬件选择

  • CPU:I5 8400
  • GPU:RTX 2070(七彩虹(colorful)iGame GeForce RTX 2070 Ultra GDDR6 8G)
  • 主板:B360 ATX(华硕(ASUS)PRIME B360-PLUS)
  • 内存:DDR4 2666 8G X 2(金士顿(Kingston)骇客神条 Fury系列 雷电 DDR4 2666 8GB)
  • 固态硬盘:Intel 760P NVMe 512G(英特尔(Intel)760P系列 512G NVMe M.2)
  • 机械硬盘:WD 2T(西部数据(Western Digital)蓝盘 2TB SATA6Gb/s 256MB)
  • 电源:RM750x(美商海盗船(USCorsair)额定750W RM750x)
  • 机箱:全塔机箱(先马(SAMA)黑洞3 黑色 全塔机箱)

GPU

选择显卡的时候处于一个尴尬的时间点,最佳选择1080Ti已经没有全新的货了;RTX 2080Ti价格超出预算,2070/2080的显存只有8G,小于1080Ti的11G。
后面了解到RTX的显卡可以利用新的技术Tensor Core进行16位数据的计算,可以节约一半的显存使用。所以相对于1080Ti及以前的卡来说,RTX的卡显存可以翻倍看待。这是因为深度学习对32位计算的精度依赖不大。32位精度下降到16位,对大部分模型的训练效果几乎没有影响。所以在预算有限的情况下,选择了RTX 2070。电源预留了两张卡的功耗,后期给再添加一张2070留了余地。
http://timdettmers.com/2018/11/05/which-gpu-for-deep-learning/
这个博客的几篇文章的结论也是:目前RTX 2070是最优的深度学习显卡。
下面是原文的结论,这个博客还有几篇也是关于深度学习硬件选择的文章,可以有一些参考的地方。

Best GPU overall: RTX 2070
GPUs to avoid: Any Tesla card; any Quadro card; any Founders Edition card; Titan V, Titan XP
Cost-efficient but expensive: RTX 2070
Cost-efficient and cheap: GTX Titan (Pascal) from eBay, GTX 1060 (6GB), GTX 1050 Ti (4GB)
I have little money: GTX Titan (Pascal) from eBay, or GTX 1060 (6GB), or GTX 1050 Ti (4GB)
I have almost no money: GTX 1050 Ti (4GB); CPU (prototyping) + AWS/TPU (training); or Colab.
I do Kaggle: RTX 2070. If you do not have enough money go for a GTX 1060 (6GB) or GTX Titan (Pascal) from eBay for prototyping and AWS for final training. Use fastai library
I am a competitive computer vision or machine translation researcher: GTX 2080 Ti with the blower fan design; upgrade to RTX Titan in 2019
I am an NLP researcher: RTX 2070 use 16-bit.
I want to build a GPU cluster: This is really complicated, you can get some ideas here
I started deep learning and I am serious about it: Start with an RTX 2070. Buy more RTX 2070 after 6-9 months and you still want to invest more time into deep learning. Depending on what area you choose next (startup, Kaggle, research, applied deep learning) sell your GPU and buy something more appropriate after about two years.
I want to try deep learning, but I am not serious about it: GTX 1050 Ti (4 or 2GB). This often fits into your standard desktop. If it does, do not buy a new computer!

CPU

受限于预算,无法选择志强系列CPU,只能在酷睿里选。9代产品线还没有齐全,并且考虑到保修售后,选择盒装8400。

内存

四个插槽,目前利用两个,添加第二块2070的时候,再同步添加8G内存条两条。

系统安装

Windows 10

测试硬件时安装了一下,驱动Win10带的都蛮全的,显卡驱动自动更新也会装上。这个显卡驱动问题在Ubuntu会遇到一些问题,相比之下Windows还是人性化很多,少了很多用户需要操心的地方。

Ubuntu 18.04

遇到的第一个问题就是,默认显卡驱动不正常,显示分辨率低,并且图像显示不完整。用核显输出进行安装就不会有问题。
由于RTX 2070显卡驱动过于新,Ubuntu 18.04.2这个版本并没有自带的驱动,并且也无法检测到卡的具体型号,所以无法自动或者手动在系统的驱动界面安装显卡驱动。这个问题会导致显卡风扇停转。正常情况下9系之后的Nvidia显卡都自带风扇启停,在60度一下(一般),风扇是不会转动的。但是这个驱动问题导致显卡在60度以上的时候也不会转动,用手触摸了一下散热歧管,一两秒就能感到烫手,温度已经在70度以上了。所以后面装系统驱动的时候是把显卡拆下来安装的,驱动安装完之后才把显卡装回去。
– 安装系统和驱动时,使用核显安装
– 安装系统和驱动时,把显卡拆下来,以免过热
– 建议选择完整安装,精简安装不能使用自带的桌面共享

驱动安装

由于无法被系统识别正确的显卡型号,所以得自行安装显卡驱动。
添加Graphic Drivers PPA

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update

查找驱动,查找驱动的时候要把显卡插上(记得关机断电操作)

ubuntu-drivers devices

这个时候会显示几个驱动型号,2070显示415和410驱动,415后面带有recommended,所以按照推荐,安装415驱动

sudo apt-get install nvidia-driver-415

ppa源极其慢,没有镜像,只能等。由于要很久,防止显卡过热,这一步我是把显卡拆下来的(记得关机断电操作)。
安装完成后重启就可以正常识别显卡了。
终端输入

nvidia-smi

出现如图信息,说明安装成功。

赞 (1)

发表评论