分类 综合 下的文章

1 硬件配置

使用学校的集群,相关配置如下:
CPU:鲲鹏920
NPU:昇腾910B
操作系统:openEuler 22.03

2 安装版本

根据昇腾官方gitee上的信息,Pytoch 2.1.0是长期支持版本,因此选择安装这一版本,从而最大限度避坑。
本教程选择的版本如下:
Python:3.9
Pytorch:2.1.0
选择依据:
1.PNG
2.PNG
参考链接:https://gitee.com/ascend/pytorch

3 安装步骤

1、新建conda环境。

conda create -n pytorch python=3.9

2、在新建好的conda环境中,安装基础的依赖。

pip install attrs cython numpy==1.24.0 decorator sympy cffi pyyaml pathlib2 psutil protobuf==3.20 scipy requests absl-py --user

参考链接:
https://www.hiascend.com/document/detail/zh/canncommercial/80RC3/softwareinst/instg/instg_0006.html?Mode=PmIns&OS=Ubuntu&Software=cannToolKit
3、安装Pytoch

wget https://download.pytorch.org/whl/cpu/torch-2.1.0-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl#sha256=de7d63c6ecece118684415a3dbd4805af4a4c1ee1490cccf7405d8c240a481b4

在上面建好的环境中pip install下载好的包。
4、安装pytorch-npu
方法一:手动查找对应关系。
首先确定自己的CANN版本。如果不知道用的是哪一个CANN,可以先Python一下,import torch这个包,然后看告警信息是哪个版本的。
确定好CANN版本后,从下表中手动查找对应的torch_npu版本。
3.PNG
方法二:自动匹配。
从以下网站,根据匹配结果下载:https://www.hiascend.com/developer/download/community/result?module=pt+cann&pt=6.0.RC3.beta1&cann=8.0.RC3.beta1
下载好指定版本后,使用pip install安装下载好的包即可
5、测试。
使用以下命令测试,如果正常输出结果,说明环境搭建成功。

python3 -c "import torch;import torch_npu; a = torch.randn(3, 4).npu(); print(a + a);"

结果如下:
4.PNG

简介
  我们经常使用ssh或telnet远程登陆到Linux服务器,而执行一些长时间任务如ftp传输,深度学习等任务时常常使我们感到头疼,因为我们不能关闭远程会话,否则进程会强制终止。screen可以很方便地处理这种情况,让我们可以放心地断开连接而让Linux服务器继续执行任务。下面介绍Linux非root用户如何安装配置screen。

安装screen
  root用户可以直接用yum install screen命令安装screen,但对于非root用户或无网络连接的情况,我们需要使用源码来安装screen。screen下载地址在这里,可选择最新版的下载。
  这里我选择最新版的screen-4.6.2.tar.gz下载,使用tar -zxvf screen-4.6.2.tar.gz -C screen-4.6.2解压到screen-4.6.2目录,目录下的INSTALL文件有安装教程。在该目录下,运行./configure --prefix=/home/username/screen_dir,其中--prefix后面是screen安装目录。执行该指令时,可能会出现如下错误:

configure: error: !!! no tgetent - no screen

这是没有安装ncurses依赖包的缘故,这时就需要先下载安装ncurses,其源码下载地址在这里。同样选择最新版的ncurses-6.1.tar.gz下载,下载后用tar指令解压,解压后用如下指令进行安装:

./configure --prefix=/home/username/ncurses_dir
make
make install
如果第一条命令运行后有Error,可用如下命令尝试替换:
./configure --prefix=/home/username/ncurses_dir --with-shared --without-debug --without-ada --enable-overwrite

这里安装到ncurses_dir,目录下有bin,include,lib,share目录,依赖包在lib目录下。接着切换到screen解压目录,执行如下指令:

export LDFLAGS=’-L/home/username/ncurses_dir/lib’
export CPPFLAGS=’-I/home/username/ncurses_dir/include’
./configure --prefix=’/home/username/screen_dir’
make
make install

这样就能将screen安装到screen_dir目录下了。接着在.bashrc文件里设置screen执行路径,加入export PATH=/home/username/screen_dir/bin:$PATH,接着执行source .bashrc更新PATH,在终端输入screen就能进入screen界面了。

screen使用相关
  screen用户手册可以查阅1或者2。

背景

在使用scp命令时,现有教程总是区分远端、本地,甚至区分发送、复制,导致每次使用时都记不住参数顺序,十分麻烦。本教程将统一和简化以上说法。

基本命令

scp -P port -r 想要操作的目录或者文件  想要保存的位置

命令讲解

只需要记住,第一个参数永远是想要操作的目录或者文件,第二个参数是想保存的位置,不需要刻意区分,只需要根据远端和近端调整写法即可。

命令示例

scp -P 26518 -r Result  root@218.123.69.7:/home/test/