AI学习笔记(01)--环境安装

硬件准备

  • CPU: 10900T
  • 内存: DDR4 48G
  • GPU: NVIDIA T4(8G)

环境安装

我是在Linux 环境下,使用Docker作为环境
镜像使用的是自己写的一个,里面安装集成好了CUDA和conda

# 使用官方的 CUDA 基础镜像
FROM nvidia/cuda:12.6.3-cudnn-devel-ubuntu22.04

# 设置环境变量为中文
ENV LANG=zh_CN.UTF-8
ENV LC_ALL=zh_CN.UTF-8

# 更新系统并安装必要的软件包
RUN apt-get update && apt-get install -y \
    locales \
    ssh \
    wget \
    bzip2 curl git vim openssh-server\
    && apt-get clean \
    && rm -rf /var/lib/apt/lists/*

# 生成 locales
RUN locale-gen zh_CN.UTF-8

# 安装 Miniconda
RUN wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O /tmp/miniconda.sh && \
    bash /tmp/miniconda.sh -b -p /opt/conda && \
    rm /tmp/miniconda.sh
RUN echo "channels:\n  - defaults\nshow_channel_urls: true\ndefault_channels:\n  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main\n  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r\n  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2\ncustom_channels:\n  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud\n  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud" > /root/.condarc

# 设置 Conda 路径
ENV PATH=/opt/conda/bin:$PATH

# 镜像设置
RUN conda clean -i -y
RUN python -m pip install --upgrade pip && pip config set global.index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple
RUN conda init bash

# 启用 SSH 服务
RUN mkdir /var/run/sshd
RUN echo 'root:root1234' | chpasswd  # 设置 SSH 密码

RUN 

# 允许 SSH 登录
RUN sed -i 's/#PermitRootLogin prohibit-password/PermitRootLogin yes/' /etc/ssh/sshd_config
RUN sed -i 's/#PasswordAuthentication yes/PasswordAuthentication yes/' /etc/ssh/sshd_config

EXPOSE 22


# 设置工作目录
WORKDIR /workspace

# 启动 SSH 服务
CMD ["/usr/sbin/sshd", "-D"]

启动镜像

docker run -it --gpus all --name=cuda_dev ccr.ccs.tencentyun.com/guiyunweb/cuda-dev bash

截屏2025-01-03 11.44.40.png

模式依赖

进入容器内容,进行依赖安装

docker exec -it cuda_dev bash
# 安装环境
conda create -n ai_study python=3.10
# 切换环境
conda activate ai_study
# 安装依赖
conda install numpy  matplotlib

这两个是将来会用到的两个依赖

  • numpy 提供了强大的数组和矩阵操作,与 PyTorch 的张量操作兼容,常用于数据处理和转换。
  • matplotlib: 可视化训练过程中的损失曲线、模型输出、数据分布等;

安装框架

AI的学习的框架打算使用 Pytorch,使用简单而且使用的人比较多

#框架安装
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia

创建一个torch_version.py,写入如下文件

import torch
print(torch.__version__)

运行这个文件,打印pytorch的版本。看是否安装成功
截屏2025-01-03 11.33.38.png

版本号打印成功就代表pytorch版本安装好了


AI学习笔记(01)--环境安装
https://guiyunweb.com/archives/1735872515671
作者
归云
发布于
2025年01月03日
许可协议