AI搭建
目录
简介
经常刷抖音会刷到搭建 ai 之类的, 一直不想看. 觉得自己不会搭建, 结果今天公司就说要搭建一个试试…
初步了解:
搭建
下载 Releases · ollama/ollama, tar xf ollama-linux-amd64.tgz
解压后 mv bin/ollama /usr/bin/ollama
使用守护进程启动 vim /etc/systemd/system/ollama.service
[Unit]
Description=Ollama Service
After=network-online.target
[Service]
ExecStart=/usr/bin/ollama serve
User=root
Group=root
Restart=always
RestartSec=3
Environment="PATH=$PATH"
[Install]
WantedBy=default.target
开机运行 systemctl daemon-reload ; systemctl enable ollama --now
理论上来说只需要运行 ollama run deepseek-r1:7b
即可在控制台使用模型, 但是有网络问题
omdd 使用
- 下载 omdd
omdd get qwen2.5-coder:3b
拿到链接, 把manifest
和所有layer
都下载下来, 这时候在文件夹里有了sha256:aa
和manifest
文件- 执行安装
omdd install --model=mymodel --blobsPath=./
ollama run mymodel:latest
其实就是通过 omdd 把 layer 和 manifest 下载下来, 然后放到 ollama 的目录下, ollama 就能检测并运行起来
ollama 导入 gguf 模型
- 创建一个目录, 把下载的 GGUF 模型放在这里
vim Modelfile
, 写上FROM ./mymodel.gguf
ollama create mymodel
创建ollama run mymodel:latest
调用 gpu
- 在机器上安装 nvdia 和 cuda 驱动
- 运行模型
ollama run dr7:latest
- 查看
ollama ps
的PROCESSOR
,100% CPU
代表全是 cpu 计算 - 如果使用了 gpu, 可以用
nvidia-smi
查看 gpu 利用率