Qwen3.5-9B部署实操：从nvidia-smi确认GPU可用到Model loaded成功

张开发

• 2026/4/17 14:35:37 • 15 分钟阅读

分享文章

Qwen3.5-9B部署实操从nvidia-smi确认GPU可用到Model loaded成功1. 项目概述Qwen3.5-9B是一款拥有90亿参数的开源大语言模型具备强大的逻辑推理、代码生成和多轮对话能力。该模型支持多模态理解图文输入和长上下文处理最高可达128K tokens是当前开源模型中的佼佼者。2. 环境准备2.1 硬件要求在开始部署前请确保你的服务器满足以下硬件要求GPU至少24GB显存的NVIDIA显卡如A10G、A100等内存建议64GB以上存储至少50GB可用空间模型文件约19GB2.2 软件环境本项目基于以下环境搭建Python3.9Conda环境torch28深度学习框架PyTorch 2.8.0Web界面Gradio 6.x进程管理Supervisor3. 部署步骤3.1 确认GPU可用性首先我们需要确认GPU是否可用nvidia-smi如果命令执行成功并显示GPU信息说明GPU驱动已正确安装。3.2 创建Conda环境conda create -n torch28 python3.9 conda activate torch28 pip install torch2.8.0 transformers5.0.0 gradio6.x huggingface_hub1.3.03.3 下载模型文件模型文件较大约19GB建议使用huggingface_hub下载from huggingface_hub import snapshot_download snapshot_download(repo_idQwen/Qwen3.5-9B, local_dir/root/ai-models/Qwen/Qwen3.5-9B)3.4 项目结构准备创建项目目录并准备必要文件/root/qwen3.5-9b/ ├── app.py # 主程序 (Gradio WebUI) ├── start.sh # 启动脚本 ├── service.log # 运行日志 └── history.json # 对话历史记录4. 服务配置4.1 Supervisor配置创建Supervisor配置文件/etc/supervisor/conf.d/qwen3.5-9b.conf[program:qwen3.5-9b] command/bin/bash /root/qwen3.5-9b/start.sh directory/root/qwen3.5-9b environmentHOME/root,USERroot,LOGNAMEroot,SHELL/bin/bash,PATH/opt/miniconda3/envs/torch28/bin:/usr/bin:/bin userroot autostarttrue autorestarttrue startsecs30 startretries3 redirect_stderrtrue stdout_logfile/root/qwen3.5-9b/service.log stopasgrouptrue killasgrouptrue4.2 启动脚本创建启动脚本/root/qwen3.5-9b/start.sh#!/bin/bash source /opt/miniconda3/etc/profile.d/conda.sh conda activate torch28 python /root/qwen3.5-9b/app.py记得给脚本添加执行权限chmod x /root/qwen3.5-9b/start.sh5. 服务管理5.1 常用命令# 查看服务状态 supervisorctl status qwen3.5-9b # 重启服务 supervisorctl restart qwen3.5-9b # 停止服务 supervisorctl stop qwen3.5-9b # 查看实时日志 tail -f /root/qwen3.5-9b/service.log5.2 服务启动更新Supervisor配置并启动服务supervisorctl reread supervisorctl update supervisorctl start qwen3.5-9b6. 功能验证6.1 访问Web界面服务启动后可以通过以下地址访问本地访问: http://localhost:7860网络访问: http://服务器IP:78606.2 功能测试文本对话测试在输入框输入问题点击Send或按回车等待模型回复图片分析测试在右侧Upload Image上传图片在输入框描述你想问的问题如这张图片里有什么点击Send7. 常见问题排查7.1 模型加载慢/卡住模型文件较大首次加载可能需要2-3分钟。可以通过以下命令检查加载进度grep Loading weights /root/qwen3.5-9b/service.log7.2 端口被占用如果7860端口被占用可以修改app.py中的端口号或释放该端口# 检查端口占用 ss -tlnp | grep 7860 # 查看哪个进程占用 lsof -i :78607.3 图片上传无响应可能原因及解决方法图片格式不支持尝试转换为PNG/JPEG格式图片文件损坏重新上传或更换图片网络请求超时尝试较小尺寸的图片8. 日常维护8.1 清理对话历史rm -f /root/qwen3.5-9b/history.json supervisorctl restart qwen3.5-9b8.2 日志管理# 备份当前日志 cp /root/qwen3.5-9b/service.log /root/qwen3.5-9b/service.log.bak # 清空日志 /root/qwen3.5-9b/service.log9. 总结通过本文的详细步骤你应该已经成功部署了Qwen3.5-9B模型并验证了其功能。这个强大的开源模型可以用于多种场景包括智能对话、代码生成和图片理解等。如果在部署过程中遇到任何问题可以参考本文的故障排查部分或查看服务日志获取更多信息。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

Qwen3.5-9B部署实操：从nvidia-smi确认GPU可用到Model loaded成功

最新文章

从拖延到高效：Super Productivity如何重塑你的时间管理系统

智能纹理优化引擎：游戏与Web开发的性能加速解决方案

别再只用Send/Recv了！聊聊RDMA里真正‘秀肌肉’的Write/Read操作

Joy-Con Toolkit：毫秒级响应与HID协议逆向工程的高性能手柄控制架构解析

完整指南：高效管理你的游戏库 - Playnite便携版深度解析

基恩士PLC上位链路通讯避坑指南：C# TCP/IP编程中那些官方文档没细说的坑

推荐文章

VINS-fusion实战：从Euroc到KITTI，手把手教你配置与避坑（附EVO评估全流程）

为了过等保，我们给200+服务器做了OpenSSH 10.0自动化升级，这是完整复盘

【信息安全概论实验报告1】隐写技术

明明知道该做什么，却总提不起劲？蕙兰瑜伽告诉你：不是你懒，是你忘了自己是谁

【2026奇点大会Prompt工程权威指南】：全球仅37位主讲人亲授的5大高阶提示范式与实战避坑清单

工业大模型≠智能工厂！SITS2026曝光的12个AI原生落地陷阱，第9个正在吞噬你的技改预算

相关文章

深入解析ZeroMQ inproc：线程间通信的高效实现与性能优势

BewlyBewly终极指南：打造高效个性化的B站浏览体验

IDM激活脚本架构设计：基于注册表锁定机制的99%成功率激活方案

Sulpho-Methyltetrazine-NHS ester，磺化甲基四嗪-琥珀酰亚胺酯的结构特点与功能

3步精通Zotero OCR：从安装到高效文本识别

OpCore-Simplify：驯服硬件兼容性的自动化引擎

分享文章

更多文章

OpenClaw实用工具指南-最实用的工具清单

09_Claude Code之Git集成与代码审查工作流

HDFS高可用实战：3节点JournalNode集群搭建与性能调优指南

Delphi网络编程实战：UDP通信与多线程网络优化详解

CVPR 2026｜SpaceDrive：让自动驾驶VLM真正具备三维空间意识

告别重复造轮子：用快马AI一键生成SpringBoot通用后台管理模块

Java开发者指南：CV_UNet图像着色模型集成实战

新谈设计模式 Chapter 03 — 抽象工厂模式 Abstract Factory

Step3-VL-10B模型安全防护：对抗样本防御实战

终极Redis可视化工具：Another Redis Desktop Manager完全使用指南

无人机射频通信中的智能抗干扰技术演进

大模型之Function Calling

Qwen3.5-9B部署实操：从nvidia-smi确认GPU可用到Model loaded成功

最新文章

从拖延到高效：Super Productivity如何重塑你的时间管理系统

智能纹理优化引擎：游戏与Web开发的性能加速解决方案

别再只用Send/Recv了！聊聊RDMA里真正‘秀肌肉’的Write/Read操作

Joy-Con Toolkit：毫秒级响应与HID协议逆向工程的高性能手柄控制架构解析

完整指南：高效管理你的游戏库 - Playnite便携版深度解析

基恩士PLC上位链路通讯避坑指南：C# TCP/IP编程中那些官方文档没细说的坑

推荐文章

VINS-fusion实战：从Euroc到KITTI，手把手教你配置与避坑（附EVO评估全流程）

为了过等保，我们给200+服务器做了OpenSSH 10.0自动化升级，这是完整复盘

【信息安全概论 实验报告1】隐写技术

明明知道该做什么，却总提不起劲？蕙兰瑜伽告诉你：不是你懒，是你忘了自己是谁

【2026奇点大会Prompt工程权威指南】：全球仅37位主讲人亲授的5大高阶提示范式与实战避坑清单

工业大模型≠智能工厂！SITS2026曝光的12个AI原生落地陷阱，第9个正在吞噬你的技改预算

相关文章

深入解析ZeroMQ inproc：线程间通信的高效实现与性能优势

BewlyBewly终极指南：打造高效个性化的B站浏览体验

IDM激活脚本架构设计：基于注册表锁定机制的99%成功率激活方案

Sulpho-Methyltetrazine-NHS ester，磺化甲基四嗪-琥珀酰亚胺酯的结构特点与功能

3步精通Zotero OCR：从安装到高效文本识别

OpCore-Simplify：驯服硬件兼容性的自动化引擎

分享文章

更多文章

【信息安全概论实验报告1】隐写技术