OpenClaw对接千问3.5-35B-A3B-FP8实战:本地部署与多模态任务自动化

张开发
2026/4/7 12:49:41 15 分钟阅读

分享文章

OpenClaw对接千问3.5-35B-A3B-FP8实战:本地部署与多模态任务自动化
OpenClaw对接千问3.5-35B-A3B-FP8实战本地部署与多模态任务自动化1. 为什么选择OpenClaw千问3.5组合去年冬天第一次听说OpenClaw时我正被重复性的截图标注工作折磨——每天需要手动整理上百张产品截图并分类归档。当时尝试过几个自动化工具要么权限控制太死板要么需要编写复杂脚本。直到发现OpenClaw这个能直接操控鼠标键盘的AI智能体框架配合千问3.5的多模态理解能力终于实现了看图说话式的自动化流程。这个组合最吸引我的三个特点真·本地化所有操作都在本机完成客户数据不用上传第三方多模态联动截图后直接让模型分析内容省去人工描述环节自然语言交互用聊天的方式下达复杂指令不用学新语法不过实际部署时也踩了不少坑特别是在Windows和macOS双平台配置模型地址那段。下面就把完整过程拆解给大家包括那些官方文档没写的细节。2. 双平台安装指南2.1 macOS篇从零到一键启动我的主力机是M1 MacBook Pro记录下最稳定的安装路径# 先清理可能存在的旧版本避免冲突 sudo npm uninstall -g openclaw brew uninstall node # 全新安装Node环境建议LTS版本 brew install node20 echo export PATH/opt/homebrew/opt/node20/bin:$PATH ~/.zshrc source ~/.zshrc # 官方镜像安装国内用户可用清华源 npm config set registry https://registry.npmmirror.com npm install -g openclawlatest安装完成后别急着启动先处理一个关键依赖——Chromium。OpenClaw的浏览器操作需要完整Chromium环境但国内网络安装经常卡住# 手动下载Chromium cd ~/.openclaw wget https://storage.googleapis.com/chromium-browser-snapshots/Mac/1147611/chrome-mac.zip unzip chrome-mac.zip mv chrome-mac Chromium2.2 Windows篇管理员权限的那些坑在同事的Windows 11机器上测试时遇到了更棘手的权限问题。关键步骤以管理员身份启动PowerShell先执行策略变更否则脚本无法运行Set-ExecutionPolicy RemoteSigned -Scope CurrentUser安装时务必关闭杀毒软件实时防护特别是某数字卫士安装后手动添加环境变量[Environment]::SetEnvironmentVariable(PATH, $env:PATH;C:\Users\你的用户名\AppData\Roaming\npm, User)3. 对接千问3.5模型实战3.1 获取模型访问权限假设你已经通过星图平台部署好千问3.5-35B-A3B-FP8镜像拿到两类关键信息模型API地址如http://localhost:8080/v1API密钥通常位于容器内/etc/qwen/config.yaml3.2 关键配置openclaw.json详解配置文件位于~/.openclaw/openclaw.json需要新增自定义模型配置{ models: { providers: { qwen35-multimodal: { baseUrl: http://localhost:8080/v1, apiKey: 你的实际API_KEY, api: openai-completions, models: [ { id: qwen3.5-35b-a3b-fp8, name: 千问多模态版, contextWindow: 32768, vision: true } ] } } } }特别注意vision: true这个字段没有它就无法启用图片理解功能。我第一次配置时漏了这个结果图片上传后模型只会回复我收到了一张图片...3.3 网关服务启动验证启动时建议带上调试参数openclaw gateway --port 18789 --log-level debug健康检查的终极验证方式是同时发起文本和图片请求# 文本测试 curl -X POST http://localhost:18789/v1/chat/completions \ -H Content-Type: application/json \ -d { model: qwen3.5-35b-a3b-fp8, messages: [{role: user, content: 用鲁迅风格描述今天的天气}] } # 图片测试先准备一张test.jpg BASE64_IMG$(base64 -i test.jpg | tr -d \n) curl -X POST http://localhost:18789/v1/chat/completions \ -H Content-Type: application/json \ -d { model: qwen3.5-35b-a3b-fp8, messages: [{ role: user, content: [ {type: text, text: 这张图片的主要内容是什么}, {type: image_url, image_url: {url: data:image/jpeg;base64,$BASE64_IMG}} ] }] }4. 多模态任务自动化演示4.1 场景自动整理截图文件夹我在~/Downloads/screenshots下存放着零散的截图现在要实现自动监控该文件夹对新图片进行内容分析按主题自动分类到子文件夹实现步骤安装文件监控技能clawhub install file-monitor创建自动化规则文件~/.openclaw/skills/screenshot_organizer.yamltriggers: - type: filesystem path: ~/Downloads/screenshots events: [create] actions: - type: model model: qwen3.5-35b-a3b-fp8 prompt: | 这是一张软件截图请用3-5个关键词描述其内容主题 输出格式为纯文本用逗号分隔例如设计稿,UI,按钮 图片内容{{file.content}} - type: filesystem command: move source: {{file.path}} target: ~/Downloads/screenshots/{{model_response}}/{{file.name}}4.2 进阶会议纪要生成器更复杂的例子——在飞书会议中自动截图并生成摘要配置飞书机器人接收会议消息当检测到会议结束关键词时自动截取飞书窗口识别截图中的讨论要点生成Markdown格式纪要上传到指定Notion数据库这个流程需要组合多个技能模块核心在于模型调用部分actions: - type: screenshot target: 飞书 output: /tmp/meeting.png - type: model model: qwen3.5-35b-a3b-fp8 prompt: | 这是一张会议截图请完成 1. 提取讨论的3个核心议题 2. 列出待办事项 3. 用markdown格式输出 图片内容{{file.content}} - type: notion database_id: {{env.NOTION_DB}} content: {{model_response}}5. 避坑指南我遇到的五个典型问题截图黑屏问题macOS上需要额外权限sudo sqlite3 /Library/Application\ Support/com.apple.TCC/TCC.db \ INSERT INTO access VALUES(kTCCServiceScreenCapture,com.openclaw,0,1,1,NULL,NULL,NULL,UNUSED,NULL,0,UNIXEPOCH());中文乱码在网关启动前设置export LANGzh_CN.UTF-8模型响应慢修改openclaw.json增加超时设置timeout: 300000图片上传失败需要调整默认大小限制openclaw gateway --max-file-size 20MB技能安装冲突建议每个项目用独立环境mkdir my_automation cd my_automation npm init -y npm install specific/skill6. 安全使用建议虽然OpenClaw很强大但给它开放系统权限就像给管家你家钥匙。我的安全守则沙盒测试新技能先在虚拟机测试权限隔离单独创建低权限系统账户操作确认关键操作前要求人工确认日志审计启用详细日志并定期检查网络隔离模型服务不要暴露在公网获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

更多文章