deer-flow 2.0部署+调用本地大模型教程（基于vllm）

张开发

• 2026/5/25 9:06:01 • 15 分钟阅读

分享文章

deer-flow部署调用本地大模型教程基于vllm部署deer-flow执行流程拉取最新代码gitclone https://github.com/bytedance/deer-flow切换到代码目录cddeer-flow配置环境makeinstall安装完成后执行makecheck显示如下配置启动配置文件makeconfig执行完会在根目录生成config.yaml文件修改配置文件将config.yaml中models部分替换成自己部署的模型models: - name: local-vllm display_name: Local vLLM use: langchain_openai:ChatOpenAI model: qwen3 api_key: dummy_key base_url: http://your-vllm-host:port/v1启动服务makestart启动成功显示如下vllm部署本地大模型以qwen3-8B 为例显存占用44G执行流程安装vllmpipinstall-Uvllm\--pre\--extra-index-url https://wheels.vllm.ai/nightly下载qwen3-8B模型exportHF_ENDPOINThttps://hf-mirror.com huggingface-cli download --resume-download Qwen/Qwen3-8B --local-dir qwen3注意–local-dir名字和后面的服务启动deer-flow配置相关启动服务vllm serve qwen3--port8866--max_model_len16384--reasoning-parser deepseek_r1 --enable-auto-tool-choice --tool-call-parser hermes注意–max_model_len 必须设置否则在deer-flow调用时会报400bad request部署完并调用成功界面如下如有疑问欢迎评论区交流

更多文章

前端开发 2026/5/25 9:04:05

3个核心价值让英雄联盟玩家实现效率提升与实战应用突破

3个核心价值让英雄联盟玩家实现效率提升与实战应用突破【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 你是否曾因BP阶段信息不足而选错英雄&a…

张开发

前端开发 2026/5/24 22:11:29

基于遗传算法优化BP神经网络的边坡稳定性预测附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。👇 关注我领取海量matlab电子书和数学建模资料🍊个人信条：格物致知,完整Matl…

张开发

前端开发 2026/5/25 9:09:18

intv_ai_mk11应用场景：为政府基层单位生成政策解读简报、为制造业写设备操作SOP、为律所起草合同条款草稿

intv_ai_mk11 AI对话机器人在专业场景的三大应用实践 1. 应用场景概览 intv_ai_mk11 AI对话机器人是一款基于7B参数Llama架构的智能助手，能够通过自然语言交互完成多种专业任务。本文将重点介绍其在三个专业领域的实际应用： 为政府基层单位生成政策解…

张开发

前端开发 2026/5/24 13:30:11

OpenClaw压力测试：Qwen3.5-9B持续运行48小时稳定性报告

OpenClaw压力测试：Qwen3.5-9B持续运行48小时稳定性报告 1. 测试背景与设计思路去年冬天的一个深夜，我正在调试一个自动化文档处理流程，突然发现OpenClaw在连续工作6小时后开始出现响应迟缓。这让我意识到：个人自动化工具也需要…

张开发

前端开发 2026/5/24 13:24:17

K8s 部署 Redis 哨兵集群：主从自动切换 + 高可用实战全攻略

一、Redis 哨兵集群是什么？Redis 主从复制保证了数据的冗余备份，但如果主节点挂了，需要人工介入手动切换——在生产环境这是不可接受的。Redis Sentinel（哨兵）就是来解决这个问题的：监控（Monito…

张开发

前端开发 2026/5/25 9:08:41

Java自定义二进制协议解析崩溃频发（内存溢出/粘包/拆包失效全场景复现与军工级防御方案）

第一章：Java自定义二进制协议解析崩溃频发（内存溢出/粘包/拆包失效全场景复现与军工级防御方案）典型崩溃场景复现在高吞吐低延迟的军工通信中间件中，Java服务端频繁遭遇 OutOfMemoryError: Direct buffer memory 及 IndexOutOfBo…

张开发

前端开发 2026/5/25 6:54:45

Full Page Screen Capture技术深度解析：构建高效网页截图解决方案的架构设计与性能优化

Full Page Screen Capture技术深度解析：构建高效网页截图解决方案的架构设计与性能优化【免费下载链接】full-page-screen-capture-chrome-extension One-click full page screen captures in Google Chrome 项目地址: https://gitcode.com/gh_mirrors/fu/full-p…

张开发

前端开发 2026/5/24 15:50:59

你的机械键盘连击问题，有更聪明的解决方案吗？

你的机械键盘连击问题，有更聪明的解决方案吗？ 【免费下载链接】KeyboardChatterBlocker A handy quick tool for blocking mechanical keyboard chatter. 项目地址: https://gitcode.com/gh_mirrors/ke/KeyboardChatterBlocker 当你打字时"h…

张开发

前端开发 2026/5/18 15:38:29

用快马快速原型验证：vlookup跨表数据匹配的交互式demo

最近在做一个数据分析项目时，遇到了一个很常见的需求：需要把两个Excel表格中的数据根据某个关键字段进行匹配。具体来说，表格A记录了学生的学号和姓名，表格B记录了学号和成绩，我需要把这两个表格合并起来。这让我想到了…

张开发

前端开发 2026/5/18 21:46:22

开篇：为什么AI开发需要Anaconda与环境标准化？

开篇：为什么AI开发需要Anaconda与环境标准化？上周深夜，团队里一位刚入行的同事在Slack上扔过来一串报错：ImportError: libcudart.so.11.0: cannot open shared object file。他跟着GitHub上一个热门仓库的README操作，明明本地有CUDA，PyTorch却死活认不出来。我让他跑co…

张开发

前端开发 2026/5/18 14:12:12

douyin-downloader: 音视频资源高效获取工具内容创作者的批量下载解决方案

douyin-downloader: 音视频资源高效获取工具内容创作者的批量下载解决方案【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallb…

张开发

前端开发 2026/5/18 11:47:19

crash调试技巧

crash 判断互锁第一步：定位阻塞进程死锁进程通常处于 D (UNINTERRUPTIBLE) 状态。 # 列出所有D状态进程 crash> foreach UN ps或 crash> ps | grep UN关键特征： 大量进程长时间卡在 D 状态WCHAN 列显示 mutex_lock、rwsem_down_*、spin_* 等…

张开发

deer-flow 2.0部署+调用本地大模型教程（基于vllm）

最新文章

FPGA异步FIFO读写位宽转换实战：从8bit到32bit的数据拼接与拆分（Vivado+Modelsim）

从图像模糊到语音识别：卷积在AI中的实战应用与Python代码示例

车载OTA升级中Docker层缓存失效导致回滚失败？3步构建可复现、可签名、可审计的分层镜像流水线（含Sigstore+Notary v2集成）

盛合晶微科创板上市，开盘市值近1858亿，无锡国资投资回报率超600%

如何用AI大模型技术一键批量生成和发布短视频？MoneyPrinterPlus全攻略

一张“网”如何拯救生命？浅谈医疗系统集成平台iPaaS

推荐文章

相关文章

分享文章

更多文章

3个核心价值让英雄联盟玩家实现效率提升与实战应用突破

基于遗传算法优化BP神经网络的边坡稳定性预测附Matlab代码

intv_ai_mk11应用场景：为政府基层单位生成政策解读简报、为制造业写设备操作SOP、为律所起草合同条款草稿

OpenClaw压力测试：Qwen3.5-9B持续运行48小时稳定性报告

K8s 部署 Redis 哨兵集群：主从自动切换 + 高可用实战全攻略

Java自定义二进制协议解析崩溃频发（内存溢出/粘包/拆包失效全场景复现与军工级防御方案）

Full Page Screen Capture技术深度解析：构建高效网页截图解决方案的架构设计与性能优化

你的机械键盘连击问题，有更聪明的解决方案吗？

用快马快速原型验证：vlookup跨表数据匹配的交互式demo

开篇：为什么AI开发需要Anaconda与环境标准化？

douyin-downloader: 音视频资源高效获取工具内容创作者的批量下载解决方案

crash调试技巧