AI Agent：大模型+工具的智能革命

张开发

• 2026/4/8 17:27:28 • 15 分钟阅读

分享文章

文章目录大模型和AI Agent1. 大模型(本身)的缺点:2. AI AgentDify1. Dify能做什么2. 安装Dify3. Dify安装大模型提示词工程1. 什么是提示词2. Dify中应用提示词RAG1. 什么是RAG2. 知识库构建3. 让Agent应用知识库Function Calling工具/插件1. 什么是Function Calling2. 为什么需要 Function Call 功能3. 自定义Function Call工作流大模型和AI Agent1. 大模型(本身)的缺点:无法联网:无法获取最新的知识知识过时:知识停留在训练的时间深度不足:缺乏专业的领域知识不能执行:无法完成实际操作传统大模型:被动相应,仅限训练数据,只能对话,单论回答,适合咨询回答2. AI AgentAI Agent 就是智能体,一个能够干活的AI管家智能体能够独立思考和决策能够调用各种外部知识能够才接并执行复杂任务AI Agent:能够主动执行,可实时搜索,可调用工具,多步规划,适合实际业务AI Agent 大模型工具注意:智能体不是未来,他已经在真实的场景里面产生了实际的价值!!正在发生一些生产力的革命DifyDify是一个开源的大语言模型(LLM)应用开发平台,旨在简洁和加速生成式AI应用的创建和部署.低代码/无代码:不需要写代码,像拖拽积木一样编排业务逻辑功能完整强大:支持100主流模型接入,满足各种企业级场景开源免费:支持私有化部署官网地址:https://dify.ai/zh1. Dify能做什么能做聊天助手:快速构建具备上文理解能力的对话机器人,支持多轮对话知识库:轻松接入企业私有文档,实现基于自有知识的精准回答工作流:通过可视化画布编排复杂的业务逻辑,实现任务自动化Agent智能体:构建能够自主调用工具,拆解并完成复杂任务的只能助手2. 安装Dify2.1. 安装Docker,企业一般会安装在Linux中下载官方docker后根据指示安装docker,验证:能够显示相应的版本即安装成功!docker--versiondocker-compose--version2.2. 下载Dify代码Github地址: https://github.com/langgenius/dify.git下载后将此文件夹放在服务器你想安装的位置! 然后unzip(解压)文件, 进入docker文件夹,修改下图的文件.注意下图是在服务器中的操作!!!等docker全部安装成功后,访问应用: http://localhost/signin;设置好邮箱,用户名,密码就可以登录了.3. Dify安装大模型3.1. 安装OllamaOllama是一个开源的本地大模型运行框架,用于本地部署、管理和运行各类开源LLM模型下载地址https://ollama.com/download3.2 安装模型一定要根据自己的电脑性能选择模型选择模型后发送消息如果没有模型他会自动下载模型3.3 Dify中配置ollama登录到Dify的页面第一步点击右上角的用户头像第二步点击设置选择模型供应商进入Dify市场中安装ollama应用商然后返回Dify的模型列表在ollama模型中点击添加模型添加模型时写好模型名称一定要与下载的模型名称一致模型类别一般为LLM基础URL如果为本地可以使用docker容器名指定http://host.docker.internal:114343.4 接入在线模型比如接入阿里云百炼可以登录阿里云创建API Key 然后将API Key复制一下再回到Dify中安装通义模型配置Key起个名字即可。比较简单不配图说明了详细可以百度提示词工程1. 什么是提示词提示词与AI沟通的说明书提示词Prompt就是你给AI下达的指令或者提出的问题。提示词越清晰、具体AI的表现就越好。提示词是搭建智能体的初始设定没有一个好的提示词再好的大模型也发挥不出来你想要的结果提示词4个关键要素角色定位明确Bot智能体的身份建立专业形象让Bot扮演某种角色角色越具体回复越专业好的示例职业身份你是一位有15年经验的职业HR 专业领域擅长处理敏感的人际关系问题性格特征温和、专业、善于共情差的示例职业身份你是一个助手专业领域什么都懂一点性格特征随便聊聊技能描述清晰的目标让Bot知道做什么描述清楚具体的场景具体的任务好的示例帮助用户生成高情商的职场回复针对老板批评、同事冲突等场景给出3种不同风格的回复方案差的示例帮助用户回答问题输出格式结构化回复要求确保输出规范好的输出格式按以下格式输出 1.情况分析50字 2.回复建议3条每条30字 3.完整范文150字差的输出格式随便回复就行约束条件限制不当行为保证安全合规约束内容和约束风格内容约束避免敏感话题政治、宗教避免冒犯性语言不提供未证实的信息风格约束语气诚恳但不卑微避免过渡道歉保持专业性完整示例对比好的提示词你是电商平台“小蜜”客服助手。角色定位负责解答尺码、物流、退换货问题。技能描述回复需先给结论再分点说明每条不超过30字。输出格式禁止回答无关话题纠纷请转人工客服。约束条件差的提示词你是客服回答用户问题态度好一点。2. Dify中应用提示词Dify中包含两种提示词用户提示词和系统提示词Dify中设置提示词先自己编写然后AI大模型优化标准的提示词构成结构化提示词角色目标示例格式效果最佳RAG1. 什么是RAGLLM存在的问题知识过时无法回答用户体验差价值大打折扣解决方案RAGRetrieval-Augmented Generation检索增强技术RAG是一种结合知识检索和语言生成的人工智能技术主要用于解决大语言模型的幻觉问题模型幻觉问题大模型无法回答问题或者回答的问题是错的。RAG可以有效缓解幻觉问题基本原理在生成回答时先从知识库中检索相关文档将检索到的文档与原始问题一起输入LLMLLM基于检索内容生成最终答案。这里要先对自己的知识进行Embedding切片然后存入向量数据库知识库问问题时先将问题进行向量化然后去向量数据库进行向量匹配匹配到的内容获取几个得分最高的片段连同问题一起给大模型2. 知识库构建大模型原生知识有时效差、易幻觉、装不下私域 / 专业内容知识库 RAG是让 Agent「懂业务、说真话、答精准、能落地」的底层基建答案有据可依。2.1. 文档准备文档类型支持PDF、Word、TXT表格类型 Excel、CSV文档一定要进行预处理清理无关内容广告、水印按主题分类整理文件命名规范含关键信息2.2. 文档切片为了适应大语言模型的上下文长度限制并提升检索的精准度和效率。切分方式按字符数切分固定长度如每300字一段按符号切分按照句号、换行符、感叹号等按语义切分识别主题变化点智能切分使用模型进行识别一般选择方式按照符号和字符长度一块切分一般200-500字/段长度太小上下文不完整检索不准长度太大无关信息过多干扰判断3.3. 文档向量化将切分后的文本进行向量数字化便于计算问题和文档的相似性向量化作用语义理解相似度计算快速检索3. 让Agent应用知识库创建空白应用构建Agent智能体构建提示词选择知识库结果验证Function Calling工具/插件1. 什么是Function CallingFunction Calling又称工具或插件2023年6月13日OpenAI公布了Function Call 函数调用功能该功能指的是在语言模型中集成外部功能或API的调用能力这意味着模型可以在生成文本的过程中调用外部函数或服务获取额外的数据或执行特定的任务。说白了Function Calling就是代码中的一个方法只需要将方法参数以及方法描述写清楚调用大模型的时候将此方法传过去大模型会自己判断需不需要调用大模型本身不执行工具他只负责决策以及参数的生成流程当用户输入一个问题时大模型会判断用户的问题是否能够直接回答如果能够直接回答就返回结果。如果不能直接回答他会有一个决策的过程首先他会匹配外部的API选择合适的外部API并且生成调用API所需要的参数根据API返回的结果再结合大模型本身生成回复给用户2. 为什么需要 Function Call 功能大模型训练的数据集无法包含最新的信息如最新的新闻、实时股价等。通过Function Call模型可以实时获取最新的数据提供更时效的服务大模型训练数据虽多但有限无法覆盖所有领域如医学、法律等领域的专业咨询Function Call允许模型调用外部数据库或API获取特定领域的详细信息。大模型虽然功能强大但不可能内置所有可能需要的功能。通过Function Call可以轻松扩展模型能力如调用外部工具进行复杂计算数据分析等。3. 自定义Function Call什么时候需要自定义插件官方插件没有我想要的功能付费插件费用太贵想连接特定的第三方API服务需要对接企业内部系统自定义插件基本流程脚本开发- 运行脚本- 创建工具- Schema操作- 测试- 保存注意工具需要有鉴权方法需要Bearer并且需要根据OpenAI的规范编写Schema里面写好调用方法的URLDify中插件是一个工具集包含一个或多个工具每一个工具就是一个可调用的API核心机制大模型通过阅读【插件描述】来决定是否调用该插件工作流工作流业务逻辑的可视化执行工作流的作用它将一个复杂的任务分解成一系列可管理的、按顺序或按条件执行的步骤并通过图形化的界面将这些步骤连接起来Agent 自主决策的AI助手ReAct形式思考- 行动- 观察- 再思考- …循环往复直到能够给出用户的答案自主规划动态制定执行计划根据环境反馈实时调整路径工具选择灵活调用外部工具库AIP、数据库、搜索等完成任务推理能力具备多轮思考与自我纠错能力处理复杂逻辑灵活但贵智能化程度极高但Token消耗与响应延迟相对较高

更多文章

前端开发 2026/4/9 17:16:06

3步搞定：EmuDeck让Steam Deck变身终极怀旧游戏机

3步搞定：EmuDeck让Steam Deck变身终极怀旧游戏机【免费下载链接】EmuDeck Emulator configurator for Steam Deck 项目地址: https://gitcode.com/gh_mirrors/em/EmuDeck 还在为Steam Deck上复杂的模拟器配置而烦恼吗？EmuDeck正是为你量身打造的…

1. LVGL图像转换工具简介第一次接触LVGL图像转换工具时，我正为一个嵌入式项目头疼。客户要求UI界面必须流畅，但资源受限的MCU根本吃不消常规图片格式。直到发现这个神器，才明白原来图片还能这样玩。 LVGL图像转换工具（lv_img_con…

张开发

前端开发 2026/4/9 3:53:23

Windows下OpenClaw安装排雷：Qwen3-14b_int4_awq联调常见问题解决

Windows下OpenClaw安装排雷：Qwen3-14b_int4_awq联调常见问题解决 1. 为什么选择WindowsOpenClaw组合作为一个长期在Windows环境下工作的开发者，我一直在寻找能够提升本地自动化效率的工具。当我第一次听说OpenClaw这个开源AI智能体框架时，…

张开发

AI Agent：大模型+工具的智能革命

最新文章

OpenClaw 避坑指南：手把手教你从零搭建专属 AI 智能体

Universal Control Remapper：游戏控制映射的终极解决方案

ModbusTool：解决工业通信调试难题的全能测试工具

Winhance中文版：Windows系统优化与个性化的一站式解决方案 [特殊字符]

[Linux][虚拟串口]x一个特殊的字节贤

“INMS: Memory Sharing for Large Language Model based Agents“ 论文笔记讶

推荐文章

AVR长周期看门狗库：突破8秒限制实现毫秒级精准复位与睡眠唤醒

并发控制原理与实现：从进程线程到现代并发编程

HunyuanVideo-Foley开源大模型实战：基于Transformers/Accelerate推理优化

小步快跑・像CPU一样调度大脑高并发——东方仙盟・阿雪心学

STM8 Bootloader开发与固件远程升级实践

（复现）基于自适应滑模控制（ASMC）和神经网络容错控制的主从式无人机编队控制研究（Matlab代码实现）

相关文章

深入解析ZeroMQ inproc：线程间通信的高效实现与性能优势

BewlyBewly终极指南：打造高效个性化的B站浏览体验

IDM激活脚本架构设计：基于注册表锁定机制的99%成功率激活方案

Sulpho-Methyltetrazine-NHS ester，磺化甲基四嗪-琥珀酰亚胺酯的结构特点与功能

3步精通Zotero OCR：从安装到高效文本识别

OpCore-Simplify：驯服硬件兼容性的自动化引擎

分享文章

更多文章

3步搞定：EmuDeck让Steam Deck变身终极怀旧游戏机

如何高效使用ComfyUI-Easy-Use：提升AI绘画效率的完整解决方案

网易云音乐无损解析工具：高品质音乐收藏的终极解决方案

PPO算法实战避坑：为什么你的智能体‘学废了’？从重要性采样到Clip技巧的深度解析

AI赋能前端设计：使用快马平台智能生成旅行博客网站首页

PX4+Gazebo仿真：从键盘指令到无人机轨迹的Offboard控制实践

WRF单域模拟实战：从数据准备到结果可视化

仙境传说RO：自定义商店脚本全解析与实战指南

3步实现B站M4S格式转换：开源工具全流程指南

当同人世界被屏蔽：一个普通读者的自救指南

LVGL图像转换工具：离线高效处理方案

Windows下OpenClaw安装排雷：Qwen3-14b_int4_awq联调常见问题解决