第一次尝试微调

张开发

• 2026/6/21 23:01:35 • 15 分钟阅读

分享文章

一什么是微调相对专业的解释就是在已完成大规模预训练Pre-training的基础模型上使用特定任务、特定领域或特定格式的标注数据集进行进一步的参数优化训练使模型在保留通用知识与基础能力的前提下更好地适配下游具体任务提升任务精度、响应一致性与领域适配性。我个人的理解就是完成预训练的模型是一本百科全书样样通样样松然后我们要做的就是进行微调。将他在某个方面的能力变强。二微调的准备工作在虚拟环境中使用conda创建用于微调的环境并在这个环境中安装Jupyterlab和JupyterKernel。JupyterLab 是大模型微调时的交互式操作界面提供代码编辑、分步运行、文件管理和结果可视化的工作台方便调试微调流程、查看训练状态与实验记录而 Jupyter Kernel 是后台负责实际执行代码、管理运行环境与 GPU 资源、维护模型和变量显存状态的计算内核两者配合使用既能通过 JupyterLab 灵活操作微调流程又能依靠 Kernel 保证环境隔离、模型状态持久化大幅提升微调实验的调试效率与可复现性。还用到了vllm和unsloth起到了一个加速的作用。三微调先准备数据集数据集是大模型微调的“学习教材”决定了大模型最终能够学会的知识可以掌握的能力以及对话时的语气等这次主要使用AI生成了一个200条问答对的数据集以后会尝试更大更完全的数据集。然后通过脚本对模型进行微调以下是微调的结果微调前的微调后的四压力测试对微调后的模型进行压力测试核心目的是在高频率、长时间、多并发的模拟真实使用场景下验证模型是否能稳定运行不崩溃、回答逻辑不跑偏、输出内容不重复胡说同时检测模型的响应速度、显存占用和推理性能是否达标确保经过 LoRA 微调后的网安小助手在高强度、连续对话中依然保持专业、可靠、不掉线最终确认模型可以稳定投入实际使用。

第一次尝试微调

最新文章

FPGA异步FIFO读写位宽转换实战：从8bit到32bit的数据拼接与拆分（Vivado+Modelsim）

从图像模糊到语音识别：卷积在AI中的实战应用与Python代码示例

车载OTA升级中Docker层缓存失效导致回滚失败？3步构建可复现、可签名、可审计的分层镜像流水线（含Sigstore+Notary v2集成）

盛合晶微科创板上市，开盘市值近1858亿，无锡国资投资回报率超600%

如何用AI大模型技术一键批量生成和发布短视频？MoneyPrinterPlus全攻略

一张“网”如何拯救生命？浅谈医疗系统集成平台iPaaS

推荐文章

相关文章

分享文章

更多文章

生成式AI实时响应延迟突增？立即执行这7步链路压测诊断法（含eBPF追踪脚本模板）

【2026奇点智能技术大会机密报告】：基于278篇被拒论文训练的AI写作风险预测模型（准确率92.6%，仅限本届参会者解密）

嵌入式Linux老鸟的U-Boot内存操作秘籍：用md/mw/crc32命令快速诊断DDR与Flash问题

免费性价比拉满，2026实测会议纪要怎么记录，一年多赚1600还省30小时无效工时

W800开发板到手别慌，3天搞定开发环境与固件下载（保姆级避坑指南）

【2026年最新600套毕设项目分享】微信小程序的社区养老服务（30087）

AI应用投资正从“技术驱动”转向“现金流驱动”，SITS2026圆桌披露7家已实现6个月内正向LTV/CAC比的企业实操路径

告别Servo库！手把手教你用Arduino Nano的PWM引脚直接驱动舵机（附串口控制代码）

HarmonyOS6 半年磨一剑 - RcSlider 三方库插件尺寸系统与轨道渲染机制深度剖析

ESP32物联网开发终极指南：Arduino核心快速上手实战

生物安全洁净工程不是“更干净”而已：从洁净控制到风险隔离

和Agent的幽默对话（纯记录，s-44是个Agent）