大模型的相关知识总结

张开发
2026/4/14 20:56:47 15 分钟阅读

分享文章

大模型的相关知识总结
一、判断大模型的好与坏个人感觉要看其模型参数与训练数据。模型参数越多代表着模型越聪明。训练数据与你要实现的功能越匹配这个模型就越适合。与此同时训练数据越多也就代表着大模型越好。二、大模型概要1.定义大模型是一种基于深度学习技术训练出来的人工智能系统主要用于处理和生成人类语言。深度学习用层数较多深的人工神经网络从数据中学习输入与输出之间映射关系的算法而人工神经网络是受生物神经网络的结构和功能启发下设计的计算模型。大模型的蒸馏大模型的运行需要极高的硬件资源通常都是服务器集群并挂载数量众多的GPU显卡。为了满足低性能设备的运行可以对大模型进行蒸馏。2.分类语言大模型、语音大模型、图像处理大模型、多模态大模型。3.模型的本质是函数核心是参数。三、微调大模型普遍的训练规律就是先随机一个初始化参数之后再通过损失函数对其进行训练之后再通过验证数据集对其进行验证。而微调所做的事情就是已经有一个训练好参数的模型基于目前已经训练好的参数再进行训练。微调有以下几类1.全量微调就是要对模型的所有参数都进行调整。2.冻结微调就是不调整底层的参数只调整靠近输出层或者输出层那一层的参数。3.lora微调就是先使所有的参数冻结起来不改变。然后构造一个lora参数模块只需把lora参数模块调好就可以了。四、vla模型vla模型如果要是想部署的话是需要首先进行自己场景的数据采集的然后使用自己采集的数据进行训练的。——摘自B站up:ku贤以下这张图片也是数据采集的流程如下搭建环境就是需要在电脑上安装ubuntu系统并且需要在其上进行安装ros实现与机器人进行控制与通信ros建议安装的版本是ros2。B站up:ku贤还推荐了一下教程双系统安装https://www.bilibili.com/video/BV1Cc41127B9/?spm_id_from333.337.search-card.all.clickvd_sourcea120860aa38505197ca98f6fb16ea342 ROS2学习https://www.bilibili.com/video/BV1gr4y1Q7j5/?spm_id_from333.337.search-card.all.clickvd_sourcea120860aa38505197ca98f6fb16ea342然后这个up主还总结了最近的模型以及其发表时间我觉得很有用先贴在这里这是截至2025.03.15的所有有关vla模型的论文如果部分vla模型的论文看不懂就可以看看vla论文的前身最好可以看看其作者相同类型的论文。

更多文章