【机器学习】线性回归（Linear Regression）

张开发

• 2026/4/11 11:37:30 • 15 分钟阅读

分享文章

目录概述引入一个例子线性回归梯度下降总结概述线性回归是统计学与机器学习领域中最基础、最经典的算法之一核心用途在于预测数值以及分析变量之间的关联关系。你可以将其形象地理解为在一堆看似杂乱无章的数据点中绘制出一条“最佳拟合线”以此揭示数据背后隐藏的规律进而对未来趋势做出预判。相较于复杂的非线性模型线性回归的建模过程更为简洁结果的可解释性也更强。正因如此它常常被用作机器学习入门者的首选算法帮助大家建立起对数据建模的初步认知。引入一个例子例如使用UCI波士顿房屋数据集这个数据集数量比较小并不代表大数据问题但是可以拿来说明算法。这份数据包含506行14列每行代表一栋房子每栋房子有14个属性其中最后一列为该栋房子的价格中位数。其余属性包含了犯罪率房间数量等信息。为了课程学习我们只取其中一个特征来研究它与房价之间的相关性即房间数量。上图中x轴代表房间数量y轴代表房价两个变量之间显然有相关性。但这种相关性如何表达呢一般情况下我们可以直接画一条直线来表达出“房间越多房价越高”的结论。但是这样的直线可以有很多条为了确定唯一的一条所以我们引入“线性回归”的方法。线性回归根据初中的数学知识我们知道要在二维空间中绘制一条线需要确定两个值直线的斜率以及线与y yy轴相交的值也就是截距。假设房间数量为x xx房价为h hh斜率为w 0 w_0w0和w 1 w_1w1下面的公式描述h ( x ) w 0 w 1 x h(x)w_0w_1xh(x)w0w1x而线性回归求取w 0 w_0w0和w 1 w_1w1的方法是通过构建损失函数coss function决定的。如下所示C ( w 0 , w 1 ) 1 2 m ∑ i 1 m ( h ( x i ) − y i ) 2 1 2 m ∑ i 1 m ( w 0 w 1 x i − y i ) 2 \begin{equation}\begin{split} C(w_0,w_1)\frac{1}{2m}\sum_{i1}^m{(h(x_i)-y_i})^2 \\ \frac{1}{2m}\sum_{i1}^m{(w_0w_1x_i-y_i)}^2 \end{split}\end{equation}C(w0,w1)2m1i1∑m(h(xi)−yi)22m1i1∑m(w0w1xi−yi)2所谓“损失”指的预测值与真实值的差异这里的预测值指的是通过h ( x ) h(x)h(x)函数计算出来的预估房价真实值指的通过数据收集到的真实房价。这里构建损失函数的方法称为均方误差。这个公式可以简单理解为每个由函数计算出来的房价与其对应真实房价之间的误差h ( x i ) − y i h(x_i)-y_ih(xi)−yi的叠加(∑ \sum∑)。由于原本的x xx和y yy都被样本的值填充所以该公式的未知项变成了w 0 w_0w0和w 1 w_1w1。并且根据损失函数的数学定义当C ( w 0 , w 1 ) C(w_0,w_1)C(w0,w1)的值最小时样本的值与算法预测的值最为接近该算法就越能代表数据的规律且此时对应的w 0 w_0w0和w 1 w_1w1为最佳。那么如何求得w 0 w_0w0和w 1 w_1w1使得损失函数的值最小呢梯度下降我们可以先直观感受一下损失函数的图像。这个图像的蓝色区域是我们想要到达的区域因为这个区域所代表的损失函数值最小。要想到达这个区域我们引入梯度下降的方法。这里需要一些高等数学求导的知识。为了解释清楚为什么求导能够找到函数的最低点我们先回到一维的情况。已知函数在某个点上求导实际上是求函数在该点上切线的斜率k kk而斜率是有方向的如下所示。橙色直线是函数C ( w ) w 2 C(w)w^2C(w)w2在初始化w 2 w2w2时的切线斜率为4红色直线是函数在初始化w − 2 w-2w−2时的切线斜率为-4。此时如果我们让w − k w-kw−k如果k 0 k0k0时对应的( w , C ) (w,C)(w,C)就会向左移。同理如果初始的点在图像的另一边点就会向右移。如果我们将w − k w-kw−k的结果赋值给新的w ww我们继续在新的w ww上求导重复上面的过程我们就会发现( w , C ) (w,C)(w,C)会不断朝着“低谷”走去。如下所示。等到w ww的变化不大时这个过程就会停止。值得注意的话随着计算的进行实际上斜率k kk的值也会越来越小导致w ww的变化也会越来越小所以停下来是自然而然的。回到上面多维的情况同理我们对函数C ( w 0 , w 1 ) C(w_0,w_1)C(w0,w1)求偏导。相当于计算函数在这两个方向上的切线斜率。根据向量求和的原则它们在各自方向上的移动可以叠加为一个方向的移动如下所示。此时我们针对任意的w j w_jwj可以根据损失函数的偏导数对w j w_jwj进行更新w j : w j − γ ∂ ∂ w j C ( w ) w_j:w_j-\gamma\frac{\partial}{\partial w_j}C(w)wj:wj−γ∂wj∂C(w)其中γ \gammaγ为学习率决定每次更新的幅度有多大。总结关于线性回归的内容在这个章节就记录了这么多。总体而言通过收集数据制作样本构建损失函数以及梯度下降等步骤在整个人工智能算法研发的过程都是通用的。只是每一步在线性回归的领域内都还算简单。后续的内容将会越来越复杂。最后如果在学习的过程中有任何问题的话都可以通过980623070qq.com发邮件给我提意见或建议。

更多文章

前端开发 2026/4/11 11:36:30

复古像素UI设计系统：Pixel Fashion Atelier自定义CSS架构与响应式适配方案

复古像素UI设计系统：Pixel Fashion Atelier自定义CSS架构与响应式适配方案 1. 项目背景与设计理念 Pixel Fashion Atelier是一款融合了复古像素美学与现代AI图像生成技术的创新工具。不同于传统AI工具的单调界面，它从日系RPG游戏中汲取灵感&#xff0c…

如何用Zotero Style插件高效管理文献：从阅读追踪到智能标签的完整攻略【免费下载链接】zotero-style Ethereal Style for Zotero 项目地址: https://gitcode.com/GitHub_Trending/zo/zotero-style Zotero Style插件是一款能够彻底改变你文献管理体验的Zoter…

张开发

前端开发 2026/4/11 11:10:05

如何让微信聊天记录不再消失？WeChatMsg帮你永久保存珍贵对话

如何让微信聊天记录不再消失？WeChatMsg帮你永久保存珍贵对话【免费下载链接】WeChatMsg 提取微信聊天记录，将其导出成HTML、Word、CSV文档永久保存，对聊天记录进行分析生成年度聊天报告项目地址: https://gitcode.com/GitHub_Trending/we…

张开发

【机器学习】线性回归（Linear Regression）

最新文章

单细胞注释进阶指南-利用AddModuleScore精准定位细胞亚群

Wan2.2-I2V-A14B创意应用：基于Qt开发跨平台视频生成桌面工具

创意电子学-小知识：如何为面包板电路注入灵魂

为什么你的RAG系统缓存命中率不足31%？——基于12家头部AI厂商的缓存拓扑审计报告

从TTL到差分：串口通信电路设计的实战解析与选型指南

【AI原生软件IP保护黄金法则】：20年资深架构师亲授3大不可绕行的专利布防节点与5类高危侵权雷区

推荐文章

AVR长周期看门狗库：突破8秒限制实现毫秒级精准复位与睡眠唤醒

并发控制原理与实现：从进程线程到现代并发编程

HunyuanVideo-Foley开源大模型实战：基于Transformers/Accelerate推理优化

小步快跑・像CPU一样调度大脑高并发——东方仙盟・阿雪心学

STM8 Bootloader开发与固件远程升级实践

（复现）基于自适应滑模控制（ASMC）和神经网络容错控制的主从式无人机编队控制研究（Matlab代码实现）

相关文章

深入解析ZeroMQ inproc：线程间通信的高效实现与性能优势

BewlyBewly终极指南：打造高效个性化的B站浏览体验

IDM激活脚本架构设计：基于注册表锁定机制的99%成功率激活方案

Sulpho-Methyltetrazine-NHS ester，磺化甲基四嗪-琥珀酰亚胺酯的结构特点与功能

3步精通Zotero OCR：从安装到高效文本识别

OpCore-Simplify：驯服硬件兼容性的自动化引擎

分享文章

更多文章

复古像素UI设计系统：Pixel Fashion Atelier自定义CSS架构与响应式适配方案

忍者像素绘卷：天界画坊Java安装与开发环境快速搭建指南

保姆级教程：在Ubuntu 18.04上搞定RandLA-Net与SemanticKITTI数据集（从环境到可视化）

如何掌握Betaflight配置器：无人机飞控调参深度实践手册

3分钟终极指南：qmcdump快速解锁QQ音乐加密音频文件

3步搞定Windows与Office智能激活：KMS_VL_ALL_AIO终极指南

从零到一：手把手搭建DNF商业级私服全流程解析

英雄联盟智能助手：从铂金到大师的终极效率提升方案

如何快速上手Microsoft GitHub项目：5个实用技巧

每日一书⑭ | 人类简史：我们是谁？从动物到上帝的人类史诗

如何用Zotero Style插件高效管理文献：从阅读追踪到智能标签的完整攻略

如何让微信聊天记录不再消失？WeChatMsg帮你永久保存珍贵对话