Python 机器学习算法入门之梯度下降法实现线性回归

\ k

ZZR ，python中文社区专栏作者，OpenStack工程师，曾经的NLP研究者。主要兴趣方向：OpenStack、Python爬虫、Python数据分析。

Blog： http://skydream.me/

CSDN： http://blog.csdn.net/titan0427/article/details/50365480

―

1. 背景

文章的背景取自 An Introduction to Gradient Descent and Linear Regression ，本文想在该文章的基础上，完整地描述线性回归算法。部分数据和图片取自该文章。没有太多时间抠细节，所以难免有什么缺漏错误之处，望指正。

线性回归的目标很简单，就是用一条线，来拟合这些点，并且使得点集与拟合函数间的误差最小。如果这个函数曲线是一条直线，那就被称为线性回归，如果曲线是一条二次曲线，就被称为二次回归。数据来自于 GradientDescentExample 中的data.csv文件，共100个数据点，如下图所示：

我们的目标是用一条直线来拟合这些点。既然是二维，那么y = b + m x 这个公式相信对于中国学生都很熟悉。其中 b 是直线在y轴的截距（y-intercept）， m 是直线的斜率（slope）。寻找最佳拟合直线的过程，其实就是寻找最佳的 b 和 m 的过程。为了寻找最佳的拟合直线，这里首先要定义，什么样的直线才是最佳的直线。我们定义误差（cost function）：

误差函数

E r r o r ( b , m ) = 1 N ∑ 1 N ( ( b + m x i ) y i ) 2

计算损失函数的python代码如下：

# y = b + mx def compute_error_for_line_given_points(b, m, points): totalError = sum((((b + m * point[0]) - point[1]) ** 2 for point in points)) return totalError / float(len(points))

现在问题被转化为，寻找参数 b 和 m ，使得误差函数 E r r o r ( b , m ) 有最小值。在这里， x i 和 y i 都被视为已知值。从下图看，最小二乘法所做的是通过数学推导直接计算得到最低点；而梯度下降法所做的是从图中的任意一点开始，逐步找到图的最低点。

2. 多元线性回归模型

从机器学习的角度来说，以上的数据只有一个feature，所以用一元线性回归模型即可。这里我们将一元线性模型的结论一般化，即推广到多元线性回归模型。这部分内部参考了机器学习中的数学(1)-回归(regression)、梯度下降(gradient descent) 。假设有 x 1 ， x 2 ， … , x n 共 n 个feature， θ 为 x 的系数，则

拟合函数

h θ ( x ) = θ 0 + θ 1 x 1 + . . . + θ n x n = θ T x ，其中 x 0 = 1

误差函数 J ( θ ) = 1 2 ∑ i = 1 m ( h θ ( x ( i ) ) y ( i ) ) 2 ，

Python 机器学习算法入门之梯度下降法实现线性回归

Trending Articles

《沈冰自述——我和周永康的故事》全本

Moog - Subsequent 25

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

acermark龍璿國際展出多款包裝設備

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

MAS v2.8 magicgenius 汉化版 - 11.11更新

出售: Monster Cable Interlink Reference 2

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

[转载]煞貢、直星、人專吉日\金神七煞歌

HAKERS哈克士戶外 12月8~14日廠拍

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

<請教>行駛中安卓機會重新開機

Udp2raw-tunnel 及其一键安装脚本