使用Python进行科学计算：NumPy入门

使用python进行科学计算：NumPy入门

一点号编程派9小时前

本文由Python 翻译组最新翻译出品，原作者为Jamal Moir，译者为cystone，并由编程派作者EarlGrey校对。这是使用 Python 进行科学计算的系列文章，上一篇可点此查看：Matplotlib 快速入门。

译者简介：cystone，成都信息工程大学，计算机学院学生。擅长领域：图像处理，机器学习。

你可以用 NumPy 做很多有趣的事情。

NumPy 是一个运行速度非常快的数学库，主要用于数组计算。它可以让你在 Python 中使用向量和数学矩阵，以及许多用 C 语言实现的底层函数，你还可以体验到从未在原生 Python 上体验过的运行速度。

NumPy 是 Python 在科学计算领域取得成功的关键之一，如果你想通过 Python 学习数据科学或者机器学习，就必须学习 NumPy。我认为 NumPy 的功能很强大，而且入门也不难。

数组基础创建数组

NumPy 的核心是数组（arrays）。具体来说是多维数组（ndarrays），但是我们不用管这些。通过这些数组，我们能以闪电般的速度使用像向量和数学矩阵之类的功能。赶紧捡起你的线性代数吧！（只是开玩笑，其实并不需要很多复杂的数学知识）

# 1D Arraya = np.array([01234]) b = np.array((01234)) c = np.arange(5) d = np.linspace(02*np.pi,5) print(a)# >>>[0 1 2 3 4]print(b)# >>>[0 1 2 3 4]print(c)# >>>[0 1 2 3 4]print(d)# >>>[ 0. 1.57079633 3.14159265 4.71238898 6.28318531]print(a[3])# >>>3

上边的代码展示了创建数组的四种不同方式。最基本的方式是传递一个序列给 NumPy 的 array 函数；你可以传给它任意的序列，不仅仅是我们常见的列表之类的。

注意，当输出的数组中的数值长度不一样的时候，它会自动对齐。这在查看矩阵的时候很有用。数组的索引和 Python 中的列表或其他序列很像。你也可以对它们使用切片，这里我不再演示一维数组的切片，如果你想知道更多关于切片的信息，查看这篇文章。

上边数组的例子给你展示了如何在 NumPy 中表示向量，接下来我将带你们领略一下怎么表示矩阵和多维数组。

# MD Array,a = np.array([[1112131415], [1617181920212223242526272829303132333435]]) print(a[24])# >>>25

通过给 array 函数传递一个列表的列表（或者是一个序列的序列），可以创建二维数组。如果我们想要一个三维数组，那我们就传递一个列表的列表的列表，四维数组就是列表的列表的列表的列表，以此类推。

注意二维数组是如何成行成列排布的（在我们的朋友―空格的帮助下）。如果要索引一个二维数组，只需要引用相应的行数和列数即可。

背后的数学知识

为了更好的理解这些，我们需要来看一下什么是向量和矩阵。

向量是一个有方向和大小的量，通常用来表示速度、加速度和动量等。向量能以多种方式书写，但是我们最有用的方式是把它们写在有 n 个元素的元组里边，比如（1， 4， 6， 9）。这就是它们在 NumPy 中的表示方式。

矩阵和向量很像，除了它是由行和列组成的；更像一个网格（grid）。矩阵中的数值可以用它们所在的行和列来表示。在 NumPy 中，可以像我们前面所做的那样，通过传递序列的序列来创建数组。

多维数组切片

多维数组切片比一维数组要复杂一点，同时它也是你在用 NumPy 的时候经常会用到的。

# MD slicingprint(a[01:4])# >>>[12 13 14]print(a[1:40])# >>>[16 21 26]print(a[::2,::2])# >>>[[11 13 15] # [21 23 25] # [31 33 35]]print(a[:,1])# >>>[12 17 22 27 32]

就像你看到的一样，多维数组切片就是要分别在每个维度上切片，并用逗号隔开。在二维数组中，第一个切片的含义是对行切片，第二个切片的含义是对列切片。

值得注意的是，你通过输入数字来指定行和列。上边第一个例子是从数组中选择第 0 行。（注：原文为第 0 列，应该是作者笔误）

下边的这幅图阐明了上边切片的例子的含义。

php?url=0E6Zez88tp" alt="使用Python进行科学计算：NumPy入门" />
数组属性

在使用 NumPy 时，你会想知道数组的某些信息。很幸运，在这个包里边包含了很多便捷的方法，可以给你想要的信息。

# Array propertiesa = np.array([[1112131415], [1617181920212223242526272829303132333435]]) print(type(a))# >>><class 'numpy.ndarray'>print(a.dtype)# >>>int64print(a.size)# >>>25print(a.shape)# >>>(5, 5)print(a.itemsize)# >>>8print(a.ndim)# >>>2print(a.nbytes)# >>>200

如你所看，在上边的代码中 NumPy 的数组其实被称为 ndarray。我不知道为什么它被称为 ndarray，如果有人知道请在下边留言！我猜测它是表示 n 维数组（n dimensional array）。

数组的形状（shape）是指它有多少行和列，上边的数组有五行五列，所以他的形状是（5，5）。

‘itemsize’ 属性是每一个条目所占的字节。这个数组的数据类型是 int64，一个 int64 的大小是 64 比特，8 比特为 1 字节，64 除以 8 就得到了它的字节数，8 字节。

‘ndim’ 属性是指数组有多少维。这个数组有二维。但是，比如说向量，只有一维。

‘nbytes’ 属性表示这个数组中所有元素占用的字节数。你应该注意，这个数值并没有把额外的空间计算进去，因此实际上这个数组占用的空间会比这个值大点。

使用数组基本操作符

仅仅会赋值、取值和得到一些属性是不能满足你的需求的，有时候你还需要做一些数学运算。你可以利用基本的操作符实现这些，比如 +， -， /，等等。

# Basic Operatorsa = np.arange(25) a = a.reshape((55)) b = np.array([1062114256792145 49255563433565324 563564478]) b = b.reshape((55)) print(a + b) print(a - b) print(a * b) print(a / b) print(a **2) print(a < b)print(a > b) print(a.dot(b))

除了 dot 之外，这些操作符都是对数组进行逐元素运算。比如 (a, b, c) + (d, e, f) 的结果就是 (a+d, b+e, c+f)。它将分别对每一个元素进行配对，然后对它们进行运算。它返回的结果是一个数组。注意，当使用逻辑运算符比如 “<” 和 “>” 的时候，返回的将是一个布尔型数组，这点有一个很好的用处，后边我们会提到。

dot 函数计算两个数组的点积。它返回的是一个标量（只有大小没有方向的一个值）而不是数组。

背后的数学知识

dot 函数有时候也称为点积。理解这个函数的最好方法就是看下边它的计算过程。

数组的特定操作符

NumPy 还提供了一些其他很有用的操作符，用于处理数组。

# dot, sum, min, max, cumsuma = np.arange(10) print(a.sum)# >>>45print(a.min)# >>>0print(a.max)# >>>9print(a.cumsum)# >>>[ 0 1 3 6 10 15 21 28 36 45]

很明显就能看出 sum、min 和 max 函数的功能：将所有元素加起来，找到最小值和最大值。

cumsum 函数就不是那么明显了。它像 sum 那样把所有元素加起来，但是它的实现方式是，第一个元素加到第二个元素上，把结果保存到一个列表里，然后把结果加到第三个元素上，再保存到列表里，依次累加。当遍历完数组中所有元素则结束，返回值为运行数组的总和的列表。

cystone: 这里作者说的比较拗口，其实 cumsum 就是一个累加计算并且保存每次累加的结果，返回值就是包含所有累加结果的一个列表。比如 np.array([1, 2, 3, 4, 5]).cumsum = [1, 3, 6, 10, 15] 高级索引花俏的索引

“花俏的索引”是获取数组中我们想要的特定元素的有效方法。

# Fancy indexinga = np.arange(010010) indices = [15, -1] b = a[indices] print(a)# >>>[ 0 10 20 30 40 50 60 70 80 90]print(b)# >>>[10 50 90]

如你所见，上边的例子中，我们用想获取的索引的序列作为索引。它返回了我们索引的元素。

布尔过滤（boolean masking）

布尔过滤是一个奇妙的特性，它允许我们根据指定条件获取数组中的元素。

# Boolean maskingimportmatplotlib.pyplotasplt a = np.linspace(02* np.pi,50) b = np.sin(a) plt.plot(a,b) mask = b >=0plt.plot(a[mask], b[mask],'bo') mask = (b >=0) & (a <= np.pi /2) plt.plot(a[mask], b[mask],'go') plt.show

上边的代码展示了实现布尔屏蔽。你需要做的就是传递给数组一个与它有关的条件式，然后它就会返回给定条件下为真的值。

上边的例子将会生成下边这幅图：

我们用条件式选择了图中不同的点。蓝色的点（也包含图中的绿点，只是绿点覆盖了蓝点），显示的是值大于零的点。绿点显示的是值大于 0 小于 Pi / 2 的点。

缺省索引缺省索引是从多维数组的第一维获取索引和切片便捷方法。例如，你有一个数组 a = [[1, 2, 3, 4, 5], [6, 7, 8, 9, 10]]，那么 a[3] 将会返回数组第一维中索引值为 3 的元素，这里的结果是 4。 # Incomplete Indexinga = np.arange(010010) b = a[:5] c = a[a >=50] print(b)# >>>[ 0 10 20 30 40]print(c)# >>>[50 60 70 80 90]Where 函数

where 函数是另外一个根据条件返回数组中的值的有效方法。只需要把条件传递给它，它就会返回一个使得条件为真的元素的列表。

# Wherea = np.arange(010010) b = np.where(a <50) c = np.where(a >=50)[0] print(b)# >>>(array([0, 1, 2, 3, 4]),)print(c)# >>>[5 6 7 8 9]

这就是 NumPy，不算太难，对吧？当然，这些只是一些基础，NumPy 还有很多其他的功能，如果你已经熟悉了这些基础内容，你可以去探索一下。

不要忘了分享！

要记得，不要忘了分享这篇文章，这样其他人就也可以看到了！另外，记得订阅这个博客的邮件列表，关注我的Twitter和Google+，这样你就不会错过任何有价值的文章了！

我会阅读所有的评论，如果你有什么想说的，想分享的，想问的或者喜欢的，请在下边留言！

Python 翻译组是EarlGrey@编程派发起成立的一个专注于 Python 技术内容翻译的小组，目前已有 30 多名 Python 技术爱好者加入。

翻译组出品的内容（包括教程、文档、书籍、视频）将在编程派微信公众号首发，欢迎各位 Python 爱好者推荐相关线索。推荐线索，可直接在编程派微信公众号推文下留言即可。

欢迎转发至朋友圈。如无特殊注明，本公号所发文章均为原创或编译，如需转载，请联系「编程派」获得授权。

Jupyter Notebook 快速入门（下）

扫码关注编程派

↓↓↓ 欢迎点击广告，你的每次点击都会成为以后的活动福利基金。

使用Python进行科学计算：NumPy入门

Trending Articles

SM3268AB 8CE三星量产无法格式化

[下载工具]Think4V utubedown(Youtube高清视频下载工具) v2.1.6 官方版2.1.3

出售: SINE Othello 電源線

博讯｜张磊帮助下，李源潮的儿子被耶鲁录取

FullEventLogView 1.73 免安裝中文版 - 事件檢視器取代工具

同門四角戀？李沛旭喇舌「小郭雪芙」曾智希，蔡淑臻拍完婚紗...怒毀婚

五代RAV4 降車身（機械車位因素）

[攻略] 《魔獸世界》6.2.2 白色魚人蛋再現！來去收編魚人寶寶特基！

jetBrains Product crack 2024 Java based

2013 KUGA 6G轉動方向盤會聽到摳摳摳的異音，有人知道原因嗎?

【豌豆字幕組】[藥屋少女的呢喃（藥師少女的獨語）/ Kusuriya no Hitorigoto][25][繁體][1080P][MP4]

好用的照片后期处理软件【DxO PhotoLab Elite 5.4.0.4765 (x64) 多语言便携版】..

出售: Thixar Silence Plus 啫喱板

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

三條崙討海人故事…重建烏倉寮憶43年前船難

致喬立建設道歉聲明

[一般] 神州全地圖掉寶資料

方易通7862 8/128G 無360 刷機

動感校園小記者・瑪利諾修院學校｜採訪王瑋駿陳晞文帶領試玩風帆

有藍電流行車紀錄器分享文嗎