NumPy Ndarray
NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。
ndarray 对象是用于存放同类型元素的多维数组。
ndarray 中的每个元素在内存中都有相同存储大小的区域。
Ndarray 组成
ndarray 内部由以下内容组成:
一个指向数据(内存或内存映射文件中的一块数据)的指针。
数据类型或 dtype,描述在数组中的固定大小值的格子。
一个表示数组形状(shape)的元组,表示各维度大小的元组。
一个跨度元组(stride),其中的整数指的是为了前进到当前维度下一个元素需要"跨过"的字节数。
ndarray 的内部结构:

Ndarray 创建
array
创建一个 ndarray 只需调用 NumPy 的 array 函数即可:
参数说明:
object
数组或嵌套的数列
dtype
数组元素的数据类型,可选
copy
对象是否需要复制,可选
order
创建数组的样式,C为行方向,F为列方向,A为任意方向(默认)
subok
默认返回一个与基类类型一致的数组
ndmin
指定生成数组的最小维度
实例 1:
输出结果如下:
实例 2:
输出结果如下:
实例 3:
输出如下:
实例 4:
输出结果如下:
empty
umpy.empty 方法用来创建一个指定形状(shape)、数据类型(dtype)且未初始化的数组:
参数说明:
shape
数组形状
dtype
数据类型,可选
order
有"C"和"F"两个选项,分别代表,行优先和列优先,在计算机内存中的存储元素的顺序。
实例:
输出结果为:
注意数组元素为随机值,因为它们未初始化。
zeros
numpy.zeros 创建指定大小的数组,数组元素以 0 来填充。
参数说明:
shape
数组形状
dtype
数据类型,可选
order
'C' 用于 C 的行数组,或者 'F' 用于 FORTRAN 的列数组
实例:
输出结果为:
ones
numpy.ones 创建指定形状的数组,数组元素以 1 来填充。
参数说明:
shape
数组形状
dtype
数据类型,可选
order
'C' 用于 C 的行数组,或者 'F' 用于 FORTRAN 的列数组
实例:
输出结果为:
asarray
numpy.asarray 类似 numpy.array,但 numpy.asarray 参数只有三个,比 numpy.array 少两个。
参数说明:
a
任意形式的输入参数,可以是,列表, 列表的元组, 元组, 元组的元组, 元组的列表,多维数组
dtype
数据类型,可选
order
可选,有"C"和"F"两个选项,分别代表,行优先和列优先,在计算机内存中的存储元素的顺序。
实例
输出结果为:
numpy.frombuffer
numpy.frombuffer 用于实现动态数组。
numpy.frombuffer 接受 buffer 输入参数,以流的形式读入转化成 ndarray 对象。
注意:buffer 是字符串的时候,Python3 默认 str 是 Unicode 类型,所以要转成 bytestring 在原 str 前加上 b。
参数说明:
buffer
可以是任意对象,会以流的形式读入。
dtype
返回数组的数据类型,可选
count
读取的数据数量,默认为-1,读取所有数据。
offset
读取的起始位置,默认为0。
实例
输出结果为:
numpy.fromiter
numpy.fromiter 方法从可迭代对象中建立 ndarray 对象,返回一维数组。
iterable
可迭代对象
dtype
返回数组的数据类型
count
读取的数据数量,默认为-1,读取所有数据
实例
输出结果为:
numpy.arange
numpy 包中的使用 arange 函数创建数值范围并返回 ndarray 对象,函数格式如下:
参数说明:
start
起始值,默认为0
stop
终止值(不包含)
step
步长,默认为1
dtype
返回ndarray的数据类型,如果没有提供,则会使用输入数据的类型。
实例:生成 0 到 5 的数组:
输出结果如下:
numpy.linspace
numpy.linspace 函数用于创建一个一维数组,数组是一个等差数列构成的,格式如下:
np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None) 参数说明:
参数 | 描述 start | 序列的起始值 stop | 序列的终止值,如果endpoint为true,该值包含于数列中 num | 要生成的等步长的样本数量,默认为50 endpoint | 该值为 true 时,数列中包含stop值,反之不包含,默认是True。 retstep | 如果为 True 时,生成的数组中会显示间距,反之不显示。 dtype | ndarray 的数据类型
以下实例用到三个参数,设置起始点为 1 ,终止点为 10,数列个数为 10。
输出结果为:
设置元素全部是1的等差数列:
输出结果为:
将 endpoint 设为 false,不包含终止值:
输出结果为:
如果将 endpoint 设为 true,则会包含 20。
以下实例设置间距。
实例
输出结果为:
numpy.logspace
numpy.logspace 函数用于创建一个等积数列。格式如下:
start
序列的起始值为:base ** start
stop
序列的终止值为:base ** stop。如果endpoint为true,该值包含于数列中
num
要生成的等步长的样本数量,默认为50
endpoint
该值为 true 时,数列中中包含stop值,反之不包含,默认是True。
base
对数 log 的底数。
dtype
ndarray 的数据类型
输出结果为:
将对数的底数设置为 2 :
输出如下:
副本和视图
副本是一个数据的完整的拷贝,如果我们对副本进行修改,它不会影响到原始数据,物理内存不在同一位置。
视图是数据的一个别称或引用,通过该别称或引用亦便可访问、操作原有数据,但原有数据不会产生拷贝。如果我们对视图进行修改,它会影响到原始数据,物理内存在同一位置。
视图一般发生在:
numpy 的切片操作返回原数据的视图。
调用 ndarray 的 view() 函数产生一个视图。
副本一般发生在:
Python 序列的切片操作,调用deepCopy()函数。
调用 ndarray 的 copy() 函数产生一个副本。
无复制
简单的赋值不会创建数组对象的副本。 相反,它使用原始数组的相同id()来访问它。 id()返回 Python 对象的通用标识符,类似于 C 中的指针。
此外,一个数组的任何变化都反映在另一个数组上。 例如,一个数组的形状改变也会改变另一个数组的形状。
输出结果为:
视图或浅拷贝
ndarray.view() 方会创建一个新的数组对象,该方法创建的新数组的维数更改不会更改原始数据的维数。
输出结果为:
使用切片创建视图修改数据会影响到原始数组:
输出结果为:
变量 a,b 都是 arr 的一部分视图,对视图的修改会直接反映到原数据中。但是我们观察 a,b 的 id,他们是不同的,也就是说,视图虽然指向原数据,但是他们和赋值引用还是有区别的。
副本或深拷贝
ndarray.copy() 函数创建一个副本。 对副本数据进行修改,不会影响到原始数据,它们物理内存不在同一位置。
输出结果为:
最后更新于