博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python中的numpy库介绍!
阅读量:2441 次
发布时间:2019-05-10

本文共 9008 字,大约阅读时间需要 30 分钟。

机器学习算法中大部分都是调用Numpy库来完成基础数值计算的。

安装方法:

pip3 install numpy

1. ndarray数组基础

python中用列表保存一组值,可将列表当数组使用。另外,python中有array模块,但它不支持多维数组,无论是时列表还是array模块都没有科学运算函数,不适合做矩阵等科学计算。numpy没有使用python本身的数组机制,而是提供了ndarray对象,该对象不仅能方便地存取数组,而且拥有丰富的数组计算函数。
使用前先导入Numpy模块

import numpy as np#或from numpy import *

1)数组的创建及使用

>>> x=np.array([[1.0,0.0,0.0],[0.,1.,2.]]) #定义了一个二维数组,大小为(2,3)>>> xarray([[1., 0., 0.],       [0., 1., 2.]])>>> x.ndim   #数组维度数2>>> x.shape    #数组的维数,返回的格式(n,m),其中n为行数,m为列数(2, 3)>>> x.size    #数组元素的总数6>>> x.dtype   #数组元素类型dtype('float64')  #64位浮点型>>> x.itemsize  #每个元素占有的字节大小8>>> x.data    #数组元素的缓冲区

还有两种创建序列数组的函数arrange和linspace,和range函数类似,但它们都属于Numpy里面。

arange(a,b,c) 参数分别表示开始值,结束值,步长
linspace(a,b,c) 参数分别表示开始值,结束值,元素数量
还可以调用它们自身的方法reshape()指定形状

>>> arange(15).reshape(3,5)array([[ 0,  1,  2,  3,  4],       [ 5,  6,  7,  8,  9],       [10, 11, 12, 13, 14]])>>> arange(10,30,5)array([10, 15, 20, 25])>>> arange(0,2,0.3)array([0. , 0.3, 0.6, 0.9, 1.2, 1.5, 1.8])>>> linspace(0,2,9) # 0~2之间生成9个数字array([0.  , 0.25, 0.5 , 0.75, 1.  , 1.25, 1.5 , 1.75, 2.  ])

还有两种创建概率分布的形式创建ndarray数组

  • 高斯分布(正态分布)
  • np.random.randn(shape):生成对应形状(shape)的高斯分布
  • np.random.normal(loc, scale, size):生成均值为loc,标准差为scale,形状(shape)为size的高斯分布
  • 均匀分布
  • np.random.rand(shape):生成对应形状(shape)的均匀分布
  • np.random.uniform(low, high, size):生成一个从[low, high)中随即采样的,样本数量为size的均匀分布
>>> a = np.random.randn(10) # 长度为10的一个一维数组>>> aarray([ 0.12939473,  0.43128511,  1.20540157,  0.54083603,  0.80768359,       -1.24217976, -0.9713093 ,  1.43538807, -1.07227227, -1.27176462])>>> b = np.random.normal(0, 1, (2,4)) # 均值为1,方差为0,形状为(2,4)的二维数组>>> barray([[ 0.4132305 , -2.06728849,  1.15189397, -1.11201615],       [ 0.39955198, -0.89664908, -0.61361683, -0.13166113]])>>> c = np.random.rand(2,3) # 生成一个形状为(2,3)的均匀分布二维数组>>> carray([[0.57091351, 0.39960244, 0.77019683],       [0.11316102, 0.59354993, 0.37849038]])>>> d = np.random.uniform(-1,1,10)>>> darray([-0.34374858, -0.27026865,  0.27073922, -0.42654097, -0.38736897,        0.16293278, -0.79578655, -0.04825995,  0.28444576,  0.99118406])

2)特殊数组

  • zeros数组:全零数组,元素全为零。
  • ones数组:全1数组,元素全为1。
  • empty数组:空数组,元素全近似为0。
>>> zeros((3,4))array([[0., 0., 0., 0.],       [0., 0., 0., 0.],       [0., 0., 0., 0.]])>>> ones((2,3,4),dtype=int16)array([[[1, 1, 1, 1],        [1, 1, 1, 1],        [1, 1, 1, 1]],       [[1, 1, 1, 1],        [1, 1, 1, 1],        [1, 1, 1, 1]]], dtype=int16)>>> empty((5,3))array([[6.23042070e-307, 1.42417221e-306, 1.37961641e-306],       [1.11261027e-306, 1.11261502e-306, 1.42410839e-306],       [7.56597770e-307, 6.23059726e-307, 1.42419530e-306],       [7.56599128e-307, 1.11260144e-306, 6.89812281e-307],       [2.22522596e-306, 2.22522596e-306, 2.56761491e-312]])

3)数组索引

Numpy数组每个元素,每行元素,每列元素都可以用索引访问。

>>> c=arange(24).reshape(2,3,4) # reshape()改变数组形状>>> print(c)[[[ 0  1  2  3]  [ 4  5  6  7]  [ 8  9 10 11]] [[12 13 14 15]  [16 17 18 19]  [20 21 22 23]]]>>> print(c[1,2,:])[20 21 22 23]>>> print(c[0,1,2])6

4)数组运算

  • 算术运算:数组的加减乘除以及乘方运算方式为,相应位置的元素分别进行运算。
>>> a=array([20,30,40,50])>>> aa=arange(1,5)>>> a/aaarray([20.        , 15.        , 13.33333333, 12.5       ])>>> b=arange(4)>>> barray([0, 1, 2, 3])>>> c=a-b>>> carray([20, 29, 38, 47])>>> b**2array([0, 1, 4, 9], dtype=int32)>>> A=array([[1,1],[0,1]])>>> b=array([[2,0],[3,4]])>>> A*barray([[2, 0],       [0, 4]])>>> A.sum()3>>> A.min()0>>> A.max()1
  • 逻辑运算
arr > a : 返回arr中大于a的一个布尔值数组arr[arr>a] : 返回arr中大于a的数据构成的一维数组np.all(): 括号内全为真则返回真,有一个为假则返回falsenp.any() : 括号内全为假则返回假,有一个为真则返回真np.where(): 三元预算符, 判断同时赋值如:np.where(arr>0, 1, 0)复合逻辑运算:	与:np.logical_and(): 括号为一系列表达式	或:np.logical_or()
  • 统计运算
统计指标函数:min, max, mean, median, var, stdnp.函数名ndarray.方法名axis参数:axis=0代表列,axis=1代表行最大值最小值的索引函数:	np.argmax(arr, axis=)	np.argmin(arr, axis=)

5)数组的拷贝

数组的拷贝分浅拷贝和深拷贝两种,浅拷贝通过数组变量的赋值完成,深拷贝使用数组对象的copy方法。
浅拷贝只拷贝数组的引用,如果对拷贝进行修改,源数组也将修改。如下:

>>> a=ones((2,3))>>> aarray([[1., 1., 1.],       [1., 1., 1.]])>>> b=a>>> b[1,2]=2>>> aarray([[1., 1., 1.],       [1., 1., 2.]])>>> barray([[1., 1., 1.],       [1., 1., 2.]])

深拷贝会复制一份和源数组一样的数组,新数组与源数组会存放在不同内存位置,因此对新数组的修改不会影响源数组。如下:

>>> a=ones((2,3))>>> b=a.copy()>>> b[1,2]=2>>> aarray([[1., 1., 1.],       [1., 1., 1.]])>>> barray([[1., 1., 1.],       [1., 1., 2.]])

6)广播机制

numpy中不同维度的数组是可以进行算数运算的,只要满足广播机制即可。

广播机制: 1.数组拥有相同形状-->(3,4)+(3,4)		  2.当前维度相等--->(3,4)+(4,)		  3.当前维度有一个是1--->(3,1,5)+(1,3,5)

7)合并与分割

np.hstack((a,b)):按行合并,要求a和b的 行 数 相 同 \color{red}{行数相同}
np.vstack((a,b)):按列合并,要求a和b的 列 数 相 同 \color{red}{列数相同}
np.c_[a,b]:用法如同np.hstack((a,b))
np.r_[a,b]:用法如同np.vstack((a,b))

>>> a = np.array([1,2,3])>>> b = np.array([4,5,6])>>> a,b(array([1, 2, 3]), array([4, 5, 6]))>>> np.hstack((a,b))array([1, 2, 3, 4, 5, 6])>>> np.vstack((a,b))array([[1, 2, 3],       [4, 5, 6]])

np.concatenate((a,b), axis = 1):按行合并,要求a和b的行数相同

np.concatenate((a,b), axis = 0):按列合并,要求a和b的列数相同
注意: 如 果 不 指 定 a x i s , 则 默 认 a x i s = 0 , 即 按 列 合 并 。 并 且 一 维 数 组 只 能 按 行 合 并 \color{red}{如果不指定axis,则默认axis=0,即按列合并。并且一维数组只能按行合并} axisaxis=0

>>> a = np.array([1,2,3]>>> b = np.array([4,5,6])>>> np.concatenate((a,b),axis=0)array([1, 2, 3, 4, 5, 6])>>> np.concatenate((a,b),axis=1) # a,b都是一维数组,只能按axis=0合并Traceback (most recent call last):  File "
", line 1, in
numpy.AxisError: axis 1 is out of bounds for array of dimension 1>>> x = np.array([[1,2],[3,4]])>>> y = np.array([[5,6]])>>> np.concatenate((x,y),axis=0)array([[1, 2], [3, 4], [5, 6]])>>> np.concatenate((x,y.T),axis=1) # y.T表示将y数组转置array([[1, 2, 5], [3, 4, 6]])

np.split(arr, n):n要么是整数,要么是列表,用来进行划分,n为整数时必须是能均匀划分

np.array_split(arr, n):类似上面的用法,但是可以不均等划分

>>> x = np.arange(9.0)>>> np.split(x, 3)[array([ 0.,  1.,  2.]), array([ 3.,  4.,  5.]), array([ 6.,  7.,  8.])]>>> x = np.arange(8.0)>>> np.split(x, [3, 5, 6, 10])[array([ 0.,  1.,  2.]), array([ 3.,  4.]), array([ 5.]), array([ 6.,  7.]), array([], dtype=float64)] >>> x = np.arange(8.0)>>> np.array_split(x, 3)[array([ 0.,  1.,  2.]), array([ 3.,  4.,  5.]), array([ 6.,  7.])] >>> x = np.arange(7.0)>>> np.array_split(x, 3)[array([ 0.,  1.,  2.]), array([ 3.,  4.]), array([ 5.,  6.])]

8)numpy降维

ravel():返回一维数组,但是改变返回的一维数组内容后,原数组的值也会相应改变
flatten():返回一维数组,改变返回的数组不影响原数组

>>> aarray([[1, 2, 3],       [7, 8, 9]])>>> barray([[4, 5, 6],       [1, 2, 3]])>>> c = a.ravel()>>> carray([1, 2, 3, 7, 8, 9])>>> d = b.flatten()>>> darray([4, 5, 6, 1, 2, 3])>>> c[0]=100>>> carray([100,   2,   3,   7,   8,   9])>>> aarray([[100,   2,   3],       [  7,   8,   9]])>>> d[0]=100>>> darray([[100, 100],       [  6,   1],       [  2,   3]])>>> barray([[4, 5, 6],       [1, 2, 3]])

2. 矩阵

1)创建矩阵
Numpy的矩阵对象与数组对象相似,主要不同之处在于,矩阵对象的计算遵循矩阵数学运算规律。矩阵使用matrix函数创建。

>>> A=matrix('1.0 2.0;3.0 4.0')>>> Amatrix([[1., 2.],        [3., 4.]])>>> b=matrix([[1.0,2.0],[3.0,4.0]])>>> bmatrix([[1., 2.],        [3., 4.]])>>> type(A)

2)矩阵运算

矩阵的常用数学运算有转置,乘法,求逆等。

>>> A.T      #转置matrix([[1., 3.],        [2., 4.]])>>> x=matrix('5.0 7.0')>>> y=x.T>>> ymatrix([[5.],            [7.]])>>> print(A*y)   #矩阵乘法[[19.] [43.]]>>> print(A.I)   #逆矩阵[[-2.   1. ] [ 1.5 -0.5]]

3.Numpy线性代数相关函数

  • numpy.dot()
    此函数返回两个数组的点积。 对于二维向量,其等效于矩阵乘法。 对于一维数组,它是向量的内积。 对于 N 维数组,它是a的最后一个轴上的和与b的倒数第二个轴的乘积。
>>> a=np.array([[1,2],[3,4]])>>> b=np.array([[11,12],[13,14]])>>> np.dot(a,b)array([[37, 40],     #[[1*11+2*13, 1*12+2*14],[3*11+4*13, 3*12+4*14]]       [85, 92]])
  • numpy.vdot()
    此函数返回两个向量的点积。 如果第一个参数是复数,那么它的共轭复数会用于计算。 如果参数id是多维数组,它会被展开。
>>> np.vdot(a,b)130    #1*11+2*12+3*13+4*14=130
  • numpy.inner()
    此函数返回一维数组的向量内积。 对于更高的维度,它返回最后一个轴上的和的乘积。
>>> x=np.array([1,2,3])>>> y=np.array([0,1,0])>>> print(np.inner(x,y))2      # 等价于 1*0+2*1+3*0
  • numpy.matmul()
    函数返回两个数组的矩阵乘积。 虽然它返回二维数组的正常乘积,但如果任一参数的维数大于2,则将其视为存在于最后两个索引的矩阵的栈,并进行相应广播。
    另一方面,如果任一参数是一维数组,则通过在其维度上附加 1 来将其提升为矩阵,并在乘法之后被去除。
#对二维数组(列表),就相当于矩阵乘法>>> a=[[1,0],[0,1]]>>> b=[[4,1],[2,2]]>>> print(np.matmul(a,b))[[4 1] [2 2]] #二维和一维运算 >>> a=[[1,0],[0,1]]>>> b=[1,2]>>> print(np.matmul(a,b))[1 2]>>> print(np.matmul(b,a))[1 2]#维度大于2的>>> a=np.arange(8).reshape(2,2,2)>>> b=np.arange(4).reshape(2,2)>>> print(np.matmul(a,b))[[[ 2  3]  [ 6 11]] [[10 19]  [14 27]]]
  • numpy.linalg.det()
    行列式在线性代数中是非常有用的值。 它从方阵的对角元素计算。 对于 2×2 矩阵,它是左上和右下元素的乘积与其他两个的乘积的差。
    换句话说,对于矩阵[[a,b],[c,d]],行列式计算为ad-bc。 较大的方阵被认为是 2×2 矩阵的组合。
    numpy.linalg.det()函数计算输入矩阵的行列式。
>>> a=np.array([[1,2],[3,4]])>>> print(np.linalg.det(a))-2.0000000000000004>>> b=np.array([[6,1,1],[4,-2,5],[2,8,7]])>>> print(b)[[ 6  1  1] [ 4 -2  5] [ 2  8  7]]>>> print(np.linalg.det(b))-306.0>>> print(6*(-2*7-5*8)-1*(4*7-5*2)+(4*8- -2*2))-306
  • numpy.linalg.solve()
    该函数给出了矩阵形式的线性方程的解。
    例:
    x + y + z = 6
    2y + 5z = -4
    2x + 5y - z = 27
    写成矩阵形势
    在这里插入图片描述
    可表示为AX=B
    即求X=A^(-1)B
    逆矩阵可以用numpy.linalg.inv()函数来求
>>> x=np.array([[1,2],[3,4]])>>> y=np.linalg.inv(x)>>> xarray([[1, 2],       [3, 4]])>>> yarray([[-2. ,  1. ],       [ 1.5, -0.5]])>>> np.dot(x,y)array([[1.0000000e+00, 0.0000000e+00],       [8.8817842e-16, 1.0000000e+00]])

计算线性方程的解

a=np.array([[1,1,1],[0,2,5],[2,5,-1]])print('数组a:')print(a)ainv=np.linalg.inv(a)print('a的逆矩阵')print(ainv)print('矩阵b:')b=np.array([[6],[-4],[27]])print(b)print('计算:A^(-1)B:')x=np.linalg.solve(a,b)print(x)

输出如下:

在这里插入图片描述

完毕!

你可能感兴趣的文章
postgresql 优化与维护
查看>>
mongodb replica sets 测试
查看>>
linux AS6.2 与 as5.4 的对比,性能提升明显
查看>>
FLASHCACHE 的是是非非
查看>>
length() between oracle and postgresql
查看>>
99-lisp lisp 的99个问题 P1-10
查看>>
PG 函数的易变性(Function Volatility Categories)
查看>>
Lisp Quote 和Backquote分析
查看>>
PG psql 变彩色显示
查看>>
SICP 练习 1.3
查看>>
pg 数据库HA 启动脚本的两个假设
查看>>
sql_log_bin在GTID复制下的一个现象
查看>>
双主+haproxy手工切换的一个注意点
查看>>
利用binlog2sql实现闪回
查看>>
mongos分片集群下db数量过多导致服务不可用
查看>>
故障处理--mongos count不准
查看>>
mongo3.0.9库命名的一个S级bug
查看>>
跨版本导入数据导致mysqld崩溃
查看>>
xtrabackup对于flush tables with read lock操作的设置
查看>>
Server has authorization schema version 3,but found a schema version 1 user
查看>>