如何用R语言进行导数计算?
高等数学是每个大学生都要学习的一门数学基础课,同时也可能是考完试后最容易忘记的一门知识。我在学习高数的时候绞尽脑汁,但始终都不知道为何而学,生活和工作基本用不到,就算是在计算机行业和金融行业,能直接用到高数的地方也少之又少,学术和实际应用真是相差太远了。
不过,R语言为我打开了一扇高数应用的大门,R语言不仅能方便地实现高等数学的计算,还可以很容易地把一篇论文中的高数公式应用于产品的实践中。因为R语言我重新学习了高数,让生活中充满数学,生活会变得更有意思。本节并不是完整的高数计算手册,仅介绍了导数计算和偏导数计算的R语言实现。
导数(derivative)是微分学的基本概念,其定义为,若函数y=f(x)在x 0 的某个邻域内有定义,当自变量x在x 0 处取得增加Δx(点x 0 +Δx仍在该邻域内)时,相应的函数取得增量Δy=f(x 0 +Δx)-f(x 0 );如果Δy与Δx之比当Δx趋于0时的极限存在,则称函数y=f(x)在点x 0 处可导,并称这个极限为函数y=f(x)在点x 0 处的导数,记为f'(x 0 ),即
也记作 或 。
通过R语言可以使用deriv()函数直接进行导数的计算,比如要计算y=x 3 的导数,根据导数计算公式,用于手动计算的变形结果为y'=3x 2 ,当x=1时,y'=3,当x=2时,y'=12。
本节的系统环境是:
·Windows 7 64bit
·R:3.1.1 x86_64-w64-mingw32/x64(64-bit)
用R语言程序实现导数计算,代码如下。
> dx <- deriv(y ~ x^3, "x") ; dx # 生成导数公式 expression({ .value <- x^3 .grad <- array(0, c(length(.value), 1L), list(NULL, c("x"))) .grad[, "x"] <- 3 * x^2 attr(.value, "gradient") <- .grad .value }) > mode(dx) # 查看dx变量类型 [1] "expression" > x<-1:2 # 给自变量x赋值 > eval(dx) # 运行求导计算 [1] 1 8 # 原函数的计算结果 attr(,"gradient") # 使用梯度下降法,导函数的计算结果 x [1,] 3 # x=1,dx=3*1^2=3 [2,] 12 # x=2,dx=3*2^2=12
用R语言程序计算的结果,与我们手动计算的结果是一致的。但计算过程其实是有很大区别的,我们手动计算时是通过给定的导数计算公式,变形后完成计算。而用计算机程序计算时,是使用梯度下降法来计算一阶导数,是一种最优化的近似算法。对于手动计算导数时,如果函数比较复杂而且比较难应用可变形的公式,那么手动计算就会有非常大的困难,而计算机程序的方法是一般的导数计算方法,不会受到公式难于变形的影响。
我们使用deriv(expr,name)函数时通常要传2个参数,第一参数expr就是原函数公式,用~号来分隔公式的两边,第二参数name用于指定函数的自变量。deriv()函数会返回一个表达式expression类型变量,再用eval()函数运行这个表达式就可得到计算结果,如上面的代码实现。
如果希望以函数的形式调用计算公式,那么你还需要传第三个参数func,并让func参数为TRUE,参考下面的代码实现。
计算正弦函数y=sin(x)的导数,根据导数计算公式,用于手动计算的变形结果为y'=cos(x),当x=π时,y'=-1,当x=4π时,y'=1。
> dx <- deriv(y ~ sin(x), "x", func= TRUE) ; dx # 生成导数公式的调用函数 function (x) { .value <- sin(x) .grad <- array(0, c(length(.value), 1L), list(NULL, c("x"))) .grad[, "x"] <- cos(x) attr(.value, "gradient") <- .grad .value } > mode(dx) # 检查dx的类型 [1] "function" > dx(c(pi,4*pi)) # 以参数作为自变量,进行函数调用 [1] 1.224606e-16 -4.898425e-16 attr(,"gradient") x # 导函数的计算结果 [1,] -1 # x=pi,dx=cos(pi)=-1 [2,] 1 # x=4*pi,dx=cos(4*pi)=1
对基本的初等函数求导数,通过导数计算公式是可以直接手动完成计算的。下面为一元初等函数的导数计算公式,其中y是原函数,x是y函数的自变量,y'是y函数的导函数。C,n,a为常数,ln表示以自然常数e为底的对数。
接下来,我们分别对这些一元初等函数进行一阶导数的计算。设y为原函数,x是y函数的自变量,且只有一个自变量。
1.常数函数
计算函数y=3+10x的导数,根据导数计算公式,用于手动计算的变形结果为y'=0+10x,常数项3的导数为0,当x=1时,y'=10。
> dx<-deriv(y~ 3+10*x,"x",func = TRUE) # 以函数形式生成导数公式 > dx(1) # 传入自变量,并计算 [1] 13 # 原函数计算结果y=3+10*1=13 attr(,"gradient") x [1,] 10 # 导函数计算结果y'=10*1=10
2.幂函数
计算y=x 4 函数的导数,根据导数计算公式,用于手动计算的变形结果为y'=4x 3 ,当x=2时,y'=32。
> dx<-deriv(y~x^4,"x",func = TRUE) > dx(2) [1] 16 attr(,"gradient") x [1,] 32 # 导函数计算结果y'=4*x^3=4*2^3=32
3.指数函数
计算y=4 x 函数的导数,根据导数计算公式,用于手动计算的变形结果为y'=4 x ln(4),当x=2时,y'=22.18071。
0> dx<-deriv(y~4^x ,"x",func = TRUE) > dx(2) [1] 16 attr(,"gradient") x [1,] 22.18071 # 导函数计算结果y'=4^x*log(4)=4*2^3=22.18071
计算y=e x 函数的导数,根据导数计算公式,用于手动计算的变形结果为y'=e x ,当x=2时,y'=y=7.389056。
> dx<-deriv(y~exp(1)^x ,"x",func = TRUE) > dx(2) [1] 7.389056 attr(,"gradient") x [1,] 7.389056 # 导函数计算结果y'=exp(1)^x=exp(1)^2=7.389056
4.对数函数
计算y=ln(x)函数的导数,根据导数计算公式,用于手动计算的变形结果为y'=1/x,当x=2时,y'=0.5。
> dx<-deriv(y~log(x),"x",func = TRUE) > dx(2) [1] 0.6931472 attr(,"gradient") x [1,] 0.5 # 导函数计算结果y'=1/x=1/2=0.5
计算y=log 2 x函数的导数,根据导数计算公式,用于手动计算的变形结果为y'=1/xlna,当x=3时,y'=0.4808983。但用R语言编程时,只能计算以自然常数为底的对数的导数,对于原函数不是以自然常数为底的对数,首先要变换成以自然常数为底的对数再进行导数计算,根据对数的换底公式,把以2为底的对数转换为以自然常数为底的对数y=log 2 x=lnx/ln2,
> dx<-deriv(y~log(x)/log(2),"x",func = TRUE) > dx(3) [1] 1.584963 attr(,"gradient") x [1,] 0.4808983 # 导函数计算结果y'=1/(x*log(2)=1/(3*log(2)=0.4808983
5.正弦函数
计算y=sin(x)函数的导数,根据导数计算公式,用于手动计算的变形结果为y'=cos(x),当x=π时,y'=-1。
> dx<-deriv(y~sin(x),"x",func = TRUE) > dx(pi) [1] 1.224606e-16 attr(,"gradient") x [1,] -1 # 导函数计算结果y'=cos(x)=cos(pi)=-1
6.余弦函数
计算y=cos(x)函数的导数,根据导数计算公式,用于手动计算的变形结果为y'=-sin(x),当x=π/2时,y'=-1。
> dx<-deriv(y~cos(x),"x",func = TRUE) > dx(pi/2) [1] 6.123032e-17 attr(,"gradient") x [1,] -1 # 导函数计算结果y'=-sin(x)=-sin(pi/2)=-1
7.正切函数
计算y=tan(x)函数的导数,根据导数计算公式,用于手动计算的变形结果为y'=sec 2 (x)=1/cos 2 (x),当x=π/6时,y'=1.333333。
> dx<-deriv(y~tan(x),"x",func = TRUE) > dx(pi/6) [1] 0.5773503 attr(,"gradient") x [1,] 1.333333 # 导函数计算结果y'=1/cos(x)^2=1/cos(pi/6)^2=1.333333
8.余切函数
计算y=cot(x)函数的导数,由于R语言没有cot()函数,所以根据三角公式我们手动变形原函数为y=cot(x)=1/tan(x)后再进行导数计算,根据导数计算公式,用于手动计算的变形结果为y'=-csc 2 (x)=-1/sin 2 (x),当x=π/6时,y'=-4。
> dx<-deriv(y~1/tan(x),"x",func = TRUE) > dx(pi/6) [1] 1.732051 attr(,"gradient") x [1,] -4 # 导函数计算结果y'=-1/sin(x)^2=-1/sin(pi/6)^2=-4
9.反正弦函数
计算y=arcsin(x)函数的导数,根据导数计算公式,用于手动计算的变形结果为 ,当x=π/6时,y'=1.173757。
> dx<-deriv(y~asin(x),"x",func = TRUE) > dx(pi/6) [1] 0.5510696 attr(,"gradient") x [1,] 1.173757 # 导函数计算结果y'=1/sqrt(1-x^2)=1/sqrt(1-(pi/6)^2)=1.173757
10.反余弦函数
计算y=arccos(x)函数的导数,根据导数计算公式,用于手动计算的变形结果为y'= ,当x=π/8时,y'=-1.08735。
> dx<-deriv(y~acos(x),"x",func = TRUE) > dx(pi/8) [1] 1.167232 attr(,"gradient") x [1,] -1.08735 # 导函数计算结果y'=-1/sqrt(1-x^2)=-1/sqrt(1-(pi/8)^2)=-1.08735
11.反正切函数
计算y=arctan(x)函数的导数,根据导数计算公式,用于手动计算的变形结果为y'=1/(1+x 2 ),当x=π/6时,y'=0.7848335。
> dx<-deriv(y~atan(x),"x",func = TRUE) > dx(pi/6) [1] 0.4823479 attr(,"gradient") x [1,] 0.7848335 # 导函数计算结果y'= 1/(1+x^2) = 1/(1+(pi/6)^2)=0.7848335
当我们对一个函数进行多次连续求导计算,就会形成高阶导数。一般地,函数y=f(x)的导数y'=f'(x)仍然是x的函数,我们就把y'=f'(x)的导数叫做函数y=f(x)的二阶导数,记作y'',即
一阶导数的导数叫做二阶导数,二阶导数的导数叫做三阶导数,N-1阶导数的导数叫做N阶导数,习惯上把二阶以上的导数称之为高阶导数。
下面计算函数y=sin(ax)的二阶导数y'',其中a为常数。根据导数计算公式,用手动计算的变形结果,一阶导数为y'=acos(ax),对y'再求导公式变形为,y''=-a 2 sin(ax)
用R语言进行程序实现
> a<-2 # 设置a的值 > dx<-deriv(y~sin(a*x),"x",func = TRUE) # 生成一阶导数公式 > dx(pi/3) # 计算一阶导数 [1] 0.8660254 attr(,"gradient") x [1,] -1 # 导函数计算结果y'= a*cos(a*x)=2*cos(2*pi/3)=-1 > dx<-deriv(y~a*cos(a*x),"x",func = TRUE) # 对一阶导函数求导 > dx(pi/3) [1] -1 attr(,"gradient") x [1,] -3.464102 # 导函数计算结果y'= -a^2*sin(a*x)=-2^2*sin(2*pi/3)=-3.464102
上面二阶导数的计算,我们是手动划分为两次求导进行计算的,利用deriv3()函数其实合并成一步计算。
> dx<-deriv3(y~sin(a*x),"x",func = TRUE) # 生成二阶导数公式 > dx(pi/3) # 计算导数 [1] 0.8660254 attr(,"gradient") x [1,] -1 # 一阶导数结果 attr(,"hessian"), , x x [1,] -3.464102 # 二阶导数结果
我们再计算另外一个二阶导数,计算y=ax 4 +bx 3 +x 2 +x+c,其中a,b,c为常数,a=2,b=1,c=3,根据导数计算公式,手动计算的变形结果,一阶导数为y'=(2x 4 +x 3 +x 2 +x+3')=8x 3 +3x 2 +2x+1,当x=2时,y'=81,对y'再求导公式变形为,y''=24x 2 +6x+2,当x=2时,y''=110。
> dx<-deriv3(y~a*x^4+b*x^3+x^2+x+c,"x",func=function(x,a=2,b=1,c=3){}) # 通过func参数,指定常数值 > dx(2) [1] 49 attr(,"gradient") x [1,] 81 # 一阶导数结果 attr(,"hessian"), , x x [1,] 110 # 二阶导数结果
这样就直接完成了二阶导数的计算,在R语言中二阶导数是可以直接求出的,想计算更高阶的导数就需要其他的数学工具包了。
在一元函数中,我们已经知道导数就是函数的变化率。对于二元函数我们同样要研究它的“变化率”。然而,由于自变量多了一个,情况就要复杂得多。在数学中,一个多变量的函数的偏导数,就是它关于其中一个变量的导数而保持其他变量恒定(相对于全导数,在其中所有变量都允许变化)。偏导数的算子符号为 。记作 f/ x或者f'x。偏导数反映的是函数沿坐标轴正方向的变化率,在向量分析和微分几何中是很有用的。
在xOy平面内,当动点由P(x 0 ,y 0 )沿不同方向变化时,函数f(x,y)的变化快慢一般来说是不同的,因此就需要研究f(x,y)在点(x 0 ,y 0 )处沿不同方向的变化率。在这里我们只学习函数f(x,y)在xOy平面沿着平行于x轴和平行于y轴两个特殊方位变动时,f(x,y)的变化率。
x方向的偏导数:设有二元函数z=f(x,y),点(x 0 ,y 0 )是其定义域D内一点。把y固定在y 0 而让x在x 0 有增量Δx,相应地函数z=f(x,y)有增量(称为对x的偏增量)Δz=f(x 0 +Δx,y 0 )-f(x 0 ,y 0 )。如果Δz与Δx之比当Δx→0时的极限存在,那么此极限值称为函数z=f(x,y)在(x 0 ,y 0 )处对x的偏导数(partial derivative)。记作f'x(x 0 ,y 0 )。
y方向的偏导数:函数z=f(x,y)在(x 0 ,y 0 )处对x的偏导数,实际上就是把y固定在y 0 (看成常数)后,一元函数z=f(x,y 0 )在x 0 处的导数。同样,把x固定在x 0 ,让y有增量Δy,如果极限存在那么此极限称为函数z=(x,y)在(x 0 ,y 0 )处对y的偏导数。记作f'y(x 0 ,y 0 )。
同样,我们可以通过R语言的deriv()函数进行偏导数的计算。下面我们计算一个二元函数f(x,y)=2x 2 +y+3xy 2 的偏导数,由于二元函数曲面上每一点都有无穷多条切线,描述这个函数的导数就会相当困难。如果让其中的一个变量y取值为常数,那么就可以求出关于另一个自变量x的偏导数了,即 f/ x。
下面我们分别对x,y两个自变量求偏导数,设变量y为常数,计算x的偏导数 f/ x=4x+3y 2 ,当x=1,y=1时,x的偏导数 f/ x=4x+3y 2 =7。设变量x为常数,计算y的偏导数 f/ y=1+6xy,当x=1,y=1时,y的偏导数 f/ x=1+6xy=7。R语言程序实现如下。
> fxy = expression(2*x^2+y+3*x*y^2) # 二元函数公式 > dxy = deriv(fxy, c("x", "y"), func = TRUE) > dxy function (x, y) { .expr4 <- 3 * x .expr5 <- y^2 .value <- 2 * x^2 + y + .expr4 * .expr5 .grad <- array(0, c(length(.value), 2L), list(NULL, c("x","y"))) .grad[, "x"] <- 2 * (2 * x) + 3 * .expr5 .grad[, "y"] <- 1 + .expr4 * (2 * y) attr(.value, "gradient") <- .grad .value } > dxy(1,1) # 设置自变量 [1] 6 attr(,"gradient") x y # 计算结果,x的偏导数为7,y的偏导数为7 [1,] 7 7
偏导数的程序计算结果与手动计算结果是一致的。
下面我们再求一个复杂函数的偏导数,计算一个二元函数f(x,y)=x y +e xy +x 2 -2xy+y 3 +sin(xy)在点(1,3)和点(0,0)的偏导数。R语言程序实现如下。
> fxy = expression(x^y + exp(x * y) + x^2 - 2 * x * y + y^3 + sin(x*y)) > dxy = deriv(fxy, c("x", "y"), func = TRUE) > dxy(1,3) # 设置自变量 [1] 43.22666 attr(,"gradient") x y [1,] 56.28663 44.09554 # 计算结果,x的偏导数为56.28663,y的偏导数为 44.09554 > dxy(0,0) [1] 2 attr(,"gradient") x y [1,] NaN -Inf # 计算结果,x的偏导数无意义,y的偏导数负无穷大
对于计算结果有异议的同学,可以尝试手动计算。
本节我们学习了用R语言做高等数学的导数计算,真的是非常方便,这下更有动力学习高数了。