队友找到了一篇文章,关于利用NBA数据预测赛季得分。

利用NBA数据预测赛季得分

这里的思路是多变量线性回归。

用到了R语言的 lm()函数。下面简单介绍一下 lm()函数。


lm()是R语言中经常用到的函数,用来拟合回归模型。它是拟合线性模型最基本的函数。

lm()格式如下:

myfit<-lm(formula,data)

其中,formula指要拟合的模型形式,data是一个数据框,包含了用于拟合模型的数据。结果对象(本例中是myfit)存储在一个列表中,包含了所拟合模型的大量信息。表达式(formula)形式如下:

Y~X1+X2..Xn

举个例子,我们依次在R中输入以下代码:
a<-c(1,2,3,4,5)
b<-c(2,4,6,8,10)
mydata<-data.frame(a,b)

上面的意思是我们分别定义了a,b两个向量,并赋值,然后把它们都加到了数据框mydata中。
我们想要知道向量a和向量b之间有什么关系,虽然我们一眼就能看出向量b对应的数值是a的2倍,但是计算机并不知道啊。我们仅仅以一个简单的例子来说明问题。
为了弄清楚,我们然后输入以下代码:

myfit<-lm(a<-b)
summary(myfit)
然后系统就会打印出myfit的一些参数,其中包括以下内容:
          Estimate
(Intercept)1.12347e-15
b 5.00000e-01

这里的1.12347e-15表示1.12347乘以10的-15次方,是一个很小的数值,同理,5.00000e-01表示的就是5.00000乘以10的-1次方,为0.5.
所以a,b的关系可表示为:

a=0.00000000000000112347+0.5*b

预测值与实际值很相似。这里仅仅是一个简单的例子,它还可以扩展到多个参数,具体的情况大家可以探索。
因此本人正在读《R语言实践》,所以引用了书中的很多内容,在此说明。
最后,如果各位发现本文有任何错误,欢迎指正,谢谢阅读。

转载于R语言lm()函数

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐