广义线性模型(GLM)是常见正态线性模型的直接推广,它可以适用于连续数据和离散数据,特别是后者,如属性数据、计数数据。这在应用上,尤其是生物、医学、经济和社会数据的统计分析上,有着重要意义。对于广义线性模型应有一下三个概念:第一是线性自变量,它表明第i个响应变量的期望值E(yi)只能通过线性自变量β...
安装包install.packages('purrr')mapmap表示映射,可以在一个或多个列表/向量的每个位置上应用相同函数进行计算。map函数的映射对象只有一个。map(.x,.f,…).x:列表或向量;.f:映射函数;...:映射函数的其他参数#加载包library(purrr)#单个向量m...
R语言的基础包中提供了两种类型的时间数据,一类是Date日期数据,它不包括时间和时区信息,另一类是POSIXct/POSIXlt类型数据,其中包括了日期、时间和时区信息。基本总结如下:日期data,存储的是天;时间POSIXct存储的是秒,POSIXlt打散,年月日不同;日期-时间=不可运算。一般来...
先导入igraph包:library(igraph)graph包最简单的用法就是graph方法,两句代码就完成绘制如下所示,1的loop表示为(1,1),1和2之间有3条edge,表示为(1,2,1,2,1,2)g
控制R语言科学计算法显示有两个option:digitis和scipen。介绍的资料很少,而且有些是错误的。经过翻看R语言的帮助和做例子仔细琢磨,总结如下:默认的设置是:getOption("digits")[1]7getOption("scipen")[1]...
函数mean>mean(x)>numx1x2x310378050.5089.4581.1880.45此时对编号也求了平均值,不过往往我们只想对后面的数据求平均值。而且此时会出现一个警告。因为x是一个数据框,不是数值,所以不能直接用mean()函数。函数colMeans()>colM...
一直觉得只要是数字,不管是什么类型的,都可以通过as.numeric()函数转换为对应的numeric类型的数字,例如x
统赛B组我们选择了图书馆课题,获得了数据,一时兴起尝试处理了一下门禁的数据,遇到了一些问题,特此记下,方便以后查阅。门禁数据分为两个变量,第一列为学号,第二列为进门时间,原本是Excel文件,为了方便读入R我把它另存为了csv文件,但在读入R以后出现了一些问题1、学号被存储为了科学计数法表示的数字2...
先上图R语言的REmap包拥有非常强大的空间热力图以及空间迁移图功能,里面内置了国内外诸多城市坐标数据,使用起来方便快捷。开始首先安装相关包install_packages("devtools")install_packages("REmap")library...
用均值替换、回归插补及多重插补进行插补#设置工作空间#把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("E:\\R_workspace\\R语言数据分析与挖掘实战\\chp4")#读取销售数据文件,提取标题行inputfile
可使用aggregate函数如:aggregate(.~ID,data=这个数据框名字,mean)如果是对数据框分组,组内有重复的项,对于重复项保留最后一行数据用:pcm_df$duplicated
使用系统:centos6.464bit在R语言中可以使用png()等函数生成图片,例如:png("aa.png")可以生成图片。但是如果你是通过shell远程连接到系统上,可能会碰到如下错误:>png("aa.png")错误于.External2(C_X...
在R语言中paste是一个很有用的字符串处理函数,可以连接不同类型的变量及常量。函数paste的一般使用格式为:paste(...,sep="",collapse=NULL)其中…表示一个或多个R可以被转化为字符型的对象;参数sep表示分隔符,默认为空格;参数collapse可选...
legend(x,y=NULL,legend,fill=NULL,col=par("col"),border="black",lty,lwd,pch,angle=45,density=NULL,bty="o",bg=par("bg...
在R语言中,par函数可以设置图形边距,其中oma参数设置outermargin,mar参数设置margin,这些边距有什么不同呢,通过box函数可以直观的看到box默认在当前图形绘制边框,第一个参数which="plot",所以在当前图形上绘制边框which的值除了plot之外...
最近编写了Fisher判别的相关代码时,需要与已有软件比照结果以确定自己代码的正确性,于是找到了安装方便且免费的R。这里把R中进行Fisher判别的方法记录下来。1.判别分析与Fisher判别不严谨但是通俗的说法,判别分析(DiscriminantAnalysis)是一种多元(多个变量)统计分析方法...
可读性极低,而且其实也没必要用R语言写,图个乐罢了p=c(0.4,0.2,0.2,0.1,0.1)###输入形如c(0.4,0.2,0.2,0.1,0.1)的概率向量,即每个待编码消息的发生概率p1=p###将概率向量另存,最后计算编码效率要用mazijuzhen=matrix(,nrow=leng...
- 上一页
- 下一页