投稿问答最小化  关闭

万维书刊APP下载

R语言|数据清洗基础1(数据导入和标签)

2023/5/8 17:25:30  阅读:185 发布者:

数据导入

install.packages('rio')

library(rio)

data<-import('D:/data.sav')#数据导入

head(data)#预览前6

标签命名

##数据集概括预览(可以预览数据集中多少个变量,每个变量缺失多少,最大值最小值,数据类型等信息)

install.packages('skimr')

library(skimr)

skimr::skim(data)

##变量标签命名

#预览变量名

names(data)

install.packages("expss")

library(expss)

data=apply_labels(data, ba002_1='Birth data', xrtype='participants type')

val_lab(data$xrtype)=num_lab('1 new

                             2 ever participants'

)

table(data$xrtype)

val_lab(data$xrtype)

#去掉变量标签

drop_var_labs(data$xrtype)

添加变量标签前后对比

##变量标签的应用

with(data, table(ba002_1, xrtype))#普通交叉表

use_labels(data, table(ba002_1, xrtype))#使用标签交叉表

with(data,

     barplot(

       table(ba002_1, xrtype),

       beside = TRUE,

       legend = TRUE)

)#普通条图

use_labels(data, boxplot(ba002_1~xrtype))#带标签箱式图

导入SPSS数据(直接导入标签)

#包调用安装

install.packages('heaven')

install.packages("expss")

library(haven)

library(expss)

#导入存在D盘的SPSS数据集

spss_data = haven::read_spss("D:/data.sav")

val_lab(spss_data$bb001_w3_2)#查看变量标签

# add missing 'labelled' class

spss_data = add_labelled_class(spss_data)

参考文献

https://epirhandbook.com/en/cleaning-data-and-core-functions.html

https://cran.r-project.org/web/packages/expss/vignettes/labels-support.html

转自:“科研写作成长记”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com