R语言|数据清洗基础1(数据导入和标签)
2023/5/8 17:25:30 阅读:185 发布者:
数据导入
install.packages('rio')
library(rio)
data<-import('D:/data.sav')#数据导入
head(data)#预览前6行
标签命名
##数据集概括预览(可以预览数据集中多少个变量,每个变量缺失多少,最大值最小值,数据类型等信息)
install.packages('skimr')
library(skimr)
skimr::skim(data)
##变量标签命名
#预览变量名
names(data)
install.packages("expss")
library(expss)
data=apply_labels(data, ba002_1='Birth data', xrtype='participants type')
val_lab(data$xrtype)=num_lab('1 new
2 ever participants'
)
table(data$xrtype)
val_lab(data$xrtype)
#去掉变量标签
drop_var_labs(data$xrtype)
添加变量标签前后对比
##变量标签的应用
with(data, table(ba002_1, xrtype))#普通交叉表
use_labels(data, table(ba002_1, xrtype))#使用标签交叉表
with(data,
barplot(
table(ba002_1, xrtype),
beside = TRUE,
legend = TRUE)
)#普通条图
use_labels(data, boxplot(ba002_1~xrtype))#带标签箱式图
导入SPSS数据(直接导入标签)
#包调用安装
install.packages('heaven')
install.packages("expss")
library(haven)
library(expss)
#导入存在D盘的SPSS数据集
spss_data = haven::read_spss("D:/data.sav")
val_lab(spss_data$bb001_w3_2)#查看变量标签
# add missing 'labelled' class
spss_data = add_labelled_class(spss_data)
参考文献
https://epirhandbook.com/en/cleaning-data-and-core-functions.html
https://cran.r-project.org/web/packages/expss/vignettes/labels-support.html
转自:“科研写作成长记”微信公众号
如有侵权,请联系本站删除!