投稿问答最小化  关闭

万维书刊APP下载

R语言|数据清洗基础3(选择或者删除列)

2023/5/8 17:22:04  阅读:103 发布者:

保留列

#选择仅想保留的列

spss_data%>%

  select(ID, householdID,communityID,ba000_w2_3)%>%

names()#选择要保留的变量,并展示变量名

#xrgenderzfrgender变量放在前面

spss_data %>%

  select(xrgender, zfrgender, everything()) %>%

  names()

#选定xrgenderzfrgender变量还有最后一列变量

spss_data %>%

  select(xrgender, zfrgender, last_col()) %>%

  names()

#选定除了xrgenderzfrgender变量的其余变量

spss_data %>%

  select(!c(xrgender,  zfrgender)) %>%names()

#选择包含某字符的列

spss_data %>%

  select(xrgender,  zfrgender, contains('id')) %>%names()#仅保留包含‘id'字符的列

#applies a function to all columns and selects those which are TRUE

spss_data %>%

  select(xrgender,  zfrgender, where(is.character)) %>%names()#仅保留字符型变量

#选择以某些字母/数字开头的变量

spss_data %>%

  select(starts_with('b')) %>%names()#选择以字母‘b'开头的变量

#选择以某些字母/数字结尾的变量

spss_data %>%

  select(ends_with('01')) %>%names()#选择以‘01'结尾的变量

#选择多个匹配字符

spss_data%>%

  select(matches("bb|bd|z")) %>%   # "|"表示或

  names()

#只要有一个存在就不会报错

spss_data %>%

  select(any_of(c("date_onset", "village_origin", "bb001_w3_2", "village_residence", "village_travel"))) %>%

  names()

删除列

 用符号-” 表示删除

##删除列

spss_data %>%

  select(-c(ID, ba002_1:bc002_w3_1)) %>% # 删除 ID 和从变量ba002_1bc002_w3_1的所有变量

  names()

#R基本语法删除列

spss_data$ID<-NULL

names(spss_data)

参考文献

https://epirhandbook.com/en/cleaning-data-and-core-functions.html

转自:“科研写作成长记”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com