学姐记忆面包121——大数据与小数据
2022/11/1 14:08:53 阅读:172 发布者:
大数据便是指通过非抽样的方式获得全部数据的方法。大数据的产生得益于半导体行业的迅速发展,计算成本和存储成本的不断下降,以及移动互联网的发展和移动智能手机的普及。智能手机是一部各种传感器的集合,陀螺加速器、GPS 等等每天都会产生大量的数据,这些数据会记录一个人的生活特点,随时随地接入互联网,则为这些数据不断上传提供了便利。个人通过让渡自己的个人数据来获取更为个性化的服务,这也为基于移动互联网的服务提供商提供了收集信息的便利。
大数据的最大的特诊就是获取了全部的数据,这样的数据是真正的具有整体特征的数据,通过分析这些数据可以获得更为真实有效的结论。但大数据也产生了很多问题,比如隐私的泄露,对于大量数据的筛选,以及对于算法的要求等等。
传统的抽样调查的方法尽管存在一些问题,但仍然具有很多优势,例如深访在访问的深度方面更有效,等等。
大数据的孤岛危机(平台之间的不相通往往使得各个平台的数据没有完整的意义)。对事物的理解需要数据,但更需要分析思维,在大数据时代,理论并非不重要,而是变得更加重要。我们所指的理论也并非僵化一成不变的固守旧有理论,而是在处理问题的过程中意识到海量数据所带来的复杂性,坚持分析方法和理论的不断创新。大数据时代需要的不只是全数据、海量数据、实时数据,而是真正的开放、更可能接近精确、着眼于人和社会的分析方法和思路。封闭的数据平台,对断裂数据、缺失数据在分析上构成的风险的忽视会使我们仍然停留在小数据时代,更糟糕的是,数据还存小数据时代,方法上却已经在单纯鼓吹各种应对大数据的新技术,这种不匹配造成的混乱比大数据本身带来的混乱还要危险。
转自:“新传记忆面包”微信公众号
如有侵权,请联系本站删除!