首 页 中国教育 高校科技 教育信息化 教育在线 教育舆情 CERNET 下一代互联网
CERNET第三十一届学术年会
  • 中国教育人博客
  • 天下教育
  • 考试培训
  • 中小学教育
  • 家庭教育
  • 就业创业
  • 菁菁校园
  • 分享空间
 站内搜索:
 特别推荐:
 当前位置:EDU首页 > 中国教育 > 高等教育 > 高教新闻
人民日报:大数据还有不少潜能
2014-04-30    人民日报

字体大小:

  能预测宏观趋势,但采集、管理、分析技术还待完善

  大数据还有不少潜能

  近两年来,大数据被公众广泛讨论,甚至成为不少商家宣传营销的卖点。毋庸置疑,智能设备的发展和普及,使海量的数据采集成为可能。但大数据并不是单纯的“数据大”,它更蕴含着一种计算和思维方式的转变,想要发挥出大数据的洞察力,还面临着采集、管理、分析数据的挑战。这些障碍如何破除?大数据在未来将如何应用,能否创造出更大的价值?这些问题值得我们在大数据热中,做出冷静判断。

  ——编者

  4月26日,清华大学成立“清华—青岛数据科学研究院”,同时召开大数据时代高端论坛。就在此前两天,百度在第四届技术开放日上,正式宣布对外开放大数据引擎,提供大数据存储、分析及挖掘的技术能力。大数据被学界纳入研究范畴,商家开放引擎,这是否意味着大数据应用进入了一个新阶段?

  传统统计方法追求精确,大数据只预测宏观趋势

  本是技术概念的大数据,如今越来越像一种营销手段。从汽车、化妆品到体育,在营销人员口中,似乎所有行业都可以借助大数据,精确定位、找到消费者,预测趋势、赢得未来。

  中国人民大学新闻学院教授喻国明认为,目前从国内的情况看,真正运用大数据分析成功的案例其实不多,很多公司都是将大数据作为一个营销噱头,所做的分析也主要是基于传统的数据分析方法。

  事实上,对于数据多大能称之为“大数据”,业界并没有统一的认识,通常认为100TB(太字节)是大数据的门槛。简而言之,传统方法无法处理的数据即为大数据。

  大数据的产生得益于移动互联网以及智能手机、各种智能穿戴产品的发展,人们行为、位置,甚至身体的生理特征等数据都可以便捷地被记录,这使海量数据采集成为可能。事实上,目前数据采集量正呈现快速的增长趋势。一家国际数据统计机构最新预测指出,2020年,全世界产生的数据量有望达到40ZB(泽字节,1泽字节等于10亿太字节)。

  但大数据不能单纯理解为数据大。大数据研究专家、北京航空航天大学校长怀进鹏表示,大数据具有“规模大、变化快、种类杂、价值密度低”四个特征,是对传统计算和思维方式的一种挑战。

  首先,因为几乎每个数据点都可以采集,全面数据代替了抽样、片面、局部的数据。“拿炒菜打比方,传统的抽样,我们需要在开始和中间时候‘尝一尝’,‘尝一尝’就是抽样数据,但在大数据时代,随机抽样的方式可能就失效了。”怀进鹏说。

  怀进鹏认为,因为抽样分析时数据测量能力有限,统计追求的是精确,希望用最少数据获得最多的信息。而大数据比较杂乱,完整的精确不存在,也不再是追求的绝对目标,大数据只需对宏观趋势给出快速预测。

  另一个改变是,从关注因果转向数据之间关联。在大数据时代,“数据背后的原因不再重要,人们只需要知道数据之间有统计相关性就行。仅需知其然,无需知其所以然。”怀进鹏说。

  在大数据的支持者看来,数据已经能够自己说话,传统的科学统计模型已经过时,理论也可能被终结。

打印】 【关闭】 【推荐给好友 】 【页面纠错

 

  延伸阅读
· 大数据的新算法:简化数据分类
· 教育思考:大数据颠覆10个家庭教育常识
· 倪明选:大数据如何改变世界
· 大数据催生新兴职业 数据分析师成IT界"大熊猫"
· 教师学生怎样应对大数据走进日常课堂
· 大数据时代帮你速配美国名校
· 大数据来袭:贯彻千年教育真谛
· 大数据视域下网络教育研究新范式
· 国际大数据与信息质量权威会议在西安交大召开
· 教育的大数据在哪儿?
  投稿
  诚邀合作
 010-62603942、62603049
  邮箱:
  liufang#cernet.com
  wangshuang#cernet.com
       >>详情点击
建一流大学
·EDU聚焦:校园"毒跑道"
·快乐暑期安全教育别放松
·聚焦:毕业生迎来创业季
·教育3.15:优化教育环境
·3-6岁儿童学习发展指南
·开学第一课历年视频资料
  部委动态
·国务院常务会议讨论...
·教育部关于做好2015...
·教育部部署寒假工作 ...
·教育部要求落实教师...
·国务院教育督导办专...
  教育黄页
·国内外网络公开课导航
·教育院/系/研究所名录
·中国教育网络
·中国大学教学
·EDU免费精华视频课堂
中国教育和科研计算机网版权与免责声明
  ①凡本网未注明稿件来源的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的 媒体、网站,在下载使用时必须注明“稿件来源:中国教育和科研计算机网”,违者本网将依法追究责任。 
  ②本网注明稿件来源为其他媒体的文/图等稿件均为转载稿,本网转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。 
 
 版权所有:中国教育和科研计算机网网络中心    CERNIC, CERNET
京ICP备15006448号-16 京网文[2017]10376-1180号 京公网安备 11040202430174号
关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@cernet.com