欢迎访问抖客教程网!

抖客教程网

您现在的位置是:主页 > 办公课堂 > Excel教程 > Excel数据 >

Excel数据

从少量样本中挖掘重要信息

发布时间:2023-09-04 01:12:08Excel数据评论
数据挖掘是一种从信息化社会的复杂数据中,挖掘宝藏的方式和措施,那么奈何从少量样本中挖掘重要信息呢?在面临许大都据时,奈何利用最佳的方式举办阐明至关重要;若没有合

  数据挖掘是一种从信息化社会的复杂数据中,挖掘宝藏的方式和措施,那么奈何从少量样本中挖掘重要信息呢?在面临许大都据时,奈何利用最佳的方式举办阐明至关重要;若没有符合的数据,则必需从收集数据着手。此时,你会因为收集复杂的数据很是坚苦而放弃数据挖掘吗?

  首先,请各人检讨一项问卷侦查的功效.有本书叫《日本的开关》  (庆应义塾大学佐藤稚彦研究室著,逐日新闻社,2004),个中记实了用手机收集的问卷侦查的统计功效。此项侦查操作手机询问被侦查者喜欢两者中的哪一个(选择),然后发布侦查出来的比例。特点在于,操作手机快速通报信息的成果,在极短的时间内免费从2-3万的复杂人群中得到答复。

  详细的侦查内容如下所示,请读者也试着答复一下。

  问题1:“日本”的读音,你喜欢“NIHON”照旧“NIPPON”?

  有22936名答复者;个中,喜欢“NIHON”的占61%,喜欢“NIPPON”的占39%。利用答复者多达2-3万人的“日本的开关”的侦盘查卷,询问43名数据挖掘同仁的意见。那么,功效与“日本的开关”有没有差别呢(如下图1和图2)? 关于“日本”读音的问题,答复功效是,“NIlHON”=70%,“NIPPON”=30%(图2No.2)。答复者比例是43/02936,不敷“日本的开关”的总体答复者的0.2%。可是,从答复功效看,两者都是“NIHON”的比例居高,具有沟通倾向。两者的相对误差都是15%。

  

从少量样本中挖掘重要信息

  对10项差异类此外内容举办问卷侦查,请答复者从a、b中选择个中一个。然后,较量样本数许多(2万件以上)与样本数很少时(43件)的功效有何差异。

  功效如图2所示。只有43名样本数的侦查与“日本的开关”侦查的选择a、b的倾向是一致的。并且相对误差比例都在20%以下。针对所有问题的答复环境,两者没有较大差别。也就是说,样本数多时和样本数少时的答复功效的倾向大抵沟通。虽然,抖客教程网,收集数据时要出格留意不能出別偏差。假如利用随机抽样,可以判定纵然是少量样本数,与高出它500倍的复杂样本数的功效具有沟通倾向。因此,在没有大量数据的环境下,可以把少量数据看做缩略图,以此捕获样本倾向,举办预测。 

  【图1 】

问卷侦查的10项内容

 

  【图2】

问卷侦查功效(选择a的答复比例%)

  各人是不是认为数据挖掘必然需要收集大量数据呢?请先从用Excel阐明身边的数据开始吧,前提是清楚数据阐明是做什么的!用少量样本数阐明,也可以掌握倾向和范例。学会收集阐明身边的数据并加以机动运用很是重要。从笔者以往的履向来看,纵然只存在少量数据,也叮从中获得十分有用的信息。

热心评论

评论列表