二(八十八):大数据的另一面

in #cn5 years ago (edited)

凡是都有两面,每一面都有局限,现在大热的大数据也不例外。

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

图源:pixabay

现在很多公司都利用大数据来制定策略,有针对性的对某些特殊群体提供服务,有了数据就能预测客户喜好,就能开发出受欢迎的产品。

但是,不要以为大数据真的能知晓你的一切——你并没有那么重要,任何一个大数据挖掘公司不会针对你量身定制专门的策略,他们就像大海捞针一样,搜集着所有人的信息。

举例来说,你上网浏览各种信息,大数据公司就会根据你的浏览习惯,来建模,来分析你的喜好。

不过,已经有人做过研究,什么样的信息浏览量最大呢?是含有色情信息的网页。因为这是人性。几乎所有的人看到了,都回去点击一下,但是这代表什么呢?是代表你很感兴趣?很和你的口味?你会为了这个而去付费?

显然不是这样。

这只是人们的共性,并不是你一个人的特点。

所以说,大数据有时候挖掘出来的,并不符合你的实际情况,反而它统计出了人们普遍的共性。

搜集数据很容易,但是分析数据就很难了。

这就像你我学习,会在硬盘里搜集很多学习资料,但是,大部分时候,那些资料永远就静静的躺在硬盘里了,你再也不会去看它们。

很多大数据公司也是这样,搜集了海量的数据,但是数据挖掘工作还远远不够,所以就算你所有的信息都在那里,离他们真正地分析出你这个人,还差十万八千里呢。

放宽心,你没那么重要,不必过分担心。当然,必要的隐私保护还是要的,今天只是告诉你,万一不小心泄露了,也不必杞人忧天,生活还要继续~~


零一二历史汇总:
列表太长,具体请看:
二(八十七)

Sort:  

你今天过的开心吗?欢迎在steemauto里设置跟赞 @cnbuddy 给整个cn区点赞倘若你想让我隐形,请回复“取消”。

机机这里说的有点不准确,大数据与统计是完全不同的目的(虽然会大量使用统计学习技术),精准、针对性、个性化是大数据的典型应用,数据大、多、快、全只是输入,不是输出的特点

Posted using Partiko iOS

哈哈,我们说的之间没有矛盾鸭

哈哈,是的,之前看得不够仔细,我错了。可能看到中间一段讲共性的部分,觉得逻辑有点生硬,所以提了一下😓

Posted using Partiko iOS

Coin Marketplace

STEEM 0.25
TRX 0.11
JST 0.033
BTC 63036.79
ETH 3067.42
USDT 1.00
SBD 3.82