大数据思维和学习中的应用
如网上某个明星随意的一张小区自拍照,普通吃瓜群众看到的只是一个美女,在专业人士手里,可以看到这张照片背后该明星用的手机型
但在专业人士手中,一张计算机图片绝不仅仅只是一张图片。 如网上某个明星随意的一张小区自拍照,普通吃瓜群众看到的只是一个美女,在专业人士手里,可以看到这张照片背后该明星用的手机型号,拍摄时的地理位置等信息,进而推断出她住的小区,消费水准等更多信息。 这一切的秘密都藏在元数据中。 元数据是图片生成时自动生成的,不会自动随数据的移动而消失。如你把这张照片发布到网上,它会像一个影子样跟随数据一起。 这么一说元数据干的都是坏事,先别急着下结论。 元数据可是整个大数据时代的地基,没有它,大数据也就无从谈起。 在过去,数据量太少的时候,元数据起到的作用有限大数据学习,如以上明星拍照的例子,一张照片再怎么分析,我们推断的信息也有限。 但当数据大到一定程度,我们假定个场景:比如这位明星特爱自拍,每到一处,就拍几十张照片,经过两三年的积累,他的图片库有几万张照片了。这个时候我们就不只是可以推断出以上信息了。 我们暂忽略这几万张照片本身的内容,只看这些照片背后的元数据串起来可以得到什么? 根据拍摄位置画出明星的生活轨迹。预测出她未来一段时间内的生活行为。预测了有什么用?狗仔队最喜欢干的事。根据拍照时间计算出拍照的时间习惯,进而推断出她的生活习惯。 如果再结合照片本身的内容,我们可以获得更多: 拍照水准个人偏好,如风景,人物等个人表情判断她心情的变化曲线,结合生理学知识预测生理周期都不成问题。社交圈信息。 这样列下去还可以更多,甚至可以发现连她自己都不知道的信息。 这一切的前提是足够大量的数据和这些数据中的元数据信息。 回到正题,学习中怎么利用大数据思维呢? 学习是大脑的一个运动过程。 如果把大脑比作一台机器,机器天生就有运行环境要求,不同环境参数情况下,运行效率差别非常大。大脑还是个非常苛刻的机器,而且这些参数因人而异,每个人的大脑运行时的参数要求和效率值都不一样。 如果把大脑的运作比作机器运作,那么对大脑在运作过程的记录就是元数据。 这样的元数据包括学习的起始时间,学习时的心情,学习效率,学习时的环境等。 我们经常会遇到的问题,什么环境下,一次背诵多少单词效率最高? 这样的答案往往因人而异。 如果有一种手段,我们可以把这些元数据记录下来,当经过一段时间后,简单的统计分析我们可以发现很多有意思的规律,比如:一次背诵多少单词效率最高? 一次学习多长时间效率最高? 什么灯光环境最适合学习? 一个章节什么样比例的新知识下学习效率最高? …… 当然,这些统计在数据量很小的时候会有偏差,甚至错误,但随着数据的越来越多,统计的结果会趋向于越来越精准。从而我们可以发现什么样的参数情况下,大脑的运行效率最高,这就是大数据的应用过程。 以上关于学习效率的答案前人已经做了很多工作,如: 1.当新知识占比15%时学习效率最高。 2.以25分钟或者45分钟为周期学习效率最高 (番茄工作法) 3.艾宾浩斯遗忘曲线。 但别忘记: 大脑足够复杂,而且因人而异。 以上这一切的数据都是通用数据,统计学家得出这样结论的基础是基于人群的概论值,只是一个适合多数人的概率,并不一定适合到每个人。 人脑是个非常复杂的设备,人与人之间大脑的运行效率差距非常巨大,这其实也是普适教育一个非常困难的地方,没法做到因人而异,没有一种方法适合所有人。 但如果有大数据技术的存在,我们确可以精确预测出每个人大脑最适合学习时的“参数”。 下次起试试记录下大脑运作过程的元数据,这个过程并不难,数据量越来越多的时候会发现一些可能自己都不一定注意到的地方,让自己更了解自己。 (编辑:武汉站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |