-
大数据趋势下如何实现NAS存储与容灾备份?
所属栏目:[大数据] 日期:2018-04-12 热度:114
1、数据量暴增,存储市场风云变幻 据IDC预测,全球的数据量正面临一个爆炸性增长,到2020年即将达到44ZB,那44ZB是个什么概念呢? 如果以1KB=1024MB计算,1ZB的数据量换成 128G iPad的高度,可达地球到月球距离的6.6倍。 这些数据中,90%的增量来自于非结构[详细]
-
数据清洗的经验与教训 Data Cleaning
所属栏目:[大数据] 日期:2018-04-12 热度:108
小学的时候我统计过同学里有多少要订课间牛奶:每人分别需要什么口味和什么大小,应收多少钱。最后这份按照座位排序的表格要和一张学号表格按照同学姓名对应起来,并计算每种口味订购数量和每人应收款。过程中我遇到了很多困难,例如有同学订了多种口味,[详细]
-
被大数据遗忘的基础奠基-Log
所属栏目:[大数据] 日期:2018-04-12 热度:70
在大数据时代,Log是关系数据库对计算机行业的伟大贡献,更是基础技术之一。然而在大家热烈讨论GFS, NoSQL,乃至Paxos, LSM tree等词语的时候,Log这个基础技术以及它对大数据行业的巨大贡献却一直以来都被业界所忽略。除了Kafka作者之一Jay Kreps2013年[详细]
-
如何在多系统和网络拓扑中构建高性能模型?
所属栏目:[大数据] 日期:2018-04-12 热度:79
这个文档和附带的脚本详细介绍了如何构建针对各种系统和网络拓扑的高性能可拓展模型。这个技术在本文档中用了一些低级的 Tensorflow Python 基元。在未来,这些技术将被并入高级 API。 输入管道 性能指南阐述了如何诊断输入管道可能存在的问题及其最佳解决[详细]
-
大数据“喂养”红利下,知识图谱如何走上新道路?
所属栏目:[大数据] 日期:2018-04-12 热度:183
大数据时代的到来,为人工智能的飞速发展带来前所未有的数据红利。在大数据的喂养下,人工智能技术获得了前所未有的长足进步。其进展突出体现在以知识图谱为代表的知识工程以及深度学习为代表的机器学习等相关领域。随着深度学习对于大数据的红利消耗殆尽[详细]
-
服务端开发指南与最佳实战:数据存储技术,MySQL 数据库安全性
所属栏目:[大数据] 日期:2018-04-12 热度:191
数据库的安全性,即保护数据库,防止未经授权或不合法的使用而造成的数据泄漏和更改破坏。因此,保护数据库的安全性的一般方法是设置用户标识和权限控制。 MySQL 权限控制,分为两个步骤。第一步骤,服务器会检查是否允许连接。因为创建用户的时候会加上主[详细]
-
TensorFlow的开源与Hadoop的开源有什么不同?
所属栏目:[大数据] 日期:2018-04-12 热度:149
最近看TensorFlow代码的时候,用Git pull下来最新的master一看,哇好多的更新,然后点击去之前看到一半的cc文件继续看,好多地方都改变了。但是一看Git log,有好多巨大的commit叫什么 Merge commit for internal changes, Merge for github,没有任何的其[详细]
-
最适合Java开发者的大数据工具和框架
所属栏目:[大数据] 日期:2018-04-12 热度:126
当今编程人员面对的最大挑战就是复杂性,硬件越来越复杂,OS越来越复杂,编程语言和API越来越复杂,我们构建的应用也越来越复杂。根据外媒的一项调查报告,以下列出了Java程序员在过去12个月内一直使用的一些工具或框架,或许会对你有意义。 先来看看大数[详细]