-
为什么说Python 是大数据全栈式开发语言?
所属栏目:[大数据] 日期:2018-04-05 热度:143
副标题#e# 前段时间,ThoughtWorks在深圳举办一次社区活动上,有一个演讲主题叫做Fullstack JavaScript,是关于用JavaScript进行前端、服务器端,甚至数据库(MongoDB)开发,一个Web应用开发人员,只需要学会一门语言,就可以实现整个应用。 受此启发,我发[详细]
-
物联网下:大数据属于谁?
所属栏目:[大数据] 日期:2018-04-04 热度:120
数据隐私与访问的讨论在物联网时代变得越来越复杂 在之前一些文章中,我已经警告过一些组织机构机构可能很快就会遭遇数据问题被锁定、赶出或以其他方式禁止访问,以有助于优化未来业务的关键新数据源的可能性。 虽然我相信每个数据驱动的组织机构现在就应[详细]
-
大数据趋势下如何实现NAS存储与容灾备份?
所属栏目:[大数据] 日期:2018-04-04 热度:77
1、数据量暴增,存储市场风云变幻 据IDC预测,全球的数据量正面临一个爆炸性增长,到2020年即将达到44ZB,那44ZB是个什么概念呢? 如果以1KB=1024MB计算,1ZB的数据量换成 128G iPad的高度,可达地球到月球距离的6.6倍。 这些数据中,90%的增量来自于非结构[详细]
-
数据清洗的经验与教训 Data Cleaning
所属栏目:[大数据] 日期:2018-04-04 热度:164
小学的时候我统计过同学里有多少要订课间牛奶:每人分别需要什么口味和什么大小,应收多少钱。最后这份按照座位排序的表格要和一张学号表格按照同学姓名对应起来,并计算每种口味订购数量和每人应收款。过程中我遇到了很多困难,例如有同学订了多种口味,[详细]
-
被大数据遗忘的基础奠基-Log
所属栏目:[大数据] 日期:2018-04-04 热度:81
副标题#e# 在大数据时代,Log是关系数据库对计算机行业的伟大贡献,更是基础技术之一。然而在大家热烈讨论GFS, NoSQL,乃至Paxos, LSM tree等词语的时候,Log这个基础技术以及它对大数据行业的巨大贡献却一直以来都被业界所忽略。除了Kafka作者之一Jay Kre[详细]
-
如何在多系统和网络拓扑中构建高性能模型?
所属栏目:[大数据] 日期:2018-04-04 热度:130
副标题#e# 这个文档和附带的脚本详细介绍了如何构建针对各种系统和网络拓扑的高性能可拓展模型。这个技术在本文档中用了一些低级的 Tensorflow Python 基元。在未来,这些技术将被并入高级 API。 输入管道 性能指南阐述了如何诊断输入管道可能存在的问题及[详细]
-
大数据“喂养”红利下,知识图谱如何走上新道路?
所属栏目:[大数据] 日期:2018-04-04 热度:151
副标题#e# 大数据时代的到来,为人工智能的飞速发展带来前所未有的数据红利。在大数据的喂养下,人工智能技术获得了前所未有的长足进步。其进展突出体现在以知识图谱为代表的知识工程以及深度学习为代表的机器学习等相关领域。随着深度学习对于大数据的红利[详细]
-
服务端开发指南与最佳实战:数据存储技术,MySQL 数据库安全性
所属栏目:[大数据] 日期:2018-04-04 热度:60
数据库的安全性,即保护数据库,防止未经授权或不合法的使用而造成的数据泄漏和更改破坏。因此,保护数据库的安全性的一般方法是设置用户标识和权限控制。 MySQL 权限控制,分为两个步骤。第一步骤,服务器会检查是否允许连接。因为创建用户的时候会加上主[详细]
-
TensorFlow的开源与Hadoop的开源有什么不同?
所属栏目:[大数据] 日期:2018-04-04 热度:188
最近看TensorFlow代码的时候,用Git pull下来最新的master一看,哇好多的更新,然后点击去之前看到一半的cc文件继续看,好多地方都改变了。但是一看Git log,有好多巨大的commit叫什么 Merge commit for internal changes, Merge for github,没有任何的其[详细]
-
最适合Java开发者的大数据工具和框架
所属栏目:[大数据] 日期:2018-04-04 热度:116
副标题#e# 当今编程人员面对的最大挑战就是复杂性,硬件越来越复杂,OS越来越复杂,编程语言和API越来越复杂,我们构建的应用也越来越复杂。根据外媒的一项调查报告,以下列出了Java程序员在过去12个月内一直使用的一些工具或框架,或许会对你有意义。 先来[详细]
-
这些典型实例告诉你:什么是数据可视化
所属栏目:[大数据] 日期:2018-04-03 热度:59
大数据时代,数据是非常重要的,怎样把它的重要之处就展示出来是我们需要掌握的,这就是大讲台老师本文要讲的重点数据可视化。 通过观察数字和统计数据的转换以获得清晰的结论并不是一件容易的事。必须用一个合乎逻辑的、易于理解的方式来呈现数据。 (一[详细]
-
大数据“刷脸”时代 个人隐私保护需要多方作为
所属栏目:[大数据] 日期:2018-04-03 热度:109
刷脸进站、刷脸取款、刷脸支付、刷脸报到随着人脸识别技术的日渐成熟,刷脸时代正在到来。在业内人士看来,人脸识别技术正在不断突破各个行业应用的阈值,带来日趋丰富的应用场景。有专家指出,人脸特征与指纹、虹膜相比,是一个具有弱隐私的生物特征。例[详细]
-
大数据分析如何解决产品推广问题
所属栏目:[大数据] 日期:2018-04-03 热度:195
经过相当长时间的精心准备,展示和推广的企业目前正在掌握大量的信息,这是令人振奋的消息。然而面临的问题是,大多数组织仍然没有必要的能力提取信息的价值,这令人关注。 大多数组织正在寻找在大多数广告组织中都没有找到的特定范围的能力。简单来说,这[详细]
-
人工智能助力资深内容营销人员
所属栏目:[大数据] 日期:2018-04-03 热度:187
随着人工智能逐渐深入营销领域,AI可能会对该领域产生何种影响已然引起了该领域的广泛关注。此前,由于消费者对少数机会主义倾向的畏惧以及科技的抵触情绪,导致营销人员对是否应该全面应用AI功能而犹豫不决。事实上,根据最近由社交媒体分析平台Sysomos联[详细]
-
360 宣布关闭水滴直播,但继续送幼儿园 360 智能摄像机
所属栏目:[大数据] 日期:2018-04-03 热度:59
12月20日上午8点多,水滴直播新浪官方微博发布公告,称因内部业务调整,水滴直播自即日起停止运营。360智能摄像机将专注提供可靠的安防监控功能,为用户提供服务。 这一回应也许是92年女生事件的尾声。 不久前,一篇《一位92年女生致周鸿祎:别再盯着我们[详细]
-
亚马逊与甲骨文互撕 透过迷雾看透数据库的江湖恩怨和大势
所属栏目:[大数据] 日期:2018-04-03 热度:97
副标题#e# 甲骨文公司CEO兼CTO拉里埃里森(Larry Ellison)历来是甲骨文的一面旗帜,也堪称数据库产业的一面旗帜。虽然他已经有数十年公开抨击竞争对手的历史了,吐槽的对手包括了IBM、EMC、Salesforce等业界大咖,但是绝对不是信口开河、无的放矢,也不是[详细]
-
生活中出现AI时我们能信任它们吗?DeepMind 已经开始探索AI安全的答案
所属栏目:[大数据] 日期:2018-04-03 热度:195
随着人工智能系统变得越来越通用化、在真实世界中起到的作用越来越大,如何确保它们能够安全地运行也就成为了越来越重要的一个课题。目前,技术性的 AI 安全研究机构已经开始关注如何开发出好的理论性理解方式,以便了解人工智能系统的不安全行为的本质以[详细]
-
又来抢大数据饭碗?AWS发布SageMaker:省略数据清洗、建模、调参等步骤
所属栏目:[大数据] 日期:2018-04-02 热度:105
副标题#e# 美国拉斯维加斯时间2017年11月29日上午,AWS CEO Andy Jassy在一年一度的AWS re:Invent大会上发布了主题演讲。在短短两小时内,Andy宣布了一系列令人兴奋的新服务。其中最重要的包括一款售价249美元的、名为DeepLens的人工智能摄像机;一套用于开[详细]
-
英伟达副总裁:除了围棋,人工智能下一个让人惊讶的领域是什么
所属栏目:[大数据] 日期:2018-04-02 热度:89
副标题#e# 英伟达副总裁、深度学习应用研究部分负责人布莱恩 卡坦扎罗(BryanCatanzaro)。他拥有计算机科学学士学位和杨百翰大学(BYU)俄语学位,杨百翰大学电气工程硕士学位,以及加州大学伯克利分校(UCBerkeley)的电气工程和计算机科学双料博士学位。[详细]
-
借助深度学习算法,4K 流媒体视频将发展出“新一代内容”
所属栏目:[大数据] 日期:2018-04-02 热度:147
如果你经常在网上看视频,你肯定会遇到过那种正在缓冲的状况。尤其是在情节达到高潮的时候,时不时缓冲一下,真的是让人抓狂不已。此外,最近的一项研究表明,网络上近70%的内容都是流媒体视频和音频。因此,看视频是否需要缓冲,开始变得比以往任何时候都[详细]
-
人们应该知道的大数据术语
所属栏目:[大数据] 日期:2018-04-02 热度:73
副标题#e# Apache软件基金会(ASF):提供了许多大数据的开源项目,目前有350多个项目。是专门为支持开源软件项目而办的一个非盈利性组织。在它所支持的Apache项目与子项目中,所发行的软件产品都遵循Apache许可证。 Apache Kafka:以着名的捷克作家命名的Apa[详细]
-
研究显示AI正创造更多工作岗位
所属栏目:[大数据] 日期:2018-04-02 热度:66
北京时间17日早间消息,据《福布斯》报道,人们目前普遍认为,人工智能(AI)将导致人类失去工作,造成广泛的人员冗余。但新的研究表明,那些投资于人工智能的企业更有可能创造工作岗位,而不是毁灭它们。 咨询巨头凯捷(Capgemini)调查了1000家部署了人[详细]
-
基于标记数据学习降低误报率的算法优化
所属栏目:[大数据] 日期:2018-04-02 热度:167
副标题#e# 无论是基于规则匹配的策略,还是基于复杂的安全分析模型,安全设备产生的告警都存在大量误报,这是一个相当普遍的问题。其中一个重要的原因是每个客户的应用场景和数据都多多少少有不同的差异,基于固定判断规则对有统计涨落的数据进行僵化的判断[详细]
-
大数据处理框架的类型、比较和选择
所属栏目:[大数据] 日期:2018-04-02 热度:154
副标题#e# 前言 说起大数据处理,一切都起源于Google公司的经典论文:《MapReduce:Simplied Data Processing on Large Clusters》。在当时(2000年左右),由于网页数量急剧增加,Google公司内部平时要编写很多的程序来处理大量的原始数据:爬虫爬到的网页、[详细]
-
给人工智能降点温:深度学习不是万能良药
所属栏目:[大数据] 日期:2018-04-02 热度:106
副标题#e# 近几年,深度学习已经进入一定程度的狂热状态,人们正试图用这个技术解决每一个问题。然而,深度学习真是万能的吗?阅读此文后,你便能够从深层理解为什么深度学习并不是想象的那般神话了。 近日,在深度学习领域出现了一场热烈的争论。这一切都[详细]