沈艳:关注大数据分析门槛 警惕大数据神话

沈艳:关注大数据分析门槛 警惕大数据神话

副标题#e# 大数据是近几年最热门的IT概念之一,并已在许多领域实现落地。从淘宝利用平台数据解读中国消费趋势和地区差异到出行类APP在拥塞的城市中为用户提供快速的车辆调度,从数据分析团队在奥巴马连任竞选中发挥巨大作用到谷歌智能系统AlphaGo在人机围棋

美团机器学习中的数据清洗与特征挖掘实践

美团机器学习中的数据清洗与特征挖掘实践

综述 如上图所示是一个经典的机器学习问题框架图。数据清洗和特征挖掘的工作是在灰色框中框出的部分,即“数据清洗=特征,标注数据生成=模型学习=模型应用”中的前两个步骤 灰色框中蓝色箭头对应的是离线处理部分。主要工作是: 从原始数据,如文本、图像

数据集成–Informatica PowerCenter

数据集成–Informatica PowerCenter

概要 随着数据呈现单位级别的递增,从海量的数据中分析出有价值的数据,对未来的事情进行一些预测,显得更能体现出BI的优越性了,但这也同时考验着数据处理ETL的性能和安全。这几天大体调查了一下informatica公司的PowerCenter,在国内市场上使用的挺早的

数据安全事件频发,数据脱敏技术发展走向如何?

数据安全事件频发,数据脱敏技术发展走向如何?

副标题#e# 在当前的大数据时代,各类数据分析应用技术已经广泛应用在国家治理、企业运行、个人日常生活等各个方面,数据成为时下最热门的基础资源,因此数据安全的受关注程度也在不断攀升,成为颇受重视的话题。 近年来,在国际上数据安全事件频发,尤其是

数据量太大?用Python处理数据密度过大障碍

数据量太大?用Python处理数据密度过大障碍

副标题#e# 当我们需要观察比较2个变量间的关系时,散点图是我们首选图表。 可当数据量非常大,数据点又比较集中在某个区间中,图表没法看,密密麻麻的怎么看? 怎么办?这时候就得看密度图了 什么是密度图? 所谓的密度图 (Density Plot) 就是数据的分布稠密情

让你在10分钟内掌握如何用Python将数据批量的插入到数据库

让你在10分钟内掌握如何用Python将数据批量的插入到数据库

副标题#e# 本文基于python, 使用pandas, pymysql等三方库实现了向数据库中高效批量插入数据,一方面提供被网上很多瞎转载的答案给坑蒙了的人(因为我也是),一方面自己也做个笔记,以后方便查阅 需求原因 最近在处理一个需求,有关批量往数据库插入数据的,

5个可以帮助Pandas进行数据预解决的可视化图表

5个可以帮助Pandas进行数据预解决的可视化图表

数据科学和机器学习项目的结构化方法从项目目标开始。同一组数据点可以推断出一些有意义的信息。基于我们所寻找的,我们需要关注数据的另一个方面。一旦我们明确了目标,我们就应该开始考虑我们需要的数据点。这将使我们能够专注于最相关的信息集,而忽略

大数据在疫情期间对货运运营商的安全不可估量

大数据在疫情期间对货运运营商的安全不可估量

大数据对于避免许多危机非常重要。采用大数据应对冠状病毒疫情危机是一个很好的例子。越来越多的国家和组织正在使用大数据来促进社交距离,加强联系追踪并找到新的治疗方法。 在这场危机期间,某些行业比其他行业更依赖大数据来保障安全。这些包括货运运营

数据科学家vs数据分析师,到底有啥差异?

数据科学家vs数据分析师,到底有啥差异?

副标题#e# 数据科学和机器学习两个领域很容易混淆,从职责描述上还是大家的普遍印象里,这两个职位都差不多。相较之下,数据科学和数据分析这两个职位更容易区分。它们虽有关键差别,但也有相似之处。 有人会说,要成为一名数据科学家,要先从数据分析的工

大数据和物联网是如何相辅相成的?

大数据和物联网是如何相辅相成的?

物联网传感器持续接收来自大量连接的异构设备的数据。随着联网设备数量的增加,物联网系统需要具有可伸缩性,以适应数据的流入。分析系统处理这些数据并提供有价值的报告,这将使企业具有竞争优势。由于数据是基于其类型挖掘的,因此必须对数据进行分岔以

联系我们

联系我们

0577-28828765

在线咨询: QQ交谈

邮箱: xwei067@foxmail.com

工作时间:周一至周五,9:00-17:30,节假日休息

返回顶部