-
RapidMiner缺失数据处理——去掉数据大量缺失的变量
所属栏目:[大数据] 日期:2021-01-02 热度:154
最近做数据挖掘,发现RapidMiner是一款数据清洗、处理和转换的好工具,尤其在数据量不大的情况下。和R语言相比,RapidMiner在数据处理方面要简单直观得多。虽然RapidMiner的功能可能不如R强大。另外,我们也可以在RapidMiner中可以直接利用Java/Groovy来编[详细]
-
完整数据团队Tips(关于BI系统、数据仓库、数据挖掘和数据实验的
所属栏目:[大数据] 日期:2021-01-02 热度:194
参考The Strong Data Science Audit: How does your organization's data strategy stack up?一文 分析和仪表盘 使用第三方获取用户行为的工具? 使用Google Analytics、Segment、Heap之类的工具。 有没有明确的用户行为定义,还是说只有PV? 查看PV是了解[详细]
-
36早报|扎克伯格创造了钢铁侠里的贾维斯 警方用大数据分析抓获18
所属栏目:[大数据] 日期:2021-01-02 热度:162
副标题#e# Hi,早上好,亲爱的小伙伴们,昨天是冬至节,你有吃饺子吗? 都说冬至节不吃饺子耳朵会被冻掉哦~先上一张我小时候吃饺子的照片,有没有满满的既视感→→? 过完了冬至节,马上就要迎来平安夜,圣诞节,元旦节,春节…… 好吧,这似乎和大数据没啥[详细]
-
大数据处理分析工具
所属栏目:[大数据] 日期:2021-01-02 热度:153
hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop[详细]
-
bfprt算法,中位数的中位数算法,O(n)时间复杂度求解第k大数
所属栏目:[大数据] 日期:2021-01-02 热度:152
215. Kth Largest Element in an Array 题目地址 https://leetcode.com/problems/kth-largest-element-in-an-array/ 题目描述 Find the kth largest element in an unsorted array. Note that it is the kth largest element in the sorted order,not the[详细]
-
棋盘覆盖。大数
所属栏目:[大数据] 日期:2021-01-02 热度:68
棋盘覆盖 时间限制:3000?ms ?|? 内存限制:65535?KB 难度:3 描述 在一个2 k ×2 k (1=k=100)的棋盘中恰有一方格被覆盖,如图1(k=2时),现用一缺角的2×2方格(图2为其中缺右下角的一个),去覆盖2 k ×2 k 未被覆盖过的方格,求需要类似图2方格总的[详细]
-
BI入门经典
所属栏目:[大数据] 日期:2021-01-02 热度:70
副标题#e# 【前言】 ?????昨天论坛的SQL Server大版新增了一个BI板块,大家讨论得热火朝天,由于此前因为客户环境的问题,一直在使用sql 2000,没怎么关注这一块的东西,最近刚好要做购物篮的分析,所以到网上搜集了一些资料。为了跟大家保持“步调一致”,[详细]
-
为什么说OLAP产品毁了BI?
所属栏目:[大数据] 日期:2021-01-02 热度:72
? ? ? ?企业为了确定经营战略和市场战略所进行的经营活动,在BI项目的分析决策过程中,需要基于多种报告和报表进行分析。理想的市场活动展开,大多需要各个营业点的销售报表,每种商品按季节销售的业绩图表等,这就需要大量准确的并且易于判断的数据。 然[详细]
-
大道至简的数据处理工具-(Microsoft Power Query入门)
所属栏目:[大数据] 日期:2021-01-02 热度:65
副标题#e# 大道至简的数据处理工具-Microsoft Power Query 告别复杂的excel函数,excel VBA编程,让一切回归简单与职能。 什么样的人群适合这样的一个工具: 1、出纳、会计、统计、仓管、数据分析等与数据打交道的的岗位。 2、不想学处理数据的函数、VBA编[详细]
-
数据处理方式与控制程序方式不同
所属栏目:[大数据] 日期:2021-01-02 热度:186
结构化方法是直接通过程序来处理数据,处理完毕后即可显示处?理结果,在控制程序方式上是按照设计调用或返回程序不能自由导航,?各模块程序之间存在着控制与被控制的关系;面向对象方法将数据与?对应的代码封装成一个整体,原则上其它对象不能直接修改其数[详细]
-
读取csv数据并保存成图像
所属栏目:[大数据] 日期:2021-01-01 热度:51
int main(int argc,char* argv[]){ifstream file("******.csv");string value;int i = 0;int j = 0;while (file.good()){getline(file,value,'n');//cout string(value,value.length()) endl;if (i 0){value.erase(0,2);value.erase(value.length() - 9);[详细]
-
几种大数阶乘算法效率比较(Java)
所属栏目:[大数据] 日期:2021-01-01 热度:70
完整代码: package bigdatamul;import java.math.BigInteger;/** * 大数阶乘 * * @Description: TODO(大数阶乘) * * @author yzy * @date 2016-12-20 上午9:31:14 * */public class Test { public static void main(String[] args) { //单位:ms //fun1(5[详细]
-
报告一:知识工程与大数据分析
所属栏目:[大数据] 日期:2021-01-01 热度:147
报告一:知识工程与大数据分析 报告人:漆桂林博士,东南大学教授 主要内容:知识工程是人工智能的重要分支之一,知识的获取和基于知识的推理能力是人类高级智能的体现。知识工程涉及到机器学习、知识表示与推理、自然语言处理和数据存储等技术。本报告将[详细]
-
数据处理之one-hot
所属栏目:[大数据] 日期:2021-01-01 热度:152
分类方法,通常需要把数据的各个属性转换为一个向量表示,这样每条数据的特征就是一个向量,向量上的每个维度就表示了一个特征属性。 但是如果要转换的数据包含了3种属性,比如身高,体重,年龄。A是女,168cm,70kg,30岁;B是男,180cm,90kg,20岁,那么[详细]
-
米斯特白帽培训讲义 挖掘篇 厂商寻找
所属栏目:[大数据] 日期:2021-01-01 热度:55
米斯特白帽培训讲义 挖掘篇 厂商寻找 讲师:gh0stkey 整理:飞龙 协议:CC BY-NC-SA 4.0 厂商是什么 厂商可以是一个网站(Web 应用),或者一段程序(PC、移动应用)。从白帽子的角度来说,两个都是厂商,都可以挖掘。 基于漏洞平台的寻找 现在国内有三大[详细]
-
七牛数据处理再添新兵——图片瘦身
所属栏目:[大数据] 日期:2021-01-01 热度:57
副标题#e# 我们现在已经很难想象,图片的出现,竟然只是作为分割文字和缓解疲劳的工具。 随着智能手机的普及,以及像 in、nice 这样以分享图片为主的应用的流行,人们记录生活、分享感悟的方式不再局限于文字,而是逐渐被拍照取代,拍照也不需要那么刻意为[详细]
-
[bigdata-007] Hortonworks HDF搭建流程
所属栏目:[大数据] 日期:2021-01-01 热度:54
1. hdf docker搭建 1.1 hdf的镜像xemuliam/hdf 镜像链接 https://hub.docker.com/r/xemuliam/hdf/ 下载镜像: docker pull xemuliam/hdf 1.2 创建容器 docker run --name dck-hdf-8080 -p 8080:8080 -d xemuliam/hdf 1.3 进入容器bash交互 docker exec -it[详细]
-
BI工具选型指标,如何选择好的BI工具
所属栏目:[大数据] 日期:2021-01-01 热度:120
随着信息化的发展,越来越多的企业将商业智能BI的部署列入了企业信息化建设的下期目标,BI市场需求的日益旺盛,也催生了BI厂商激烈的市场竞争,带动了国内BI工具技术的发展及成熟。 那么作为一个正在或者即将要进行BI工具选型的企业,面对百花齐放的BI市场[详细]
-
如何正确理解商业智能(BI)?
所属栏目:[大数据] 日期:2021-01-01 热度:198
为了让读者更加清晰地把BI与MIS系统区别开来,本文讨论了BI与DSS(决策支持系统)、EIS(经理执行系统)的主要区别。最后,本文分析了制约BI健康发展的若干因素。 引言 ??? 商业智能(BI)是目前在国外企业界和软件开发界受到广泛关注的一个研究方向。可以[详细]
-
BI选型流程建议
所属栏目:[大数据] 日期:2021-01-01 热度:130
一、成立选型小组 ? ? ? ? 成立选型小组是企业确定进行软件选型所需要做的第一步。选型小组将负责整个软件选型过程的执行。选型小组成员至少包括公司副总以上领导一名、 CIO 一名、业务负责人一名。 二、评估需求 ? ? ? ?评估需求是指企业成立BI选型小组之[详细]
-
BI离不了报表
所属栏目:[大数据] 日期:2021-01-01 热度:144
前不久写了一篇文章:报表?VS BI,指出,报表不等于BI。这几天碰到一个客户,让我不得不说出另外的一句话,那就是,BI离不了报表。 ? ? ??演示中,客户的领导发表意见:你们这个还是报表,我们要的不是报表。比如库存,不同的地方的库存标准是不一样的,有[详细]
-
企业是否真的需要BI?
所属栏目:[大数据] 日期:2021-01-01 热度:108
这是一个发人思考的问题。BI对很多人而言或许还是太过高深,换个角度来问比较容易理解:贵公司需要数据分析吗?财务分析、成本分析或者市场分析?贵公司需要好的分析工具来加速分析的速度吗?如果上述的两个答案是肯定的,贵企业是需要BI的。 ?简单地说,B[详细]
-
有了ERP,还缺什么?
所属栏目:[大数据] 日期:2021-01-01 热度:85
一、报表分析方面需要优化 ERP是一个事务处理系统,它的重点在于进行业务的过程记录与控制,在报表分析处理方面有着先天的缺陷: (1)无法实现不同管理角色的分析要求 中虽然有着大量的报表,却无法按不同管理角色来个性化设置分析平台,同时,繁琐的查询[详细]