大数据从百万级别数据的分析角度,数据库如何选择?哪位大大告诉yunmar下,谢谢!!
答案:1 悬赏:40
解决时间 2021-03-17 10:14
- 提问者网友:富士山上尢
- 2021-03-16 20:18
大数据从百万级别数据的分析角度,数据库如何选择?哪位大大告诉yunmar下,谢谢!!
最佳答案
- 二级知识专家网友:行路难
- 2021-03-16 21:15
百万级的数据,无论侧重OLTP还是OLAP,当然就是MySql了。过亿级的数据,侧重OLTP可以继续Mysql,侧重OLAP,就要分场景考虑了。实时计算场景:强调实时性,常用于实时性要求较高的地方,可以选择Storm;批处理计算场景:强调批处理,常用于数据挖掘、分析,可以选择Hadoop;实时查询场景:强调查询实时响应,常用于把DB里的数据转化索引文件,通过搜索引擎来查询,可以选择solr/elasticsearch;企业级ODS/EDW/数据集市场景:强调基于关系性数据库的大数据实时分析,常用于业务数据集成,可以选择Greenplum;数据库系统一般分为两种类型:一种是面向前台应用的,应用比较简单,但是重吞吐和高并发的OLTP类型;一种是重计算的,对大数据集进行统计分析的OLAP类型。传统数据库侧重交易处理,即OLTP,关注的是多用户的同时的双向操作,在保障即时性的要求下,系统通过内存来处理数据的分配、读写等操作,存在IO瓶颈。OLTP(On-Line Transaction Processing,联机事务处理)系统也称为生产系统,它是事件驱动的、面向应用的,比如电子商务网站的交易系统就是一个典型的OLTP系统。OLTP的基本特点是:数据在系统中产生;基于交易的处理系统(Transaction-Based);每次交易牵涉的数据量很小;对响应时间要求非常高;用户数量非常庞大,主要是操作人员;数据库的各种操作主要基于索引进行。分析型数据库是以实时多维分析技术作为基础,即侧重OLAP,对数据进行多角度的模拟和归纳,从而得出数据中所包含的信息和知识。OLAP(On-Line Analytical Processing,联机分析处理)是基于数据仓库的信息分析处理过程,是数据仓库的用户接口部分。OLAP系统是跨部门的、面向主题的,其基本特点是:本身不产生数据,其基础数据来源于生产系统中的操作数据(OperationalData);基于查询的分析系统;复杂查询经常使用多表联结、全表扫描等,牵涉的数据量往往十分庞大;响应时间与具体查询有很大关系;用户数量相对较小,其用户主要是业务人员与管理人员;
我要举报
如以上问答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯