当前位置:首页 > 网络黑客 > 正文内容

大数据通俗解释(生活中的大数据10个例子)

访客4年前 (2021-09-21)网络黑客643

大数据不仅是大量的数据,在其他方面也有一定的特点。

第一,大数据的数据量非常大,传统的单机存储系统已经不能存储这么大的数据量。这时候就需要分布式存储技术。

第二,大数据中的数据种类繁多,数据的格式会变得复杂,比如视频、文档、图片、消息记录等等。

第三,大数据中隐藏着一个非常重要的价值。通过数据分析技术,智能、数字化地支持业务决策。

大数据的主要作用是为公司上层提供商业决策支持,让公司结合历史数据,向正确的方向发展。大数据技术主要分为两大类:大数据计算和大数据存储。

大数据计算主要分为离线计算和实时计算。具体使用取决于业务场景对数据输出延迟的要求

离线计算对于数据输出会有一定的时间延迟,可以是15分钟,也可以是几小时,也可以是几天。离线任务一般是对数据进行全局批量计算,这次就完成了。与实时计算不同,除非您自己停止实时任务,否则实时程序将始终运行。

实时计算数据是不断生成的,数据输出的延迟通常很低,最多几秒钟。比如我们的大数据屏,实时数据流处理等。,这些场景对数据输出延迟的要求很低。

离线计算,一般对数据输出延迟没有那么高的要求,只要最后输出数据,具体使用很多公司的离线业务报表。目前大部分公司的离线计算引擎都是使用Hive或者Spark,而实时计算引擎主要是Flink。

大数据存储需要分布式数据存储,单台机器无法存储这么多海量数据

在传统的关系数据库中,当一个表非常大的时候,会利用数据库和表的技术将它分布存储在不同的机器上。开源工具TDDL可以用于数据库和表分离技术。

在非关系型NoSQL数据库中,可以选择HDFS作为最低的文件存储系统。HDFS文件系统以块的形式存储文件,一个块的大小为128兆字节,每个块将存储三个副本,这样数据就可以以容灾的方式存储。即使一个数据块损坏,也可以选择其他数据块进行数据恢复。

分布式数据库系统可以横向和纵向划分数据表。例如,在HBase数据库中,区域用于水平分区,列族用于垂直分区。

分布式数据存储技术需要不同的机器协同工作,每台机器存储整个数据的一个子集。在未来的大数据时代,分布式数据存储和分布式数据库肯定会被使用,这将成为大数据系统的标准。

我是Lake,专注于大数据技术原理,人工智能,数据库技术,程序员经验分享。如果我的问答对你有帮助,希望你能夸奖我,关注我。谢谢你。

扫描二维码推送至手机访问。

版权声明:本文由黑客接单发布,如需转载请注明出处。

本文链接:https://www.therlest.com/78697.html

分享给朋友:

“大数据通俗解释(生活中的大数据10个例子)” 的相关文章

【干货知识】高級不断渗透第八季-demo就是远程控制

本季度是《高級不断渗透-第七季demo的发展》的持续。 点一下文尾左下角“阅读”可阅读文章第七季文章正文。 在第一季有关后门中,文章内容提及再次编译程序notepad ,来引入有目标源代码后门结构。 在第六季有关后门中,文章内容假定不在获知notepad 的源代码,来引入无目标源代码沟...

我老公老是让他家的亲戚来我家,我该怎么办?请各位帮我想想办法,我

我老公老是让他家的亲戚来我家,我该怎么办?请各位帮我想想办法,我 请各位帮我想想办法,开网店怎么找女装货源唔爱神起助您成就财富人生,想做微商?想开实体店?想开淘宝店?什么才是你创业的最重要步骤?货源!想在微商卖童装母婴用品纸尿裤女装,开童装女装店铺,你去哪里找最好的货源?如何找童装女装一手货源呢?...

奥迪a三报价及图片大全,奥迪a3最新价格及图片

主要是看配置和相应4s点的一些降价幅度。2010款奥迪A3Sportback1点,市场需求等诸方因素的影响而有所调整。 每个地区优惠不一样,2010款,A3报价如下最新2016款Sportback35TFSI进取型18点49万,你好,车价不用说了就是发票价格;购置税约等于发票价格除以11点7;交强险...

苹果笔记本19款air参数_133英寸是多少厘米

Macbook Air厚度分为两个版本,1366x768;CPU型号:Intel酷睿i52467M;CPU主频,2010年10月,Touch Bar位于键盘上方,宽169点5毫米6点6英寸长240毫米。 4款,长240毫米9点4英寸。12寸。 MacBook Air相关尺寸,133扩展:苹果MacB...

如厕阅读-如厕时读书看报有哪些坏处?

如厕阅读-如厕时读书看报有哪些坏处? 读书、看报兼如厕,不少人有这样的习惯。然而这一习惯非常不好。蹲厕时读书看报,会干扰大脑对排便传导神经的指挥,延长排便时间。现代医学研究证实,蹲厕超过3分钟即可直接导致直肠静脉曲张淤血,易诱发痔疮,且病情的轻重与时间长短有关。蹲厕时间越长,发病几率越高。因为久蹲...

怎样辨别有农药残留的蔬菜?

怎样辨别有农药残留的蔬菜? 一、不吃形状、颜色异常的蔬菜: 形状:颜色正常的蔬菜,一般是常规栽培,是未用激素等化学品处理的,可以放心地食用。 “异常”蔬菜可能用激素处理过,如韭菜,当它的叶子特别宽大肥厚,比一般宽叶一次同学聚会,我发现很多同学已经有房有车,毕竟毕业三年了,而我还只是每个月三千块...

评论列表

泪灼本萝
3年前 (2022-06-05)

值。通过数据分析技术,智能、数字化地支持业务决策。大数据的主要作用是为公司上层提供商业决策支持,让公司结合历史数据,向正确的方向发展。大数据技术主要分为两大类:大数据计算和大数据存储。大数据计算主要分为离线计算和实时计算。具体使用取决于业务场景对数据输出延迟的要求离线计算对于

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。