首页 / 金融交易 / 在线数据处理与交易处理,在线数据处理与交易处理业务许可证

在线数据处理与交易处理,在线数据处理与交易处理业务许可证

Time:2024-04-10 13:38:46 Read:0 作者:

大家好,今天小编关注到一个比较有意思的话题,就是关于在线数据处理与交易处理的问题,于是小编就整理了1个相关介绍在线数据处理与交易处理的解答,让我们一起看看吧。

大数据究竟是什么?大数据有哪些技术呢?

大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段,处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据处理手段所无法完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等,汇集了当前IT领域热门流行的IT技术。

在线数据处理与交易处理,在线数据处理与交易处理业务许可证

大数据 big data 国标定义:

支持一个或多个应用领域,按概念结构组织的数据集合,其概念结构描述这些数据的特征及其对

应实体间的联系。具有数量巨大、种类多样、流动速度快、特征多变等特征,并且难以用传统数据体

系结构和数据处理技术进行有效组织、存储、计算、分析和管理的数据集。

[来源:GB/T 35274-2017,定义3.1]

1、基础概念

大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据技术则主要用来解决海量数据的存储和分析。

2、特点分析

大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

3、发展过程

我有幸做了有五六七八年的大数据吧,谈谈自己的看法。简单来说,就是现在各个APP,网站产生的数据越来越多,越来越大,传统的数据库比如MySQL Oracle之类的,已经处理不过来了。所以就产生了大数据相关的技术来处理这些庞大的数据。

第一,首先要把这些大数据都可靠的存储起来,经过多年的发展,hdfs已经成了一个数据存储的标准。

第二,既然有了这么多的数据,我们可以开始基于这些数据做计算了,于是从最早的MapReduce到后来的hive,spark,都是做批处理的。

第三, 由于像hive这些基于MapReduce的引擎处理速度过慢,于是有了基于内存的olap查询引擎,比如impala,presto。

第四,由于批处理一般都是天级别或者小时级别的,为了更快的处理数据,于是有了spark streaming或者flink这样的流处理引擎。

第五,由于没有一个软件能覆盖住所有场景。所以针对不同的领域,有了一些特有的软件,来解决特定场景下的问题,比如基于时间序列的聚合分析查询数据库,inflexdb opentsdb等。采用预聚合数据以提高查询的druid或者kylin等,

第六,还有其他用于数据削峰和消费订阅的消息队列,比如kafka和其他各种mq

第七,还有一些其他的组件,比如用于资源管理的yarn,协调一致性的zookeeper等。

第八,由于hdfs 处理小文件问题不太好,还有为了解决大数据update和insert等问题,引入了数据湖的概念,比如hudi,iceberg等等。

第九,业务方面,我们基于大数据做一些计算,给公司的运营提供数据支撑。做一些推荐,给用户做个性化推荐。机器学习,报警监控等等。

到此,以上就是小编对于在线数据处理与交易处理的问题就介绍到这了,希望介绍关于在线数据处理与交易处理的1点解答对大家有用。

相关推荐
Copyright © 2002-2025 财经网 版权所有 
备案号: 沪ICP备2023034754号-58

免责声明: 1、本站部分内容系互联网收集或编辑转载,并不代表本网赞同其观点和对其真实性负责。 2、本页面内容里面包含的图片、视频、音频等文件均为外部引用,本站一律不提供存储。 3、如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除或断开链接! 4、本站如遇以版权恶意诈骗,我们必奉陪到底,抵制恶意行为。 ※ 有关作品版权事宜请联系客服邮箱:478923*qq.com(*换成@)