从ETL到API-程序员宅基地

在IT领域,ETL(提取,转换,加载)流程长期以来一直用于构建数据仓库和数据分析报告系统。企业使用面向商业智能化(BI)的ETL流程,从高度分布的数据源中提取各种数据,通过操作、解析和格式化转换这些数据,并将其加载到临时数据库中。然后对这些临时数据做总结、统计和分析,并用于填充企业的数据仓库。

ETL工具如何完成企业运营中的数据集成

需要肯定的是,ETL工具在IT环境中占有一席之地,众多数据库管理员利用ETL工具来促进流程并为业务提供最佳价值。

•数据仓库:从历史上看,ETL工具的主要用途是实现商业智能化。ETL工具将数据库、应用数据和参考数据拖入数据仓库中,可以使企业随时了解其运营情况,并使管理层能够做出更好的决策。

•数据集成:数据集成允许企业在各种系统之间快速有效地迁移,转换和整合信息。 ETL工具减少了手动输入数据的痛苦,并允许来自不同系统的数据进行交互,同时提供统一的数据视图。

领先的ETL工具,例如Informatica PowerCenter等在数据集成领域有着悠久的历史。它的成功可归功于其在不同系统间交互能力,可重用组件和自动化流程。PowerCenter针对批量方式移动大量数据进行了优化,和其他类似的ETL工具一起,已被广泛用于跨异构环境集成企业应用程序的场景中。

用于企业运营数据集成的ETL工具

企业的运营数据库中通常包含事务型数据,例如员工信息、销售、客户反馈和PoS信息等等。这些数据库为运行业务所需的运营系统和应用程序提供了基础支撑。随着企业的运营越来越需要这些系统之间能够相互集成,现有的ETL工具提供了一个明确的解决方案。 现代的ETL工具已经支持与许多流行数据库和应用程序在数据层面上的连接,成为一种快速,并且看似简单的连接和数据移动方式。在API还不够丰富的时代,ETL工具是企业运营中,实现类似场景的首选解决方案。

ETL工具变得更加复杂

ETL工具确实提供了数据库和应用程序之间的一种通信方法,但随着时间的推移,ETL工具在企业中的应用会面对越来越大的挑战。由于创建此类连接需要全面了解每个运营数据库或应用程序,因此需要实现非常具有侵入性的自定义集成方法,因此系统之间的互联将会变得更加复杂。

随着时间的推移,这种集成方法变得越来越复杂。并且互联的系统数量越多,事情也就越复杂。此外,由于这种紧密耦合,即使系统中进行了最轻微的改变,相互之间的依赖也会产生巨大的,不可预测的影响。此时,自定义的点对点数据级集成将成为一个脆弱的连接网络,很快开始看起来像一团“意大利面条代码”。

 

 

随着IT环境向云迁移,(由于安全等原因)缺乏对云数据库和应用程序内部的可见性通常使得在本地和云的混合场景中无法轻易实现基于ETL的集成。此外,向云的过渡意味着完成实时集成和更新的价值更大,而这类价值ETL工具无法轻松提供,因为它们主要是面向批处理过程的。

API简化了数据集成

API普及程度的提高使得创建连接变得更加容易。通过API,开发人员可以访问数据端点并构建连接,而无需深入了解系统本身,从而极大地简化了数据集成流程。由于ETL工具仍然更多地关注BI和大数据解决方案,并且传统的运营数据集成方法随着云计算的普及而变得过时,API成为创建连接的更好选择。

企业服务总线(ESB)以及API应用服务器软件产品可以提供基于API的连接以及实时集成。与用于数据集成的传统ETL工具不同,基于API的连接和集成方法通过提供中间服务层将应用程序和数据库彼此隔离。该抽象层通过系统解耦来减少系统之间的依赖性并提供高度的灵活性。开发人员可以利用预先构建的连接器轻松创建应用集成,而无需了解特定应用程序和数据库内部实现,并且可以快速地对系统中的某部分连接进行更改,而不需要担心整个集成系统崩溃。通过API实现的屏蔽,应用程序和数据库可以进行修改和升级,而不会产生意外后果。与使用ETL工具进行操作集成相比,基于API的连接和集成提供了更加合理,且定义明确的方法来实现此类计划。

灵长科技提供应用集成平台

灵长的核心产品CEAMS通用企业应用接口管理系统,可以帮助企业满足其应用集成需求。CEAMS系统的核心组件CDIF是一个高性能的Node.js API应用框架,以及数据交换平台。可帮助企业连接SaaS,云,移动及本地应用程序,服务和各类数据源。 CEAMS系统通过完整支持Node.js开源生态中的所有组件,为企业提供强大的集成解决方案:

•应用集成:CEAMS系统通过应用提供的JSON格式的API规范,将被集成的各类外部系统自然地划分为多个服务,平台上部署的每个应用对应于一个外部系统或数据源。应用具备自己独立的CPU资源和内存空间,并支持通过高效的异步通讯模式在不同的应用之间交换JSON格式的数据。相对于传统的同步模式,这样的设计可以大大提高数据集成时的运行效率和吞吐量,并且降低了系统间的耦合性,在某个应用崩溃出错,无响应,或CPU死锁时不会影响到其他应用的正常运行。

•数据转换:CEAMS系统在完成应用集成时,首先对来自不同系统和数据源的数据统一自动转换和封装成JSON格式的API。通过完整地支持整个Node.js技术生态中,全球上百万开发者正在使用的,各类基于Node.js的JSON数据转换和处理工具,开发者可以很轻松地在CEAMS系统上,在统一的JSON格式基础上完成数据转换和应用集成任务。

•连接器:通过完整支持高度发达的Node.js生态,CEAMS系统可以实现与数百种流行应用程序,协议,和服务的即时API连接,从而可以轻松地将数据提取和加载到流行的数据源和端点。

•文件类型支持:通过支持平面和结构化数据格式(如XML,JSON,CSV,Excel等),企业可以灵活地使用哪种数据格式。

•数据库级连接:对于需要与数据库直接交互的情况,CEAMS系统提供ORM,Raw SQL等连接到各类关系型数据库的方法,同时提供Elastic Search, Solr等全文搜索引擎,以及MongoDB,Cassandra,和Hadoop等新兴的大数据平台。

灵长科技提供多种解决方案,帮助企业克服集成难题,并将自身转变为高效的新企业。在众多不同的系统和应用程序通过ETL工具集成在满足新企业需求方面受到限制时,灵长科技的CEAMS系统可以提供基于API的实时,高性能,可扩展的操作功能。了解有关灵长科技产品的更多信息,或者与我们联系(email: [email protected], 企业QQ技术支持群:618450152),可获得与CEAMS系统相关的更多信息。

转载于:https://my.oschina.net/u/4102084/blog/3071793

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/chuanxie6685/article/details/100816477

智能推荐

Nginx 入门到实战,新手必懂 !-程序员宅基地

文章浏览阅读138次。一、环境服务器版本:CentOS 7.2,为了保证学习阶段不遇到奇怪的事情,请保证以下四点(大神选择性无视)确认系统网络确认yum可用确认关闭iptables确认停用selinux#查看i..._nginx入门与实战 py鱼

iov_iter操作_iov_iter_init用来初始化iov_iter-程序员宅基地

文章浏览阅读1.5k次。iovec_iter操作由来iov_iteriov_itertypeiov_offsetcount使用iov_iter由来iov_iter它是由Nick Piggin于2007 年首次为2.6.24内核添加的。但是在过去的一年中,人们一直在努力扩展此API,并在内核的更多部分中使用它。例如,在3.19的合并中,它将看到它进入网络子系统的第一步。内核中最常见的任务之一是处理用户空间提供的数据缓冲区,可能是分成几个块。也许并不奇怪,这是内核代码经常出错的任务,从而导致错误以及可能的安全问题。内核包含一个原_iov_iter_init用来初始化iov_iter

新版手机离线地图GPS定位程序_gps 离线地图-程序员宅基地

文章浏览阅读4.5k次。新版手机离线地图GPS定位程序 新版手机离线地图GPS定位程序是运行WindowsMobile操作系统手机上的一款应用程序,它的作用是为手机用户提供离线地图服务。也就是说不需要网络,不需要手机信号,不需要任何流量和费用,只要你的手机有电,就可以获得地图服务以及GPS定位服务。你可以在手机上看到你的位置以及100分钟之内的运动轨迹。 新版程序是在老老版本的基础上,为了更加实用,更稳定,更方便使用而进行了一系列的改进和提高_gps 离线地图

npm包安装/升级,npm i --save和--save-dev区别,dependencies和devDependencies区别,package.json文件中版本号含义_npm 升级 devdependencies-程序员宅基地

文章浏览阅读1.5k次。npm包安装/升级,npm i --save和–save-dev区别,dependencies和devDependencies区别,package.json文件中版本号含义目录npm包安装/升级,npm i --save和--save-dev区别,dependencies和devDependencies区别,package.json文件中版本号含义npm包安装/升级package.json中安装依赖分类npm i --save和 npm i --save-dev区别package.json 文件中版本号含_npm 升级 devdependencies

TypeScript tsc 不是内部或外部命令,也不是可运行的程序或批处理文件解决办法_get-executionpolicy' 不是内部或外部命令,也不是可运行的程序 或批处理文件。-程序员宅基地

文章浏览阅读531次。TypeScript tsc 不是内部或外部命令,也不是可运行的程序或批处理文件解决办法_get-executionpolicy' 不是内部或外部命令,也不是可运行的程序 或批处理文件。

摆脱焦虑的方法_把自己情绪不当回事,情绪是假的,情绪容易形成回路,就是佛教的妄念,当妄念一旦-程序员宅基地

文章浏览阅读207次。 断除烦恼的方法,要让自己的情绪不当回事,情绪是假的。抑郁症、强迫症等各种症状的病人的脑子里有一些回路,这些回路建立以后,这些回路就是佛教里的“妄念”,当妄念一旦产生,越想它,它的变形越厉害,最后它产生的想法,和真实世界是完全不靠谱的。 就像一个人失恋了想要自杀一样,可能半年之后,发现自己当时怎么那么可笑,那就是在失恋那个阶段,回路建立了。..._把自己情绪不当回事,情绪是假的,情绪容易形成回路,就是佛教的妄念,当妄念一旦

随便推点

shell脚本执行超时怎么办?-程序员宅基地

文章浏览阅读1.4k次。在shell里会有一种不太常见的情况,就是脚本有时候会出现超时的现象。一般来说遇到这种问题,我们都会简单粗暴的采用下面这种脚本来当“超时看门狗“:#!/bin/bash./$1&#这里设定后台运行的第一个参数pid=$!#最后一个运行的process的PID值sleep$2&&kill-9$pid&..._shell curl 超时时间不生效

CSS的权重 选择器的权重 CSS层叠的含义_css不同选择器的权重(css层叠的规则)-程序员宅基地

文章浏览阅读475次。个人博客http://www.sharedblog.cn/?post=109当我们给同一个元素多次设置样式时,会出现权重问题,优先使用权重较高的样式,我们将权重分为四个等级: 第一等:内联样式 <h1 style="..."></h1>权重1000 第二等:id选择器权重100 第三等:class选择器,伪类选择器,属性选择器..._css不同选择器的权重(css层叠的规则)

eggjs 报错socket is closed by other side while there were still unhandled data in the解决方案-程序员宅基地

文章浏览阅读359次。其实很简单啊,你node版本高了。之前博主用的12.18.1 然后nvm切换了node版本到18.12.1 是能跑,也能读,debug下突然就不行了,你懂我的意思的话,就知道怎么解决了,博主公众号在下面,你可以随便点个文章进去。可以加到博主的wx群。这个报错,完就不能热更新了,是不是很突然,明明代码昨天还能跑今天就不可以了。_socket is closed by other side while there were still unhandled data in the

mysql学习3:mysql之my.cnf详解-程序员宅基地

文章浏览阅读52次。mysql之my.cnf详解本文转自:https://www.cnblogs.com/panwenbin-logs/p/8360703.html以下是 my.cnf 配置文件参数解释:#*** client options 相关选项 ***##以下选项会被MySQL客户端应用读取。注意只有MySQL附带的客户端应用程序保证可以读取这段内容。如果你想你自己的MySQL应用程序获取..._mysql 写库模式 cnf 1,2,3

华为WLAN3.2漫游特性_华为机 wlan 产品可实现了 ac 内三层漫游-程序员宅基地

文章浏览阅读269次。3.2.1概念介绍3.2.2基本原理介绍信号强度 -75db丢包3.2.3漫游应用场景_华为机 wlan 产品可实现了 ac 内三层漫游

RocketMQ-HA安全问题_rocketmq安全运维基线-程序员宅基地

文章浏览阅读505次。broker的master-slave机制能够被利用,只要知道了master的ip和port,就可以伪装成slave向master发起消息同步BrokerStartup#createBrokerController messageStoreConfig.setHaListenPort(nettyServerConfig.getListenPort() + 1);上面的listenPort就是在broker文件中配置的,默认的ha通信端口,就是listenPort+1亲测可以直接创建soc._rocketmq安全运维基线

推荐文章

热门文章

相关标签