阅读历史 |

第290章 牛肉河粉(2 / 2)

加入书签

监控品牌搜索量和用户转化率等指标,评估品牌宣传效果。

采用增量字段方式捕获变化数据的原理是Y在源系统业务表数据表中增

加增量字段Y增量字段可以是时间字段Y同时也可以是自增长字段Y当

源业务系统中数据新增或者被修改时Y增量字段就会产生变化Y时间戳

字段就会被修改为相应的系统时间Y自增长字段就会增加

每当ETL工具进行增量数据获取时Y只需比对最近一次数据抽取的增量

字段值Y就能判断出来哪些是新增数据Y哪些是修改数据。

这种数据抽取方式的优点是抽取性能比较高Y判断过程比较简单YETL

系统设计清晰Y源数据抽取相对清楚简单Y可以实现数据的递增加载

最大的局限性就是由于某些数据库在进行设计的时候Y未考虑到增量字

段Y需要对业务系统进行改造Y基于数据库其他方面的原因Y还有可能

出现漏数据的情况。

3.全量同步

全量同步又叫全表删除插入方式

Y是指每次抽取前先删除目标表

数据Y抽取时全新加载数据该方式实际上将增量抽取等同于全量

抽取对于数据量不大Y全量抽取的时间代价小于执行增量抽取的

算法和条件代价时Y可以采用该方式。

这种方式的优点是对已有系统表结构不产生影响Y不需要修改业务

操作程序Y所有抽取规则由ETL完成Y管理维护统一Y可以实现数

据的递增加载Y没有风险

缺点是ETL比对较复杂Y设计较为复杂Y速度较慢与触发器和时

间戳方式中的主动通知不同Y全表比对方式是被动的进行全表数据

的比对Y性能较差当表中没有主键或唯一列且含有重复记录时Y

全表比对方式的准确性较差。

日志比对的方式是通过获取数据库层面的日志来捕获到变化的数据Y

不需要改变源业务系统数据库相关表结构Y数据同步的效率比较高Y

同步的及时性也比较快Y最大的问题就是不同数据库的日志文件结

构存在较大的差异性Y实施分析起来难度比较大Y同时Y需要具备

访问源业务库日志表文件的权限Y存在一定的风险性Y所以这种方

式有很大的局限性。

日志比对方式中比较成熟的技术是CDC(geDataCapture)技术Y

作用同样是能够捕获到上一次抽取之后产生的相关变化数据Y当

CDC对源业务表进行新增更新和删除等相关操作的时就可以捕获

到相关变化的数据Y相对于增量字段方式YCDC方式能够较好地捕

获到删除数据Y并写入相关数据库日志表Y然后再通过视图或者别

的某种可操作的方式将捕获到的变化同步到数据仓库当中去。

这种方式的优点是ETL同步效率较高Y不需要修改业务系统表结构Y

可以实现数据的递增加载缺点是业务系统数据库版本与产品不统

一Y难以统一实现Y实现过程相对复杂Y并且需深入研究方能实现

这种方式也通过第三方工具实现Y但是Y一般都是商业软件Y费用

较高。最近转码严重,让我们更有动力,更新更快,麻烦你动动小手退出阅读模式。谢谢

↑返回顶部↑

书页/目录

其他类型相关阅读: 高冷军少之独占爱妻 龙魂传 轮回印 血脉剑神 国运之战:我以神明镇诸天 生命最后三年,高冷总裁妻子疯狂报复我! 厨神,妖兽:不好,我们成食材了 掐指一算,你是逃犯! 女帝痛哭,她杀死了自己最爱的人 我在天牢,长生不死 大唐:开局碰瓷长乐公主 金戈丽人行:天命之魁 村滥 重生88,从大山挖参开始! 龙珠:守护绝望未来 御兽,从银月天狼开始 错嫁:鬼眼王妃 大唐十万里 游戏入侵:我的血能毒杀异界神魔 天才与废材 神奇宝贝:系统开局 符道之祖 变成龙的我,今天该干什么 木叶骑士王 HP:失色魂灵 重回七零,与病娇老公举案齐眉 砍树爆装备?我爆的全是修仙法宝 重生:校花不甜,我为什么要舔? 妹妹别怕,哥哥超护短 借我一缕阳光 放肆,沉沦 族咒:山隐卷 我和柯南,才不是你想的那样! 凤舞九天【传奇商后妇好】 羽化飞仙 世界崩坏:炎龙侠还在追我! 我有一剑,可斩灭天地万物! 官术:拯救女市长后,我步步高升 卧底,再不收网我就恶贯满盈啦! 超脱之路:掠夺万界资源 跳龙门 喝醉后被白梦妍捡回家 悟性逆天,我在诸天薅羊毛 在下潘凤,字无双 我靠采集在御兽世界里刷祝福 称帝了,才告诉我父母是禁忌级? 武道贫困生!从杀猪开始横推星空 刚下山就被女神骗去同居了 序列为零 当官哪有种地香 相亲失败后,富婆试图走进我心房 我,刚失恋,穿进盗笔了 生下来就死,阎王见了我都跪 离石游记 离婚后躺女总裁床上,前妻急了? 全院轮转,皮科大夫请求出战 科技搬运工 快穿:宿主是咸鱼还是炮灰 重生了,谁还谈个狗屁恋爱! 姝神录