1
liprais 2023-05-19 15:55:20 +08:00 1
debezium cdc 拉出来呗
|
2
la0wei OP @liprais 似乎是实时信息获取,可以抓到历史数据吗?有篇比较 ogg 和 debezium cdc 的文章,写 ogg 不需要在源端安装软件,那 ogg 似乎也可以。感谢!
|
4
d2moqi 2023-05-19 16:28:52 +08:00
ETL 工具 数据抽取 定时增量同步?
工具:kettle 可以了解一下 |
7
la0wei OP @d2moqi 看到一篇文章《超详细的六款主流 ETL 工具介绍及功能对比》,对 ETL 工具对比,声称 kettle(pantaho)对数据库表结构有要求,存在一定侵入性。对这个工具不了解,是这样的设计吗?对数据库无 /低侵入性优先,易用性第二,开源免费第三
|
8
d2moqi 2023-05-19 17:34:44 +08:00 1
@la0wei 只是数据同步的话我觉得是完全没有入侵性的,需要一个能同时连通 线上数据库和本地数据库的环境,然后 kettle 编辑任务(可视化编辑),读线上数据库数据 然后 处理(也可以不处理)输出到本地数据库。最简单的数据同步就完成了
|
9
bl 2023-05-19 17:43:49 +08:00
kettle
|
10
bl 2023-05-19 17:44:13 +08:00 1
datax
|
11
la0wei OP @d2moqi @bl
踩坑如下,不管结果如何,记录下来,方便后来人 oralce 版本都是 11g11.2.0.1.0 服务器是 centos6 客户机是 win7 下载文件 pdi-ce-9.4.0.0-343.zip Pentaho data integration(kettle),spoon 反正不管啥名字,这软件运行起来了,功能界面倒是很容易理解,但是在连接数据库那里卡住了 首先报错 driver class 'oracle.jdbc.driver.OracleDriver' could not be found,make sure the 'Oracle' driver (jar file) is installed. 显然没有连接驱动的关系,下载 ojdbc6.jar 放 pdi 的 bin 目录即可,需要重启软件加载。至于更高版本的 ojdbc 没有尝试。 依然连接数据库报错,特意复现了下: Connection failed.verify all connection parameters and confirm that the appropriate driver is installed.Listener refused the connection with the following error:ORA-12505,TNS:listener does not currently know of SID given in connect descriptor 搜索才知道要在数据库名称前加 / ,不然会报 ORA-12505 以为表输入、插入更新两个步骤就行了,看报错是对 NULL 处理有问题,然后加了个 if field value is null 的步骤 但是又有问题了,插入那对 NUMBER(13,6)转换有问题,提示 java.lang.String cannot be cast to java.lang.Double 估计是在 if field value is null 的转换还是有问题。 暂时踩坑这么多,后面看情况,字段太多,每个都来一遍太累了,后面可能退而求其次直接 dump 数据库 |