V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
ahayqyq
V2EX  ›  分享创造

高性能 mysql table 数据对比工具

  •  
  •   ahayqyq · 2022-10-24 20:48:37 +08:00 · 1618 次点击
    这是一个创建于 822 天前的主题,其中的信息可能已经有所发展或是发生改变。

    https://github.com/joshua0x/table_data_compare

    [
      {
        "TableName": "user_info",
        "IdOnlyInSrc": [
          3999995
        ],
        "IdOnlyInDst": [
          5000000
        ],
        "RowGotDiff": [
          {
            "PkId": 3,
            "ColDiffs": [
              {
                "ColName": "nickname",
                "SrcVal": "aha",
                "DstVal": "1021-test"
              },
              {
                "ColName": "mtime",
                "SrcVal": "2021-08-12T09:53:02Z",
                "DstVal": "2022-10-21T22:53:46Z"
              }
            ]
          }
        ]
      }
    ]
    
    
    
    第 1 条附言  ·  2022-10-25 13:00:44 +08:00

    mysql data compare 👏

    基于主键 对比不同mysql database table 的数据

    • 配置需要对比的dsn 连接信息。如下所示,
    {
    
      "host_a": "user:password@(localhost:3306)/src_db?parseTime=true",
      "host_b": "user:password@(localhost:3306)/dst_db?parseTime=true",
      "table_list": ["user_info","user_mail_token"],
      "scantable_batch_size": 1000 // 扫描读取数据的 批量长度,
      "scan_sleep_period": 1 // 扫描读取数据的间隔,ms 级别,防止读取qps 过高,
    }
    
    
    • 输出的对比结果如下:
    [
      {
        "TableName": "user_info",
        "IdOnlyInSrc": [
          3999995
        ],
        "IdOnlyInDst": [
          5000000
        ],
        "RowGotDiff": [
          {
            "PkId": 3,
            "ColDiffs": [
              {
                "ColName": "nickname",
                "SrcVal": "aha",
                "DstVal": "1021-test"
              },
              {
                "ColName": "mtime",
                "SrcVal": "2021-08-12T09:53:02Z",
                "DstVal": "2022-10-21T22:53:46Z"
              }
            ]
          }
        ]
      }
    ]
    

    使用方式

    • step1 : git clone && go mod tidy && go build
      • 生成schema ddl 定义 ,生成的.go 文件位于 ./tab_models/
        • ./table_data_compare -cmd=genmodel
    • step2 : 对比
      • go build
      • ./table_data_compare -cmd=diff

    对比的性能数据

    • table 定义
    CREATE TABLE `user_info` (
      `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '用户ID',
      `username` varchar(32) NOT NULL,
      `nickname` varchar(32) NOT NULL,
      `profile_photo_url` varchar(255) DEFAULT NULL,
      `email` varchar(255) NOT NULL,
      `password` char(32) DEFAULT NULL,
      `user_status` tinyint(4) DEFAULT NULL,
      `follower_cnt` int(11) NOT NULL DEFAULT '0',
      `ctime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
      `mtime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '最后修改时间',
      `test_max` varchar(1024) DEFAULT NULL,
      PRIMARY KEY (`id`),
      UNIQUE KEY `uname` (`username`),
      KEY `mtime_key` (`mtime`)
    ) ENGINE=InnoDB
    
    • 数据行数: 2 million
    • 存在diff 的行数:2
    • 对比完成时间 : 5min
    1 条回复    2022-10-25 16:13:35 +08:00
    yqf0215
        1
    yqf0215  
       2022-10-25 16:13:35 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   900 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 21:06 · PVG 05:06 · LAX 13:06 · JFK 16:06
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.