V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
iian
V2EX  ›  程序员

请教数据整合处理的问题

  •  
  •   iian · 2022-06-04 23:19:08 +08:00 · 1350 次点击
    这是一个创建于 901 天前的主题,其中的信息可能已经有所发展或是发生改变。
    https://i.imgur.com/11yO3cr

    工作中遇到以下情况:
    1.有些安全设备可以提供 API 接口,例如可以读取到当前中毒的用户 ID ;另外一些设备仅能提供 syslog 日志,需要从日志中过滤出有问题的 IP 。
    2.内部已有 ETL 工具可以将 API 获取到的用户 ID 或者 syslog 日志进行数据处理。

    存在的问题:
    3.ETL 工具无法通过 API 将处理后的数据提交到右侧的系统中,例如将 1 中过滤出的 ID 通过认证系统的 API 提交将用户在认证系统中禁用。
    4.ETL 工具无法执行网络设备的命令或者 shell 脚本对有问题的 IP 添加到黑名单中。

    疑问:
    5.对 ETL 不了解,可能 ETL 本身就不是处理此类问题的,那应该用什么方式处理?
    6.是不是中间这个环节就不应该使用 ETL ,或者 ETL 之后还应当有个平台拿到 ETL 输出的数据然后调用 API 或执行一些编辑好的命令?

    请问是否有一个通用的平台能处理此类问题?还是只能写脚本“定制化”处理每个问题?
    第 1 条附言  ·  2022-06-05 11:09:49 +08:00
    5 条回复    2022-06-06 00:09:30 +08:00
    liprais
        1
    liprais  
       2022-06-05 00:27:23 +08:00
    这跟 etl 有啥关系
    数据整合好了谁要用谁自己来拿呗
    或者谁要用谁自己提供个 consume 的方法呗
    FYFX
        2
    FYFX  
       2022-06-05 10:31:47 +08:00
    ETL 只做数据处理啊,如果需要消费的话就让 ETL 把最终结果保存在 MySQL/Redis 之类的存储引擎就好,然后看情况是直连存储引擎还是通过平台配置接口(理论上只提供数据查询接口),然后业务逻辑是调用方自己做的,不过至于平台这个得看你所在的公司了,我之前在美团的时候是都有的
    iian
        3
    iian  
    OP
       2022-06-05 11:05:20 +08:00
    @liprais
    @FYFX

    我负责的是左侧的安全检测设备和右侧的认证系统、防火墙设备。

    现在想了解的是有没有现成的平台可以从 A 系统的 API 获取并信息处理,然后调用 B 系统的 API 提交数据(此处还希望能实现例如 ssh ip 后,执行固定的几个命令将从 A 系统拿到的 IP 添加到黑名单中)。
    dayeye2006199
        4
    dayeye2006199  
       2022-06-05 13:28:55 +08:00
    你说的是 reverse etl ,其实没有特别好的开源工具。考虑商业的话可以考虑 hightouch ,配合自定义 webhook 使用。

    https://hightouch.io/docs/destinations/webhook/
    iian
        5
    iian  
    OP
       2022-06-06 00:09:30 +08:00
    @dayeye2006199 看了下介绍,reverse etl 应该就是我需要的东西,我再查查相关资料。感谢。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3454 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 10:30 · PVG 18:30 · LAX 02:30 · JFK 05:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.