V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
herozzm
V2EX  ›  问与答

求能从文中提取公司/单位名称,电话,日期,金额工具

  •  
  •   herozzm · 2020-03-07 19:52:12 +08:00 · 1248 次点击
    这是一个创建于 1746 天前的主题,其中的信息可能已经有所发展或是发生改变。

    谢谢,回复必感谢

    9 条回复    2020-03-07 23:59:47 +08:00
    Whsiqi
        1
    Whsiqi  
       2020-03-07 20:04:06 +08:00 via Android   ❤️ 1
    回复必感谢是个坏习惯,后边的人分不清哪里是重点
    herozzm
        2
    herozzm  
    OP
       2020-03-07 20:32:43 +08:00
    @Whsiqi 那么重点回复呢?
    Raynard
        3
    Raynard  
       2020-03-07 20:36:19 +08:00   ❤️ 1
    没有这么符合精准要求的,python 自己写
    Whsiqi
        4
    Whsiqi  
       2020-03-07 20:43:16 +08:00 via Android
    @Whsiqi 感谢是给有意义的回复表达感谢的,所以有用肯定要感谢
    herozzm
        5
    herozzm  
    OP
       2020-03-07 20:56:53 +08:00
    @Raynard 需要用到机器学习吗?通过传统的正则,词库要提取的文本指数太复杂了,感觉没法完成
    Raynard
        6
    Raynard  
       2020-03-07 21:05:42 +08:00
    @herozzm 一点也不复杂。。

    或者你先发段文本看看,让论坛老哥帮你写,

    估计 2000 起吧
    herozzm
        7
    herozzm  
    OP
       2020-03-07 21:10:57 +08:00
    @Raynard 文中公司可能是 xxx 有限公司,也能使 xx 厅,xx 局,还有简写啥的,文章中中可能会提到多个公司名称,但是要选出一个真正的目标公司名称(有一定的逻辑,但是程序无法判断,需要人工甄别),比如:我开车路过 xx 单位,遇到一个在 xxx 公司上班的朋友聊了一会,顺便去 xxx 中心办了一趟事情,最后来到了我的公司 xxxx 公司,我的公司 xxxx 才是真正的目标公司
    lingalonely
        8
    lingalonely  
       2020-03-07 23:08:50 +08:00   ❤️ 1
    知识点:NLP 识别命名实体,应该有相应的工具和 API 可以用
    herozzm
        9
    herozzm  
    OP
       2020-03-07 23:59:47 +08:00
    @lingalonely 谢谢 大牛 找了一圈找到这家 BosonNLP,但是他们各种文档,唯独没有注册,干瞪眼
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5288 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 07:52 · PVG 15:52 · LAX 23:52 · JFK 02:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.