V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
xiaojay
V2EX  ›  问与答

爬了小黄鸡50万聊天话记录,除了分词、索引、关键词数据库匹配,还有其他方法做智能对话吗?

  •  
  •   xiaojay · 2013-02-05 12:25:04 +08:00 · 7416 次点击
    这是一个创建于 4309 天前的主题,其中的信息可能已经有所发展或是发生改变。
    25 条回复    2016-06-27 15:33:41 +08:00
    leofml
        1
    leofml  
       2013-02-05 12:59:32 +08:00
    请问能否借你这个数据库搜一个关键词?
    wzxjohn
        2
    wzxjohn  
       2013-02-05 13:02:54 +08:00 via Android
    这么大的库?放出来看看撒~
    xiaojay
        3
    xiaojay  
    OP
       2013-02-05 13:22:12 +08:00   ❤️ 1
    @leofml
    @wzxjohn

    http://sim.robot-ja.com/query/?query=你的对话

    刚做好,没有限制措施,不要太暴力哦 :)
    yi719
        4
    yi719  
       2013-02-05 14:37:12 +08:00
    @xiaojay 看到Django的报错界面了
    wzxjohn
        5
    wzxjohn  
       2013-02-05 18:10:04 +08:00
    @xiaojay 已经挂到我的微信小黄鸡上了~看看效果撒~~~
    xiaojay
        6
    xiaojay  
    OP
       2013-02-05 20:05:11 +08:00
    @yi719 是django,测试中
    @wzxjohn 这个是测试版本,过几天可能关掉的...
    你真的要用和我联系 [email protected] :)
    wzxjohn
        7
    wzxjohn  
       2013-02-05 20:16:44 +08:00
    @xiaojay 好啊~~~
    icevil
        8
    icevil  
       2013-02-05 22:55:08 +08:00
    很好奇怎么爬的。
    welsmann
        9
    welsmann  
       2013-02-06 11:36:23 +08:00   ❤️ 1
    @xiaojay
    随便输了个,出错了貌似...
    ericFork
        10
    ericFork  
       2013-02-06 11:39:08 +08:00
    很好奇是怎么爬出来的,还满有趣的~
    yoo
        11
    yoo  
       2013-02-06 12:46:15 +08:00
    这个好强,同求是怎么爬的!
    xiaojay
        12
    xiaojay  
    OP
       2013-02-06 12:49:18 +08:00
    @welsmann bug已经修复,感谢 :)

    为什么木有人讨论标题的问题,囧
    google了下,发现这个
    http://stackoverflow.com/questions/9706769/any-tutorials-for-developing-chatbots

    不过用aiml or chatscript 自己建,,貌似工程浩大 ...
    joby
        13
    joby  
       2013-02-06 12:55:51 +08:00
    什么是小黄鸡?
    wong2
        14
    wong2  
       2013-02-06 13:09:10 +08:00
    我用sphinx搭过。。你是爬的simsimi还是人人上的小黄鸡?
    xiaojay
        15
    xiaojay  
    OP
       2013-02-06 13:14:25 +08:00
    @wong2 哈哈,作者出来了。 人人...
    sphinx 是指 cmu的的语言识别系统 http://cmusphinx.sourceforge.net/
    还是 搜索索引系统 http://cmusphinx.sourceforge.net/
    wong2
        16
    wong2  
       2013-02-06 13:16:59 +08:00   ❤️ 1
    joby
        17
    joby  
       2013-02-06 13:36:16 +08:00
    我邪恶了:
    http://sim.robot-ja.com/query/?query=舔
    http://sim.robot-ja.com/query/?query=哪个酒店

    我还想对话复制进去,就可以还原原始对话出来。看来我想太多了
    xiaojay
        18
    xiaojay  
    OP
       2013-02-08 19:22:56 +08:00
    @joby 囧 小黄鸡果然有点黄...看来要过滤下

    ps: 如果做成免费api,不知道有木有人有兴趣用的?
    cherrot
        19
    cherrot  
       2013-02-13 10:56:10 +08:00
    如果做成免费api,你的服务器肯定会爆掉…… 低价倒是个好主意哦~ 肯定很多人用
    KiseXu
        20
    KiseXu  
       2013-02-13 11:40:57 +08:00
    @wong2 你就是大鹏吗
    qinix
        21
    qinix  
       2013-02-13 12:57:10 +08:00
    好东西啊,api收费我都用
    wong2
        22
    wong2  
       2013-02-13 19:24:02 +08:00
    @KiseXu 是的,小花你好~
    xdeng
        23
    xdeng  
       2013-05-25 14:24:34 +08:00
    链接失效了 求新连接
    xiaojay
        24
    xiaojay  
    OP
       2013-05-25 21:23:27 +08:00   ❤️ 1
    @xdeng 改用simsimi自己提供的api了,所以关闭了这个服务
    dgkae
        25
    dgkae  
       2016-06-27 15:33:41 +08:00
    @xiaojay 还在吗,想要那个 50W 数据库,能卖我一份吗 315027768#qq.com
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2659 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 05:25 · PVG 13:25 · LAX 21:25 · JFK 00:25
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.