V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
yaotian
V2EX  ›  Python

用django做的自维护的网站,无人职守

  •  
  •   yaotian · 2012-07-20 08:19:23 +08:00 · 6628 次点击
    这是一个创建于 4538 天前的主题,其中的信息可能已经有所发展或是发生改变。
    http://sche.mobi 自动收集,无人工干预。

    跑在VPS上,速度还可以吧?

    用了文件cache.

    连mysql数据库都没用。

    大家给点意见
    26 条回复    1970-01-01 08:00:00 +08:00
    Coda
        1
    Coda  
       2012-07-20 08:31:17 +08:00
    解析稍慢, 打开速度还可以~
    yaotian
        2
    yaotian  
    OP
       2012-07-20 08:32:09 +08:00
    @Coda 域名解析?
    Coda
        3
    Coda  
       2012-07-20 08:34:35 +08:00
    嗯, 感觉不是秒开~ 不过可以接受的. 毕竟不是国内的.
    manhere
        4
    manhere  
       2012-07-20 08:46:13 +08:00
    传说中的小偷程序嘛。
    chiang
        5
    chiang  
       2012-07-20 08:47:30 +08:00
    楼主,能不能写个能够关注租房信息的的分支功能呢。比如“安农大 校内”,有这字眼的词就出现在网站上。
    想在学校周围租个房子,却要每天蹲点在各大信息网站等刷新,很累的。
    yaotian
        6
    yaotian  
    OP
       2012-07-20 09:52:11 +08:00
    @manhere 啊?
    iiduce
        7
    iiduce  
       2012-07-20 09:54:26 +08:00
    定时任务用的哪个?
    helloboy
        8
    helloboy  
       2012-07-20 10:15:38 +08:00
    可以发篇文章讲解下大体架构方面的
    yaotian
        9
    yaotian  
    OP
       2012-07-20 10:41:32 +08:00
    @iiduce Crontab
    yaotian
        10
    yaotian  
    OP
       2012-07-20 10:51:18 +08:00
    @chiang 理论上这个平台可以收集不同的信息。
    但不是搜索引擎,是有针对性的收集。
    你觉得这个能形成一些商业模式吗?
    RisingV
        11
    RisingV  
       2012-07-20 11:09:14 +08:00
    @helloboy 有同感。望楼主不吝分享
    bshu
        12
    bshu  
       2012-07-20 11:09:17 +08:00
    这个不就是定时抓取特定网站特定栏目的特定信息么?然后封装一下就展示出来,功能是不是太简单了啊?
    chiang
        13
    chiang  
       2012-07-20 13:36:02 +08:00
    @yaotian 我(程序盲 愿意支付几块钱获得这样的服务。
    自己也想过弄一个这样的网址,就类似于可以自定义爬虫,虽然对程序员来说这东西不值一提,但是不失为一种及时筛选出需要信息的快速途径。到时候可以加上邮件,或者短信提醒。搜集到某信息后立即通知。
    csx163
        14
    csx163  
       2012-07-20 20:46:04 +08:00
    @chiang google已经有这种东西了,你写个关键词,天天给你发邮件。
    yaotian
        15
    yaotian  
    OP
       2012-07-20 21:32:38 +08:00
    @csx163 准吗? 我用过,没几个准的
    alsotang
        16
    alsotang  
       2012-07-21 16:53:29 +08:00
    @csx163
    @yaotian
    一点也不准,我订五月天的消息每周一次,每次发来的都不懂是些什么东西。。。
    fantasy614
        17
    fantasy614  
       2012-07-22 00:07:32 +08:00
    这。。。不就爬了个赶集的信息么,做起来应该挺简单的说
    kojp
        18
    kojp  
       2012-07-22 17:58:19 +08:00
    不错~~~~ 信息挺有用的。
    yaotian
        19
    yaotian  
    OP
       2012-07-23 14:55:43 +08:00
    @fantasy614 如果要爬很多个不同的网站呢。。。
    yaozhifeng
        20
    yaozhifeng  
       2012-07-23 17:23:58 +08:00
    bootstrap, 不错啊呵呵
    yaotian
        21
    yaotian  
    OP
       2012-07-24 00:30:10 +08:00
    今天更新了后台程序,提高了精度。增加连接池等稳定机制。
    页面上增加了按钮“曾被我抱过”
    iiduce
        22
    iiduce  
       2012-07-24 00:49:38 +08:00
    能讲讲“增加连接池等稳定机制”么
    @yaotian
    coldear
        23
    coldear  
       2012-07-24 01:28:21 +08:00
    @yaotian
    我正想着做个类似的东西,针对电子产品的,针对美国用户的
    lz不用数据库,是不是给每个用户建立了一个scheduled task, 定时去分析一下爬下来的网页?
    另外是不是有网页的cache? 不会每个用户都去重新爬一下吧?
    也可能我完全理解错了,希望能交流一下
    yaotian
        24
    yaotian  
    OP
       2012-07-24 10:37:46 +08:00   ❤️ 1
    @iiduce 我有篇博客可能对你有帮助 http://zhengyaotian.com/?p=178
    iiduce
        25
    iiduce  
       2012-07-24 11:20:54 +08:00
    有用,谢谢~
    moyerock
        26
    moyerock  
       2012-07-24 14:47:58 +08:00
    不错不错,速度可以
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1001 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 18:41 · PVG 02:41 · LAX 10:41 · JFK 13:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.