1
akira 2013-07-18 17:16:39 +08:00 1
博主是直接从 2010年中国国内团购网分析报告 里面看到的。那份报告里面直接有提到这些数据。
|
2
hhsv OP @akira
谢谢您的回答哇! 今天我发现一本叫《社交网站的数据挖掘与分析》的书。简介说,好像可以通过一定的编程经验和学习基本的Python工具 来挖掘Facebook、Twitter和LinkedIn等网站的社交数据。其中包含,谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿? 我想再请教一下: 1.是不是技术高手能通过编程得到上述数据? 2.网站 在数据方面 没有保护措施吗(因为我感觉这些数据很宝贵啊,就这么被别人看到了好像有点没有安全感)? 3.好像网络爬虫也能抓取数据(百度到的,还是不太懂啊),爬虫抓取的数据和编程得到的数据有什么不同呢? 问的有点多,可我真的很好奇啊,谢谢啊!!! |
5
jianghu52 2013-07-22 09:48:20 +08:00 1
说下我个人的理解。
首先,爬虫不可能搜集到这些信息。说到底,爬虫只是一个管道,负责把页面上的信息传递给搜索引擎,这个信息不可能那么多,那么详细,通常都是就是几十个字大小的内容。soe就是干这个的。 其次,数据挖掘不是无中生有,基础数据一定是存在的,再挖掘整理之后,才会出现结果。 结论:用户购买原因的这个结果,应该是通过问卷形式出现得到的。但是这个问卷可能不是通常意义上的纸质问卷,可能是通过一些诱导,比如退货的时候吐槽给几个选项,购买成功的时候炫耀几个选项。这样的零散的结果,然后再总结起来,形成了一个报告。 |