1
emric 2013-12-10 22:33:19 +08:00
先用 document.referrer 取出 HTTP_REFERER 然后根据来源正则出关键词.
然后做出 ['xxx.com', 'xxx', '网址'] 类似的关键词列表, 之后使用正则匹配. 这个说起来挺简单, 但做好却不是很容易. 建议你先了解文本分类算法. |
2
bombless 2013-12-11 11:10:39 +08:00 1
要是让我来做的话,肯定是先大杂把的吧数据都存起来,后面再取一个时间段的数据搞下来,再把百度那些记录也抓下来,然后离线分析。
存储的时候分类其实没什么用的。这些具体的关键词在后面SEO还能用上,多好。 所以这整个事和前端没什么关系。 不过不同的人做事风格不同就是了~ 或者一定要和百度统计结合的话,也可以先存储这些来源,做了一番离线分析,把所有的非长尾的情况全部统计出来,这个时候再组织代码分类哪些是长尾哪些不是长尾不就轻松多了。 |