@好东西传送门 出品, 过刊见 http://ml.memect.com
订阅:给 [email protected] 发封空信, 标题: 订阅机器学习日报
可点击加长版44条 http://ml.memect.com/archive/2015-02-03/long.html
@老师木
关键词:公告板, 自然语言处理, 问题
word embedding(如word2vec)到底有用在何处?china-beijing=japan-tokyo这种性质又有什么用途呢?所以,通常用什么指标评价这个方法好/神奇。
@zwner
关键词:会议活动, 算法, 应用, 资源, PDF, WSDM, 广告系统, 幻灯片, 会议, 课程
我们研究组在#WSDM2015#上关于Real-Time Bidding展示广告的教学演讲幻灯片可以下载了: [1] 这次除了有各类DSP竞价算法、SSP底价算法外,还加入了anti-fraud和广告期权交易的内容。另外也罗列了做互联网广告研究的公开数据集和开源工具。 @袁帅
[1] http://tutorial.computational-advertising.org/images/WSDM2015.pdf
@好东西传送门
关键词:公告板, 算法, 招聘
国内互联网公司机器学习数据挖掘类的职位面试主要考察什么方面的东西? [1] 知乎的这个问答里Orangeprince列出几类不同的从业者 ,招聘主要根据其中H和I两类模版挑选人才。看 1.机器学习算法的理解 2.实际的项目经验 3.对于业务的理解能力和敏感性 4.沟通表达能力
@Rachel____Zhang
关键词:经验总结, GPU, 博客
#CUDA系列学习 (四)终于写好了~ 首先介绍了Parallel communication patterns的几种形式(map, gather, scatter, stencil, transpose), 然后复习了cuda memory model并从high level上分析怎样写出高效代码,最后继续上一讲讨论流程控制(control flow)以及原子操作。 [1]
[1] http://blog.csdn.net/abcjennifer/article/details/43374009
长微博图: http://ww1.sinaimg.cn/large/9b6c6e0fgw1eow8hq4fyqj20530eidgw.jpg
@cosmozhang
关键词:自然语言处理, 主题模型
我试了一下用doc2vec [1] 处理 Pang 和 Lee 的 sentimet analysis 的数据集,对于每一个doc得到 一个feature vector 再用这个feature vector 作为输入用svmlight 进行分类,结果准确率在53%左右,和抛硬币没太大区别。[汗]