V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  yuikns  ›  全部回复第 20 页 / 共 42 页
回复总数  823
1 ... 16  17  18  19  20  21  22  23  24  25 ... 42  
丢两个以前无聊随手写的科普
https://blog.argcv.com/articles/2857.c
https://blog.argcv.com/articles/1036.c


工具的话,看看这些:
xgboost: https://xgboost.readthedocs.io/en/latest/index.html
svmlight: http://svmlight.joachims.org/
台大的 libsvm 也挺好玩的,他们老板当年每年换学生重新实现,我还见过几个。https://www.csie.ntu.edu.tw/~cjlin/libsvm/

fb 的 fasttext 也值得看看 https://github.com/facebookresearch/fastText/
我没做过。这个做得非常准确很难,f1 跑个 80, 90 还是不困难的。主要是低水平的太多了。

下面有个我小时候的习作,大致就是 dataset 下面有两个目录,分别是 baseball 相关的邮件和 hockey 相关的邮件。

https://github.com/yuikns/hello-perceptron

然后随机 shuffle 后用最粗糙的感知机做个 training 和 testing。

英文邮件最重要的处理是 stem,就是取词干,去停用词。中文最重要的是分词,然后去停用词。

然后每个文本样品通过上面的处理得到一个非常粗糙的 n 维数组( Xn ) 以及一个标记 1 或者 0 的 Y。

perceptron, svm 等等判别模型的目标就是假定存在一个方程

x1*w1 + x2 *w2 +..... xn * wn + b = y

你先抽取各个 feature X 以及结果 y, 然后丢模型里面训练出一组 W 和 b。

生成 x 的方法有很多,nlp 的话,最简单的跑个词袋,弄个 w2v 什么。然后拉出 feature 后丢过去跑就是。

经典机器模型用 svmlight 或者 xgboost,不行的话拿 pytorch 撸个 cnn 什么也行。参数随便选选,然后降个纬随便看看。其实跑个中不溜秋的结果还是可以的。
If you want to force Compose to stop and recreate all containers, use the
`--force-recreate` flag.

你不 `--force-recreate`,没变化是不动的。
2019-03-06 09:39:31 +08:00
回复了 linearxian 创建的主题 互联网 国内外网速差异
@kisara 额,伤口戳得有点凶。和很多小伙伴弄了个家庭套餐,每人 30+ 刀,几个 G 高速网,进大楼信号丢失。
2019-03-06 09:32:32 +08:00
回复了 digitalwater 创建的主题 职场话题 帝都年薪 50W 还是肉翻美帝读 PhD
@Andiry 我记得他当时应该没有全职工作经验,毕业前就拿到 offer 的。不过本鶸看来那位大佬不是正常人类。
确切说,我当时是知道 package 是将近 50 万刀。l5 + sp 不知道能不能达到这个位置?

@digitalwater 没了解过政策。我记得 master 和 phd 是一个池子里抽的吧。和国内不一样,PhD quit 的特别多。一个月两千刀可能都不到,房子车子吃饭完了剩下两三百,毕业也不那么确定。更多的是某种彷徨的无力感。老板问过我读不读 phd,我说不敢不敢。(我还不想自尽...
2019-03-06 09:04:09 +08:00
回复了 linearxian 创建的主题 互联网 国内外网速差异
@timle1029 https://s2.ax1x.com/2019/03/06/kj20HA.png

美帝南部小城市。不过没有 ipv6。
2019-03-06 07:36:53 +08:00
回复了 linearxian 创建的主题 互联网 国内外网速差异
顺便的。国内的上行速率基本是个位数。
2019-03-06 07:34:06 +08:00
回复了 linearxian 创建的主题 互联网 国内外网速差异
国内“外”?这个概念太广了吧。
我这儿 Google Wifi 日常测速 500M 上下,免费。
2019-03-06 06:40:23 +08:00
回复了 digitalwater 创建的主题 职场话题 帝都年薪 50W 还是肉翻美帝读 PhD
@yanaraika mit stanford harvard cmu 里面就属 cmu 量大各种批发 offer。

> l4 大概 20w 左右

我是针对楼主的

> 技术好像也就 20W 上限了

这句话。国内 50 万的拿 l4 应该算降级跳槽了,不过也已经达到那个 “上限” 了。以前实验室有个大佬以 master 拿 l6 进门,也算是平生仅见了。不过普通人 l5 还是可以的。
2019-03-06 06:29:34 +08:00
回复了 digitalwater 创建的主题 职场话题 帝都年薪 50W 还是肉翻美帝读 PhD
@yuikns 不好意思又 typo 又表述错误。刚才查那个表格然后回忆各种小伙伴们的介绍不知怎么脑残了...
salary 基本工资外,此外还有 bonus 和 stock 都可以考虑的,虽然平时用不着,不过都是真的钱。要是可以我真的想少要点 salary,多点 stock。
2019-03-06 06:20:23 +08:00
回复了 digitalwater 创建的主题 职场话题 帝都年薪 50W 还是肉翻美帝读 PhD
如果没有学术理想,CMU 有很多短期的 master 的。比如 lti,一两年的项目就有 opt 了,价格 8 万刀就成。
要是是 PhD,也可以努力一下,不过要是 6-7 年毕业也是可能的,或者折腾两三年拿 master 走人也不错,至少省了一笔。


不知道你怎么算薪水的。不算期权的确二十几万就差不多了,加上交个税那个叫狠。但是加上 sallery, bonus 还行的。

价位可以参考 https://www.levels.fyi/SE/Google/Facebook/Microsoft

楼主北京 50W,同能力差不多 Google 的 L4, L5 还是不成问题的。

当然对自己能力有信心的话,直接面试其实也行,不过没有 opt 拿美国的 offer 可能比较麻烦,各种强力 refer 都能简历拒,对自己自信心打击有点大。
2019-03-04 16:27:08 +08:00
回复了 harryge 创建的主题 问与答 mac shell 中如何把 options 后置?比如 ls . -la
要是只是 ls 的话,可以自己某处写个 wrapper 如下。

#!/bin/sh
args=()
flgs=("-G")
for opt; do
case "$opt" in
-*) flgs=("${flgs[@]}" $opt);;
*) args=("${args[@]}" $opt);;
esac
done
exec /bin/ls "${flgs[@]}" "${args[@]}"



rm 等皆类似。
2019-03-04 16:07:28 +08:00
回复了 Heiban 创建的主题 健康 明天(今天)去拔智齿😭
@maichael 三四百一颗。便宜得很
2019-03-04 15:58:42 +08:00
回复了 Heiban 创建的主题 健康 明天(今天)去拔智齿😭
@haiyang1992 有钱。随便去医院转转不算保险都上千刀没了的表示真怕了美帝的医院了。
2019-03-04 13:57:21 +08:00
回复了 Heiban 创建的主题 健康 明天(今天)去拔智齿😭
@haiyang1992 我是北京口腔医院拔的。第一次拔了一边上下两颗。第二次去医生说和我拔一颗。我说上次另一个医生说可以一次两颗呢。这位医生说这不安全,谁给看谁嗦了蒜。于是我第三次才拔完的。
2019-03-04 01:55:51 +08:00
回复了 Heiban 创建的主题 健康 明天(今天)去拔智齿😭
我四颗一起拔的 @haiyang1992 狠人啊
2019-03-02 01:04:16 +08:00
回复了 j0hnj 创建的主题 程序员 看 reddit、github issue 比较吃力
@LxExExl good question
2019-03-02 00:32:41 +08:00
回复了 hugee 创建的主题 PHP PHP 高并发 统计网页点击次数
这和底层 io 关系不大,主要是上层事务锁的问题。
单机没特别配置的话,数据量到百来 g,并行百来个 mysql 就可以歇着去了。
但是读写是问题么?其实问题主要是上层各种事务锁关联折腾的。mongodb 的优势是假设没有各种乱七八糟关系,专心做 kv store。
多机做 sharding 更不用说了。

所以楼主在问别人问题的时候,自己其实有没有用过它们…
1 ... 16  17  18  19  20  21  22  23  24  25 ... 42  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5474 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 05:47 · PVG 13:47 · LAX 21:47 · JFK 00:47
Developed with CodeLauncher
♥ Do have faith in what you're doing.