V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  sky101001  ›  全部回复第 2 页 / 共 5 页
回复总数  82
1  2  3  4  5  
期待大家说 intel yes 的那一天到来
2020-03-09 15:49:50 +08:00
回复了 Kontinue 创建的主题 程序员 ECS 选购咨询
个人感受,搭博客之类的,cpu 甚至内存都不重要,基本够用。带宽线路才是影响体验的大头
不错不错,正需要类似的服务
如果有 docker 就更舒服了
挺好,之前一直用,感觉 edge 比 chrome 省不少电
2019-10-25 10:03:49 +08:00
回复了 jzq526 创建的主题 机器学习 入门机器学习,加个显卡还是神经计算棒?
之前买了个 6g 的 p106,299,用着感觉不错
2019-10-17 00:05:45 +08:00
回复了 taogen 创建的主题 程序员 做一个小调查,你们用 MySQL 5.7 还是 8.0,或者 MariaDB ?
逐步转为 postgres
2019-08-15 16:18:14 +08:00
回复了 Wallace007 创建的主题 问与答 想问社区大佬现在前端布局的主流方式是什么?
flex 兼容性吃过亏以后。。。
absoulte 一把梭
2019-08-14 13:29:07 +08:00
回复了 sayhier 创建的主题 程序员 excel 工具,如何最简单的变成 web 服务?
要真正保密只能在后端操作吧。用 js 重写一样会暴露算法,防君子不防小人。
不肯做 api,那不妨用 vba 封装 dll,每次用的时候给出动态密码,需要下载对应的临时 key 才给用。不过这种做法纯属脱裤子放屁
2019-08-01 20:51:22 +08:00
回复了 Hanggi 创建的主题 Go 编程语言 Go 语言程序部署到服务器好方便啊
交叉编译是真的好用!
2019-07-31 08:49:37 +08:00
回复了 goreliu 创建的主题 Linux WSL 和 WSL2 简单对比
真希望 wsl 能支持 cuda
2019-07-30 23:31:13 +08:00
回复了 lyver 创建的主题 推广 天这么热...不如来一场线(fu)上(li)答(huo)题(dong)!
用勺子挖西瓜吃,才是夏天
2019-07-30 23:29:45 +08:00
回复了 lyver 创建的主题 推广 天这么热...不如来一场线(fu)上(li)答(huo)题(dong)!
我来组成分母
2019-04-11 19:52:24 +08:00
回复了 enkechan 创建的主题 游戏开发 有没有人做兼职外包的,有个游戏要做
冰球,真人对战,不卡顿。。。
2019-03-27 10:20:26 +08:00
回复了 lincya 创建的主题 问与答 请问大佬, html 在移动端、PC 端、Web 端分别用什么单位啊?
都用 rem 吧,省事
vba 应该足以满足要求了吧
2018-11-30 00:35:18 +08:00
回复了 Joryck 创建的主题 Linux WEB 服务器 CentOS、Ubuntu、Debian 推荐哪个?
现在推荐 CoreOS+docker 会不会被打
2018-11-21 19:38:14 +08:00
回复了 kentxxq 创建的主题 Python 关于 docker 打包 Python 环境的问题
gevent 这种库在 docker 里最好不要用 pip 安装,推荐使用包管理工具直接安装。
实测在 alpine 里是可以成功 apk add py-gevent 的
说起来 alpine 是真的小,我以前做过一个 python+flask+gevent+mysqldb+gunicorn 的镜像,debian 要 500M+,alpine 只要 60M
2018-10-30 19:18:54 +08:00
回复了 annoy1309 创建的主题 问与答 求教,论坛如何在高匿名性和其他问题之间获取平衡?
楼主或许可以参考下这个
https://8chan.cc
用加密的 cookie 存储身份信息,另外设置了一个小小的防刷帖机制,没有用到验证码。
域名快要过期了,不打算继续开下去。所以请随意测试~
2018-10-30 09:13:01 +08:00
回复了 iblislsy 创建的主题 程序员 求一个可行方案:计算新用户和老用户通讯录的最高匹配度
@Xs0ul 是的,这个不是 bloomfilter 的标准用法,在取或操作后摘要不再稀疏。 个人是觉得在文本长度不定的情况下,用局部敏感哈希按照(相同号码数量 /新用户的号码数量)计算相似度会比较麻烦,所以提了这个方法。本质上是就给号码归类以降低计算量。

最终要的就是这个不稀疏的结果,假设有三个签名,分别为 11000110,11000100,01100111,可以很容易地看出前两个数据集重合的可能性更大,这样就可以筛除海量数据中不相似的那部分。

当然,这是有误判的概率的,这个概率是和 hash 函数以及签名的长度有关的。这种 hash 函数,很好取,提一个不太好的函数--比如我希望 hash 函数要在 256bit 的空间里至多有 2 个 1,我可以把 md5 的最后 16 位分成两段 8 位的摘出来,决定这两个 1 的位置。
2018-10-29 20:24:24 +08:00
回复了 iblislsy 创建的主题 程序员 求一个可行方案:计算新用户和老用户通讯录的最高匹配度
个人觉得数据量较大时,利用 Bloom Filter 是最佳解决方案:
1. 首先设计几个不同的 hash 函数,这些 hash 函数可以把手机号映射到 256bit 的空间里,并具有“稀疏”的特点(就是说 1 的数量很少,几乎全是 0 )比如手机号 A 可以在 hash 后得到 00100010,手机号 B 得到 00100001。
2. 然后对用户通讯录里的每个手机号进行 hash 操作,并将所得的结果按位相加,得到一个签名。比如手机号 AB 相加,得到 00100011。不同的 hash 算法可以得到不同的签名。记录这些签名。
3. 每当有新用户注册,对其通讯录进行以上处理,得到其签名(如 00100001 )。将新用户的签名和老用户的签名进行与操作,记录 1 的个数,1 的个数最多的,就可能是最相似的。
这样初筛时间复杂度是 O(N),之后再进行处理就快多了。
1  2  3  4  5  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2901 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 34ms · UTC 12:24 · PVG 20:24 · LAX 04:24 · JFK 07:24
Developed with CodeLauncher
♥ Do have faith in what you're doing.