V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ic2y  ›  全部回复第 4 页 / 共 14 页
回复总数  262
1  2  3  4  5  6  7  8  9  10 ... 14  
2020-08-14 09:02:42 +08:00
回复了 garsday 创建的主题 问与答 2020 年,对 Ubuntu 支持良好的笔记本,求推荐
@gainsurier 推荐 Dell 的商用系列。

我有个笔记本,是公司发的 Dell latitude 商用笔记本。然后安装了 Ubuntu,对比其他的笔记本安装的 Ubuntu,我看到 有两个不同。

1.Dell latitude 上安装的 Ubuntu 启动的时候,居然会有 Ubuntu+Dell 的徽标一起闪烁,其他的联想等笔记本,只显示 Ubuntu 徽标 在闪烁。 至少从感觉上,我猜 Ubuntu 进行了针对性适配。

2.Dell latitude 上安装的 Ubuntu 硬件功能全部是正常的。离奇的是,弹出的 Ubuntu 商店里,识别出了具体型号,而且提示我更新 Dell 的 BIOS 微码什么的,说有安全风险,而且是最近更新发布的。 我在自己和其他人的电脑,安装过好多 Ubuntu,真的没见过 Ubuntu 会主动弹窗提示升级 BIOS,解决安全风险的。
100 万条词组,首先向量化,例如 yellow wall,可以标记为 [1,2] 1 表示 yellow,2 表示 wall

以此类推,little cat,可以标记为 [1, 3] 3 表示 cat 。

100 万条 向量化的词组,就是 100 万条 整形数组的序列,把这个序列变成 一个字典前缀树。

Node{
int value;
Map<Interget,Node> childs;
}

这棵树,在 100 万的量级,应该不大。都是整形的。保存在内存中。

遇到 a little cat is sleeping behind 就向量化,变成 23 45 18 1 4 之类的数字,

从 23 开始,依次从字典前缀树的 root,开始匹配,是否能匹配到叶子节点。如果匹配到,就输出。

否则,继续匹配 45 、18 等。
@12101111 @tms @Osk

问题已经解决了。是 Hyper-v 的动态内存的问题。关闭了 Hyper-v 的动态内存,Centos 的内存消耗就变正常。

刚开始,解决问题的思路偏了,一直以为有什么恶意脚本。但是始终找不到进程。

猜测的最终原因:应该是 Hyper-v 与 Centos7 的适配有问题,Hyper-v 的动态内存我设定最小 2G,最大 6G,中间应该有 4G 没有真的分配,被宿主机挪走了。但是 Centos 就显示 4G+真正的使用的内存。就变成 80%的内存使用率了。
@patrickyoung 完整的 dmesg 的地址 https://pastebin.com/3Zn2LtGN
@patrickyoung 更新过了。我第一把发上去,就发现乱了。后续 死活打不开 V2EX 了。好像网站断断续续被攻击。
2020-05-19 19:15:07 +08:00
回复了 yuk1no 创建的主题 问与答 一道面试题给我整懵了,求指导
上面的第二句打错了。是合规的 pair 会有漏洞之鱼。 过滤器说是合规的,其实只是碰撞了。
2020-05-19 19:12:13 +08:00
回复了 yuk1no 创建的主题 问与答 一道面试题给我整懵了,求指导
一个用户可能有多个订单,但是一个订单只能属于 1 个用户。 而且订单是百亿级,还每天增量更新。那么感觉常规数据库应该满足不了这个需求。

具体的存储,可以考虑用 HBase,用 用户 id+订单 id,作为 rowkey 进行信息存储。

1.查看 用户 id-订单 id 组合是否有效时。如果内存全量建模存储,应该是资源要求蛮高的。可以考虑用布隆过滤器。因为属于用户 1 的订单 111,永远都属于用户 1,具有不变性。所以布隆过滤器,适合这种场景,可以一直叠加。 通过第一层过滤,快速过滤出来不能 vaild 的 pair 。

2.鉴于布隆过滤器的误报的特点。不合规的 pair 会有漏网之鱼,但是到这一层数量会很少了。组装这些 pair,做成 TreeSet,找到 rowkey 的上界和下界,然后使用 HBase 的 OnlyRawKey 的 Scanner 的 Filter,只扫描 rowkey 。因为 rowkey 本来是 b 树的,线性扫描的时候,判断 rowkey 是否在 TreeSet 里。
2020-05-17 23:52:14 +08:00
回复了 djyde 创建的主题 程序员 离开阿里巴巴
@djyde
我也是刚从阿里离开不久,跟你离开的原因有一点像。
1.面向 KPI 编程是很不好的,大家都在考虑如何才能增加 GMV,但是混乱的代码呢?缺少的文档呢?匆忙上线的代码后续的维护呢?
2.内耗不小,沟通不畅,钉钉虽然让沟通异步化了,但是沟通成本也不低,很多人看了不回,@不回,只能打电话。
3.感觉身心疲惫,不单是加班和大促的疲惫,还有心累。那种看起来很忙,但是没有达到自己预期成长的疲惫。
不对,是分母来了
分子来了
那为什么不用 fseek
2020-04-30 12:37:42 +08:00
回复了 NoKey 创建的主题 程序员 请教一下 Java 大佬,大量使用反射进行回调,是什么套路?
@NoKey 叫动态代理。先声明一个接口,动态代理这个接口 [内部路由请求到具体实例的方法] ,通过这个接口实现外部的 Http 或者 TCP 请求 到 本地的方法之间的桥接。
2020-04-28 09:16:42 +08:00
回复了 yupozhang 创建的主题 Linux 轻量简单好用的开源自动化运维平台
@yupozhang 老哥给个测试的账号密码
并没有说明公司的位置。
2020-04-21 19:22:40 +08:00
回复了 jeffh 创建的主题 程序员 Java 调用链跟踪源码求助
例如,com.mysql.jdbc.StatementImpl 的 executeQuery 方法,这种底层 jdbc 的 查询和 execute 方法,打上断点,然后做一些业务操作,静静等待断点到来
2020-04-21 19:19:06 +08:00
回复了 jeffh 创建的主题 程序员 Java 调用链跟踪源码求助
@jeffh 直接在 jdbc 的 jar 包打断点,让线程停住,然后回头看调用栈。看看上下文是怎么做 ORM 处理的。
2020-04-15 12:40:35 +08:00
回复了 easylee1996 创建的主题 问与答 如何纯前端实现爬虫
使用浏览器扩展,是可以的。

一些比价插件,就会通过插件扩展机制,去扫描当前页面的 document,根据不同的网站 url,执行不同的采集策略。

采集到的数据,会通过 http 传送到后端,既能让用户帮助自己辅助数据抓取,也能满足用户更精准的比价需求 [爬当前页的商品基本文案,可以比价推荐类似的产品] 。
2020-04-09 16:11:57 +08:00
回复了 gonethen 创建的主题 问与答 关于 mysql 优化,请教大神们~
你表结构都没有,没有索引之类的 信息,大家怎么帮你看呢?
2020-04-08 09:03:39 +08:00
回复了 burnbrid 创建的主题 Java Java 很普通的代码执行很慢
1.你的问题的格式 看起来 很乱,没有分行?

2.如果是这种奇怪的问题,你得贴代码,还有平台、jdk 版本;只描述信息,没人看得懂
2020-03-24 09:31:04 +08:00
回复了 gssong 创建的主题 MySQL abc 联合索引查 bc 走不走索引
1  2  3  4  5  6  7  8  9  10 ... 14  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1008 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 18:43 · PVG 02:43 · LAX 10:43 · JFK 13:43
Developed with CodeLauncher
♥ Do have faith in what you're doing.