V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  print1024  ›  全部回复第 1 页 / 共 6 页
回复总数  109
1  2  3  4  5  6  
如果数据库 id 是有序的话可以先排序,然后切分数据,如 1000 条一次,多线程处理,也就这样了,用中间件其实没太大必要
找 leader 要,有问题有想法就沟通,不要闷着,不要怕打扰别人,太难受
164 天前
回复了 print1024 创建的主题 买买买 马上 618 了,有什么值得买的推荐吗?
@ghwolf007 哈哈哈,想看看大家都买了点啥好东西
一般 java 做的都比较复杂,不适合线上沟通,但是 Python ,go 可能就为了解决一个特定问题,不会有太多的发散。
167 天前
回复了 print1024 创建的主题 VXNA 个人博客申请收录
@linghan 谢谢,哥们
蘸醋吃解辣
@vivisidea @corningsun @GuuJiang @soupu626 @lrjia 目前采用了 @vivisidea 所说的这种方式,不过我是 AC 自动机+ HashMap<keyword,Set<XXDTO>>这种形式,在数据量大的情况下较 @corningsun 方式速度能提升 10 倍。感谢感谢
@soupu626 这是一个不错的思路,前缀 map 能细讲一下吗
@corningsun 感谢,checkExistRule 是有问题的,我目前采用了你这种方式,线上 YYDTO 每条耗时差不多 150ms ,因为每次都要过 10w 条 XXDTO
@GuuJiang 这个反向关联关系不太好维护,因为多个关键词同时包含才能确定一个标签,拿到了命中的关键词后,去循环查找哪个标签下的关键词组合能够匹配上?那相当于还是要从头到尾遍历一次 XXDTOList 啊
@GuuJiang 因为这是一个打标的场景,A 标签规则是一组关键词,B 标签也是一组关键词,如果文本完全命中这些关键词的话怎么区分是 A 标签命中还是 B 标签命中呢
@BiChengfei parallelStream CPU 测试消耗比较大,我们线上 CPU 就 2 核,直接就打满了
@liprais 这是一个打标的场景,如果关键词全部包含则打上这个标签,考虑过建树但是匹配完如何知道是哪个关键词规则命中呢
293 天前
回复了 good4you 创建的主题 创业组队 副业:建设二手交易平台 招贤纳士
后端语言是?
2020-07-30 17:05:34 +08:00
回复了 cszchen 创建的主题 Kubernetes 不想用 ELK 或者 EFK,有没有简单的替代方案
阿里云日志服务 每月免费额度 500M
2020-06-25 13:53:41 +08:00
回复了 pythonee 创建的主题 程序员 有没有同城沙龙、活动类的 app
活动行,百格活动,疫情之前大多数公司用这两个。
今年全都转线上了。
2019-10-22 14:59:07 +08:00
回复了 duozhuayu 创建的主题 酷工作 [多抓鱼][北京][招聘]多抓鱼继续抓人
做过搜索,目前在做基础架构,不过专职是 Java,golang 会用但是不熟。回头去试试 :)
如果你是 leader 的话那就强推 TS,让全员学习并逐步替换现有 js,同事不想用不是技术上的问题,对于企业来说最重要的是成本。
1  2  3  4  5  6  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2599 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 28ms · UTC 04:43 · PVG 12:43 · LAX 20:43 · JFK 23:43
Developed with CodeLauncher
♥ Do have faith in what you're doing.