V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ipwx  ›  全部回复第 72 页 / 共 200 页
回复总数  4000
1 ... 68  69  70  71  72  73  74  75  76  77 ... 200  
2021-05-11 16:23:28 +08:00
回复了 lostSoul 创建的主题 MySQL 多租户系统,采用 PostgreSQL 好还是 Mysql 好
我直觉上,tenantId 是很好的方案。但是得配合分库分表,通过 tenantId 哈希到某个机器的数据库上,每个机器上又存储若干 tenantId 的数据。如果之前的数据库满了就增加机器,哈希函数改一改。如果某个租户变成狗大户就专门给他放到狗大户的机器上,狗大户的机器少放点租户,小用户的机器上多放点用户。
…… 合并的过程不仅要用二分,可能还要用优先队列。优先队列是为了 O(1) 确定哪个倒排索引的下一个元素是最前面的,二分是为了跳过某个倒排索引因为太靠前了和别的倒排索引根本不可能相交的位置。
最后补充一句:因为倒排索引是根据位置排序的,多个倒排索引 + 不能超过 20 个字符误差范围这个条件能快速进行多路倒排索引的合并。合并过程可以用二分。。。总之是挺复杂的一个程序,但可以很快。
筛选这一步太麻烦了,楼下贤者可以补充。
如果只是针对一个查询串:带边界条件的 edit-distance 算法?复杂度大概是 O(MN) 感觉。。。( M=100 万,N=20 )

如果针对很多很多查询串:把大字符串预先拆成重叠的 k-字符(比如 3 ),然后针对这些 k-字符建立倒排索引。然后用查询串的 k-字符去取出相关的索引,根据索引的先后位置和匹配次数你可以快速筛选出可能匹配的位置。最后针对这些位置做一次 edit-distance 最终确认。
2021-05-11 12:52:54 +08:00
回复了 imn1 创建的主题 Windows windows 有没有这种自动移动文件的工具?
奥错了还有子目录。那就用 python glob 吧
2021-05-11 12:52:32 +08:00
回复了 imn1 创建的主题 Windows windows 有没有这种自动移动文件的工具?
伪代码:

while true: {
mkdir -p D:\a\
mv C:\abc\*.zip D:\a\
sleep 10
}
2021-05-10 15:13:05 +08:00
回复了 vueli 创建的主题 程序员 我天真的以为全栈说的是前后端, 现在才知道原来是 全干!
顺便我第一次听说以深入了解某个公司(还不是大厂)的业务为荣的。那这个公司倒了你不也照样失业?
2021-05-10 15:12:27 +08:00
回复了 vueli 创建的主题 程序员 我天真的以为全栈说的是前后端, 现在才知道原来是 全干!
@darknoll 你说的这种不算全栈,确实如你所说是干杂活的。
2021-05-09 14:46:36 +08:00
回复了 xiaofan2 创建的主题 Java 大数据量下的精确统计解决方案
@cxxlxx ummm 不好意思脑子秀逗了。20×1000s,大概是 5 个小时?
2021-05-09 13:29:52 +08:00
回复了 xiaofan2 创建的主题 Java 大数据量下的精确统计解决方案
2T? 硬盘读取速度在 100MB/s ~ 300MB/s 这个量级,扫一遍不到 1 分钟?实在不行原始数据弄成某种自有格式,然后写个程序扫一遍?
2021-05-08 14:39:13 +08:00
回复了 CSGO 创建的主题 问与答 Photoshop 色调色温使用问题
还有,一般而言,只调节这几个参数是不行的。因为这几个是全局参数,而照片因为光照条件不同,在不同颜色分量上的调节方向是不一样的。
2021-05-08 14:38:07 +08:00
回复了 CSGO 创建的主题 问与答 Photoshop 色调色温使用问题
呃,好的色卡厂商不应该有自己的自动校准软件吗
2021-05-07 11:01:04 +08:00
回复了 abersheeran 创建的主题 Python 吐槽一下 Python 版本的割裂
最后,真要是没有会死的功能,我见过很多 backports 。比如 py 3.6 的 dataclass 当年就有 backport 到 3.x 的版本:

https://pypi.org/project/dataclasses/

而遇到 async 这种超级语法增强,那你除了升版本还有啥办法?
2021-05-07 10:59:35 +08:00
回复了 abersheeran 创建的主题 Python 吐槽一下 Python 版本的割裂
…… 说这些不是说我古板,而是在我的印象里,我上面提到的这些大型库都是以 3.6/3.7 为基准的。这才是社区潮流,比最新版 Python 落后一些身位吧。。。
2021-05-07 10:58:25 +08:00
回复了 abersheeran 创建的主题 Python 吐槽一下 Python 版本的割裂
…… 然后我写很多代码都是以某个比较稳定的版本作为基准的,比如我现在习惯定在 Python 3.6/3.7 。不强求支持 3.6,但是单元测试保证 3.7 ~ 3.8 。3.9 我都还没测过呢。

主要是 3.6+ 就有 f-string,type annotation,async 了,后面很多功能都没有那么大提升。
2021-05-07 10:57:02 +08:00
回复了 abersheeran 创建的主题 Python 吐槽一下 Python 版本的割裂
@abersheeran ummm 我觉得你这个不少第三方库的作者。。。 真的能代表一种趋势吗?

Python 社区并不是散兵游勇啊,至少 Python 库的集中度比 JS 社区好很多吧?真的大量使用的库也就屈指可数:NumPy, Pandas, Matplotlib; Scikit-Learn, TensorFlow, PyTorch; Flask, FastAPI, SQLAlchemy; Click

诸如此类的。比起 JS 动不动 import 一个库,我写 Python 小功能一般自己造轮子。
2021-05-07 01:00:07 +08:00
回复了 abersheeran 创建的主题 Python 吐槽一下 Python 版本的割裂
这倒也不是行不行,而是你的需求和大部分 python 程序员的需求实在太不一样了。。。

大部分程序员要么想办法升级 python 到 3.9 (反正 forward compatibility 很好,3.6 -> 3.9 代码大概不用改一行),要么用 3.6 语法。你这需求。。。。实在没有人需要,所以要么自己造轮子,要么别头上长角。
2021-05-07 00:39:16 +08:00
回复了 mayuko2012 创建的主题 Apple 目前 32G 内存的 intel 和 16G 内存的 M1 应该选哪个?
小孩子才作选择,大人我全都要。

联想 YOGA + M1 macbook
2021-05-06 17:30:40 +08:00
回复了 ShotaconXD 创建的主题 问与答 最近又开始有点焦虑, 想问问你们都怎么找的对象呀?
按我的理解,没找对象所以焦虑的,大概率上面提到的这些只会更焦虑。找对象焦虑的源泉本身就是这些基础条件差,担心以后找不到老婆。

所以我觉得你应该好好想想这些了。
1 ... 68  69  70  71  72  73  74  75  76  77 ... 200  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   926 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 34ms · UTC 21:23 · PVG 05:23 · LAX 13:23 · JFK 16:23
Developed with CodeLauncher
♥ Do have faith in what you're doing.