首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX
›
stephenpcg
›
全部回复第 1 页 / 共 1 页
回复总数
3
2018-01-25 12:48:30 +08:00
回复了
abcdxx
创建的主题
›
程序员
›
问个排序算法问题
@
h4lbhg1G
100 万约为 1M,1000 万即为 10M,每行 11 字节,即为 110MB。你前面说“等于 10 的 8 次方”,后面计算时变成了 "x10^9Bytes"。
2018-01-25 10:54:53 +08:00
回复了
abcdxx
创建的主题
›
程序员
›
问个排序算法问题
既然楼主都考虑过 awk 了,我觉得很可能是一次性的任务,1000 万行也不大,也就百来兆的文件,可以试试:
comm -1 -2 <(sort a) <(sort b)
时间主要消耗在 sort 上面,我本地随机生成了两个文件 a、b,每个文件 1000 万行,每行长度 10 个字符,本地测试总开销 12s。时间比 awk 少 2 个数量级以上。
2015-01-02 12:37:50 +08:00
回复了
efi
创建的主题
›
Linux
›
360 安全卫士 for Linux 使用结果
打包这一块,不仅滥用Essential,还滥用了“Priority: required”,这是Debian/Ubuntu在debootstrap过程中要自动安装的包。
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
4191 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms ·
UTC 05:31
·
PVG 13:31
·
LAX 21:31
·
JFK 00:31
Developed with
CodeLauncher
♥ Do have faith in what you're doing.