由于在编译程序时会吃满系统上所有的 cpu ,导致其他进程响应迟钝且执行缓慢,我想专门用一个用户来执行编译程序的任务,这个用户执行的进程可以在其他用户没有执行比较耗费 cpu 的进程时吃满所有的 cpu ,但只要有其它的用户需要 cpu ,这个用户所执行的进程就必须立即给其他用户让步。
简单来说,我就是想让编译任务可以在系统空闲时吃满所有的 cpu ,在系统上有其他进程需要 cpu 时就立即给其它进程让步,在尽可能不影响到其他进程的执行的前提下让编译进程更快的执行。
Linux 系统上是否有什么方式可以做到这一点?我试过调整编译进程的 nice 值,但感觉效果几乎没有。
1
codehz 2022-10-07 13:17:11 +08:00
听起来适合用 SCHED_IDLE
|
4
microxiaoxiao 2022-10-07 14:52:17 +08:00 via Android
cggroup 试试,现在 linux 轻量级虚拟化不都是用的它么
|
5
qemu32 OP @codehz 不行哦,没有任何效果,我的测试方法是启动如下两个任务:
sysbench --time=60 --threads=12 cpu run stress --cpu 12 --timeout 60 我的 cpu 是 12 个核心,这两个任务单独运行都会吃满 12 个核心,我使用 chrt 设置 sysbench 进程的调度类型,没有任何效果,sysbench 进程仍然会占用整个系统 50%的 cpu 。 |
6
codehz 2022-10-07 15:15:31 +08:00
chrt 只影响一个线程,你得给每个线程都设置一遍
|
7
qemu32 OP @codehz 还是不行哦
for spid in $(ps -T -p $(pgrep sysbench) | grep -v SPID | cut -d" " -f 2); do sudo chrt -i -p 0 $spid; done 我这样子就是将 sysbench 的每个线程都设置了,没有任何效果 |
8
codehz 2022-10-07 15:32:46 +08:00
要不试试 realtime 内核,然后把其他任务都设置成实时?
|
9
codehz 2022-10-07 15:40:58 +08:00
(搜索了一圈,还有一个方案是内核补丁加上 MuQSS 调度器,然后使用 SCHED_IDLEPRIO 调度类型,部分发行版提供了相关工具,叫做 schedtool (只有在启用特定内核(例如-ck 内核)之后才有可能设定的非标准类型
|
10
qemu32 OP @codehz #8 x86 架构不支持 PREEMPT_RT 配置
x86 架构只能选择 PREEMPT_NONE "No Forced Preemption (Server)" PREEMPT_VOLUNTARY "Voluntary Kernel Preemption (Desktop)" PREEMPT "Preemptible Kernel (Low-Latency Desktop)" 我刚才试了 PREEMPT 也是不行的 |
11
qemu32 OP 有哪个发行版的内核是打上了 MuQSS 补丁的吗?
或者哪里能下载已经编译好的打上了 MuQSS 补丁的内核的 rpm 或 deb 包? |
12
qemu32 OP @codehz 有哪个发行版的内核是打上了 MuQSS 补丁的吗?
或者哪里能下载已经编译好的打上了 MuQSS 补丁的内核的 rpm 或 deb 包? |
13
dorothyREN 2022-10-07 17:01:04 +08:00
这么费劲 还不如装个虚拟机设置 6 个 core 。
|
14
qemu32 OP |
15
ArchieMeng 2022-10-07 17:17:26 +08:00 via Android
从这个文章上看,nice 应该会起作用的。https://scoutapm.com/blog/restricting-process-cpu-usage-using-nice-cpulimit-and-cgroups
关于响应慢的问题,还有可能是 IO 瓶颈的问题,你也许需要设置 ionice 类别为 IDLE 。毕竟编译也是高并发 IO 的场景。 |
16
des 2022-10-07 17:37:05 +08:00 via iPhone
@qemu32 #15 楼上也能解决你说的问题啊,毕竟你也没说要研究内核调度。我也觉得虚拟机是最好的解决办法了,或者你试试用 docker/systemd 限制资源使用
|
17
qemu32 OP @ArchieMeng 我觉得跟 io 没关系。
你能在你的机器上试一下我 #5 楼回复里的那个测试用例,给 sysbench 设置了 nice 之后的效果吗?我试了没有任何效果 nice -n 19 sysbench --time=60 --threads=12 cpu run 和 sysbench --time=60 --threads=12 cpu run 感觉没有任何区别 |
19
qemu32 OP @ArchieMeng @des 我刚才用自己编译的内核试了一下设置 nice 是管用的,但 fedora 36 的内核设置 nice 没有任何效果,虚拟机和物理机都没效果。
|
22
ArchieMeng 2022-10-07 19:06:00 +08:00 via Android 1
@des 如果说是限制单个进程和其子进程的 Core 使用数量,没有必要用虚拟机,可以用 systemd-run --user --scope -p CPUQuota=xxx 来实现。但这个是限制整体 CPU 使用率的。个人建议是用 taskset 直接绑定到固定的几个核心上,这样不会有太频繁的 Context Switch ,性能会好些。
|
23
weiasd 2022-10-07 20:40:10 +08:00
cgroup 行不行
|
24
qemu32 OP @ArchieMeng 我发现只要内核配置了 CONFIG_SCHED_AUTOGROUP nice 就不起作用了
|
26
systemcall 2022-10-07 21:09:21 +08:00
我觉得你研究这些,还不如用虚拟机,遇到要共享的文件夹就共享过去
虚拟机可以完美实现你的需求。现在的 KVM 的效率是很高的,你又用不到 GPU |
27
qemu32 OP 将 nice 和 taskset 结合起来用可以满足我的需求,比如我的机器有 12 个核心,我指定用 11 个核心运行编译任务,并且把优先级设置到最低,类似这样:
nice -n 19 taskset --cpu-list 0-10:1 make -j11 |
28
wangyzj 2022-10-08 09:28:46 +08:00
虚拟化方案
类似 docker 的 cgroup 或者 vm 的 kvm 之类的,或者装个 vmware |
29
endle 2022-10-08 22:34:45 +08:00 1
@systemcall LZ 的需求不过是编译的时候控制一下 cpu 占用,没必要引入虚拟机吧
@qemu32 我之前看到过一篇博客,提到在现代多核系统里,设置 nice 值可能没有用。你要不要看一看 cgroups ? https://blog.lilydjwg.me/2020/5/11/priority-and-nice-value-in-linux.215304.html |
30
ruidoBlanco 2022-10-10 16:17:35 +08:00
/etc/security/limits.conf 加一行,然后 dummyuser 默认 nice 就是 19 了。
dummyuser soft priority 19 |