有一个线程当中的函数做 funcA,funcA 需要花费很多时间,并且 funcA 会返回我们需要的数据 我该如何获得其中的数据? 网上一般是
q = queue.Queue(10)
def funcA():
# 花费很多时间做一些事得到一个数组叫做 res
for i in res:
q.put(i)
res=[]
while not empty(q.get()):
res.append(q.get())
class MyThread(Thread):
def __init__(self, target, args):
super(MyThread, self).__init__()
self.func = target
self.args = args
def run(self):
print("I have done")
self.result = self.func(*self.args)
def get_result(self):
while self.lock:
pass
return self.result
.............
.............
thread = MyThread(target=funca, args=(domain,))
thread.start()
res=thread.get_result()
我也想过方法,比如在 get_result 当中等待 run 方法执行完毕,但是这样就会导致线程阻塞的问题
所以问题是如何在需要花费很多时间的线程当中得到数据并且不会阻塞。 跪求大神!!!
自己用pyqt做了一个界面,大家都知道qt的主线程不能阻塞,一旦阻塞的话在不同的界面就会出现卡顿的问题
我在一个tab当中有一个需要消耗很长时间的funcA,我之前的办法是将funcA放到子线程。
但是后面需要funcA的返回数据,那么我想到了之前说的两种方法,一个是重写线程类,一个是queue让子线程和父线程进行通信。
但是实际的使用会发现,都会出现父线程等待子线程结束之后拿到数据的问题。不然的话,你接受queue的数据的时候就会是None!
这里再说一下提的问题
本质是一个子线程当中的函数funcA需要花费很久时间才能有结果。如何在不堵塞父线程的情况下从子线程当中获得返回子线程的结果
如下代码,我现在需要获得funcA和funcB两个函数的返回值
def funcA():
#spend much time
return resa
def funcB():
#spend much time
return res
如果我不使用线程的话那么执行funcA或者funcB都是只能执行一个,另外一个只有等
funcA()
funcB() #只有等待funA执行完之后才能执行funB ,堵塞
后面我使用了多线程进行处理
qa = queue.Queue(10)
def funcA():
# 花费很多时间做一些事得到一个数组叫做 res
for i in res:
qa.put(i)
def funcB():
# 花费很多时间做一些事得到一个数组叫做 res
for i in res:
qb.put(i)
resa=[]
threadA = Thread(target=funcA, args=(xx))
threadA.start()
threadB = Thread(target=funcB, args=(xx))
threadB.start()
while not empty(qa.get()): #实际执行的时候你会发现如果没有写join的话,这里的res会得到None,因为线程A并没有执行完成,但是如果写了join的话,那么实际上还是和之前没有使用多线程一样,做了funcA等待funcA执行完成之后才能做funcB
res.append(qa.get())
qb = queue.Queue(10)
resb=[]
while not empty(qb.get()):
res.append(qb.get())
写出上面这段代码就是我提出问题的节点。我发现如果想要得到其中线程的返回数据的时候还是会出现堵塞的情况?有没有什么写法能够得让funcA和funcB都能得到结果并且不会相互之间不会被堵塞呢?
1.使用线程池
这个方法在等待后面子线程数据返回的时候主线程是堵塞的,因为要调用get_result,就会一直堵塞。
但是这个方法给了我灵感十分感谢!
2.放弃多线程使用异步
仔细想了想,也是可以使用的,我们堵塞的本质是因为一直要监听子进程的返回,那么如果使用异步是可以的!
是否表明异步和多线程底层实现具有相关性呢
最后的解决方法
新建一个funC,在funC当中创建线程池funcA和funcB的线程,并在其中等待funcA和funcB的返回结果并且进行处理
然后在主线程当中创建funC的线程,这样不管funcA和funcB如何堵塞都不会让主线程堵塞了!
最后十分感谢大家的帮助,V2EX是一个有爱的地方,祝大家工资年年超级加倍!!
1
ClericPy 2020-05-01 00:34:56 +08:00
你该学的是 Future 的用法...
|
2
echome OP 啥意思大哥
|
3
marquina 2020-05-01 00:38:29 +08:00 via Android
自从接触了 concurrent.futures 后,就再也没有用过 thread 库了
|
4
lithbitren 2020-05-01 00:44:03 +08:00
没懂题目啥意思,不过 io 密集用协程更好,cpu 密集的用多进程更好,阻塞不管设在哪里,是否有回调,两者的 API 都比多线程丰富,多线程讲实话还是比较鸡肋的。
|
5
billwsy 2020-05-01 00:44:51 +08:00 via iPhone
所以“网上的方法”问题在哪里…主程序总是要等 funcA put 数据了之后才能 get 到数据
不会有什么神奇的办法让 funcA 在超长执行结束之前就产生出你想要的数据吧 |
6
wuwukai007 2020-05-01 00:56:26 +08:00
from concurrent.futures import ThreadPoolExecutor
pool = ThreadPoolExecutor() job = pool.submit(func) try: ---- func_result = job.result() except Exception as e: ----logger.exception(e) ---- raise e |
7
StephenKwen 2020-05-01 01:04:21 +08:00 via Android
线程之间使用条件锁,这样一个线程执行获得数据之后,可以通过条件锁唤醒另一个在等待的线程
|
8
echome OP @billwsy 的确是,但是如果要等待子线程执行完成得到其中的数据的话那么主线程就要一直等待。这样就形成了阻塞!
如果不等待的话就会得到 None 的返回值! |
9
Les1ie 2020-05-01 07:44:03 +08:00
(大概算是实现了楼主的接收返回数据的需求?
这里用 func 代表消耗时间的操作,main 函数的线程池里面调用 result()方法将主线程阻塞,等待所有子线程执行完毕再返回结果 https://i.loli.net/2020/05/01/mWN5jt2HpFfM6VL.png |
10
Les1ie 2020-05-01 07:47:19 +08:00
那么我的工资超级加倍去哪里领 :( 穷.jpg
|
11
crella 2020-05-01 07:51:28 +08:00 via Android
要么像楼上那样使用多进程;要么拆分 funcA,先处理必须在 get_result()之前要处理的数据,不怎么重要的数据在 get_result()之后开一个线程来完成
|
12
noparking188 2020-05-01 09:17:25 +08:00
也许可以讲一下你想实现什么,或者有比多线程更好的方式
之前看 redis 实现学到一个概念 - Reactor 模型,虽然没咋看懂,但是感觉题主的需求可以借鉴下这种思想 有点没明白你的表达,是必须拿到另一个线程产出的数据才能执行接下来的操作,这是串行?或者另一个线程产出数据之前,其它线程做自己的事,有数据了再工作 可能我理解能力差了点 |
13
Sanko 2020-05-01 10:17:56 +08:00 via Android
join?
|
15
sudoer 2020-05-01 12:09:00 +08:00
我点开了,工资加倍在哪领。。。(阿巴阿巴阿巴)
|
16
oahebky 2020-05-01 13:14:59 +08:00
你想让主(一个)线程(thr-A)取得子(另一个)线程(thr-B)的数据,又不想 thr-A 阻塞。
那么你的 thr-A 在除了“创建 thr-B,并让它工作得到结果” 之外还有其它事情做吗? 如果 thr-A 本来就有事情做,比如它有 func1, func2, func3, func4 的事情做, 另外还有一个得到 thr-B 的结果后的 func_I 事情做。 那么你本来只是需要 func1 -> func2 -> func3 -> func4 -> get thr-B result --True? --Y--> func_I 这么重复循环 LOOP 就可以了。 如果你想 thr-A 做其它事情,然后 thr-B 产生结果的时候,thr-A 马上就去处理 thr-B 的结果, 那么这就有中断的意思了。 主要要解决: func1, func2, ...; 即 thr-A 中的事情是否依赖 thr-B 的 result (或者说 func_I 的 result )? 是: 那么这本来就是会阻塞等待结果的程序,不论你怎么设计它都是会阻塞的。 比如你有 10 个 thr-B1,thr-B2, ... thr-B10; 那么即使 10s 之后每一秒 queue 中都有 result 存在; func1, func2, func3 ... 等依赖结果的任务,即使 10s 之后马不停蹄地执行(因为会不断地取得结果),但是它即使在忙碌,可是它本质上还是阻塞的。 否: 那你就大胆创建一个 thr-B: do jobs; 的同时;再创建一个 thr-C: handle result from thr-B 。 thr-C 在等待 queue 时阻塞是(可以视为完全)不影响程序性能的(非 `while (1) ;;`),即 CPU (中的单核)不会 100% 占用。 所以搞清楚了这些,还有没有必要纠结阻塞问题? |
17
superrichman 2020-05-01 14:18:07 +08:00 via iPhone
多线程换成异步 io
|
18
lewinlan 2020-05-02 00:29:17 +08:00 via Android
我记得 queue 的 get 应该会阻塞吧?不应该返回 None 啊。
如果真的不阻塞的话,那就无限循环 sleep 去等呗……这种情况用协程才是对的。 建议先学操作系统,理解一下线程,内存,上下文之类的东西。否则很难搞懂。 |
19
echome OP @lewinlan 在主线程当中对 queue 进行 get 之后保存到数组当中会得到 None,并不会堵塞。如果无限循环等待的话多线程的意义就丢失了。
|
20
Marinej 2020-05-07 15:33:44 +08:00
用 deque 线程安全的双端队列字 节码级别 线程安全
|
22
ps1aniuge 2020-05-08 16:08:18 +08:00
看得我脑仁疼,一个头 2 个大。
楼主是 cpu 密集型,还是 io 密集型啊? cpu 密集就用多进程,任你开 2 万个线程(池),也解决不了你的问题。因为多线程,只能用单核,对吧? io 密集就用 asyncio 啊。为啥么要折腾线程池? |