做一个伸手党。 我写了一个程序检测日志文件变化,如果日志文件新增,我启动一个线程按行读取数据后将内容解析放入数据库,记录行号到.ini 配置文件里面(大约需要 5-10 秒)。由于写入日志程序有时 5 秒内写入多次,导致上个线程还没有执行完,就又启动了一个线程。。。。。。,每个进程执行完写入记录行号时候偶尔会冲突,导致 ini 配置文件最后变为空白 0kb 大小。我想让第一个线程启动之后,再启动的线程等待第一个线程结束后再执行。 我代码部分内容如下:
t2=threading.Thread(target=runReadLogFile,args=(1,))
t2.start()#程序启动后先执行一次读取日志文件。
当检测到日志文件修改后执行:
t1=threading.Thread(target=runReadLogFile,args=(1,))
t1.start()
1
kier 2017-01-24 17:17:29 +08:00
直接等线程结束再启动新线程,或者就保持一个线程,定时唤醒
|
2
czheo 2017-01-24 17:55:00 +08:00
you need a lock
|
3
qile1 OP @kier 你意思是不是 我在主线程里面定义 线程 1 ,日志文件被修改的时候我启动线程 1
t2=threading.Thread(target=runReadLogFile,args=(1,)) t2.start()#程序启动后先执行一次读取日志文件。 t1=threading.Thread(target=runReadLogFile,args=(1,))#预先设置线程一,等待启动 当检测到日志文件修改后执行: t1.start()#如果 t1 没执行完,再次调用会报错还是继续执行? |
4
ryd994 2017-01-24 22:37:31 +08:00 via Android
锁
|
5
mahone3297 2017-01-24 22:49:14 +08:00
弱弱问下大家:
* lz 的这种收集日志到 db 的思路,是否 ok ? * 为什么不用 logstash ? |
7
qile1 OP |
8
latyas 2017-01-25 00:57:22 +08:00
资源访问的临界区请用锁控制
|
9
latyas 2017-01-25 00:57:40 +08:00
或者单写多读,可以去掉锁
|
10
sheep3 2017-01-25 01:30:09 +08:00
锁,信号量,都行。但个人感觉不是很合理。不说你这个方案本身(也许这是你当前场景的最佳选择),就说如果这个线程必须等上个线程完成后再开始任务,为什么不就开一个线程,循环从队列里面取。
|
11
wjidea 2017-01-25 01:54:03 +08:00
multiprocessing.Manager()
manager.Lock() |
12
kier 2017-01-25 09:34:50 +08:00
@qile1 文件大了又怎么样? open 后, seek 到对应位置直接读固定长度的内容,不会有性能问题的!
另外,不管多少个线程,互斥操作同一个资源都是要顺序执行的,没法并行,所以根本提升不了速度 |
13
qile1 OP @kier 我读取日志文件是一次全部读取,计算行数。如果行数大于 ini 文件的记录值,就按行便利一遍,从记录行开始处理数据(这个操作时间长),日志单行长度不固定,如果从 seek 开始读取固定长度担心出现截取不全。想建立一个队列,里面只有一条,空就加入任务队列,满了就 try 一下捕获异常。
但是不知道 treading 如何取队列并执行 |
15
q397064399 2017-01-25 16:58:43 +08:00
加锁吧,没有其它办法
|
16
q397064399 2017-01-25 16:59:27 +08:00
还有一个简单的办法 申请线程池 然后只有一个线程
这样可以提交任务到阻塞队列 |
17
xntop 2017-01-25 21:40:05 +08:00
用信号量呗
|
18
qile1 OP 发现还是自己不会使用类。还在学习中。
现在用 queue (1)。 但是发现日志文件如果是第二天的时候没法从头读取。晚上在学习下 |
19
ryd994 2017-01-28 06:19:55 +08:00
这个需求为什么用线程?
多线程访问数据库又不会快 循环就行 “再启动的线程等待第一个线程结束后再执行”这样是不对的 考虑万一你运气不好,一连串的都慢了,就会有一堆在等,然后这个队就没有头了 加锁,但是不阻塞,拿不到锁就退出,等别人做。 |