我这里说的是请求到达 nginx 的时间,而 nginx 的 log 里只能输出请求完成时的时间(或者说是输出日志那个时间点的时间
这个时间真的挺重要的,当请求量大服务器响应缓慢的时候,log 里输出的时间和请求实际到达服务器的时间根本不是一回事。想分析下具体流量怎么冲过来的都麻烦死,要先对 log 做预处理,用请求完成时间减去记录的请求时长,反过来计算出到达时间(而且这算出来到底靠不靠谱心理还没底)
分析生产环境的 nginx 日志到心态烦躁,抱怨下
1
ch2 2021-04-14 18:08:00 +08:00
api 网关了解一下
|
2
BeautifulSoap OP @ch2 又不是微服务
|
3
lcdtyph 2021-04-14 18:47:15 +08:00 via iPhone
nginx 还有个 request_time 吧,好像是处理请求的总时间,减一减看
|
4
BeautifulSoap OP |
5
eason1874 2021-04-14 19:23:45 +08:00
$request_time 不能确定业务响应时间。
把业务配置成 upstream,然后可以用这三个来确定业务时间: $upstream_connect_time $upstream_header_time $upstream_response_time |
6
Kasumi20 2021-04-14 19:40:40 +08:00
上游 web 服务不会自己记录吗?又差不了多少
|
7
catchexception 2021-04-14 19:42:37 +08:00 1
建议使用 openresty,写 lua 扩展
|
8
0ZXYDDu796nVCFxq 2021-04-14 19:59:25 +08:00 via Android
在路上只有手机没法验证
盲猜在 server 里加一个 set $start_time $time_iso8601; 可以增加一个变量记录请求开始时间 |
9
Citrus 2021-04-14 20:01:06 +08:00
log_by_lua 想怎么算怎么算,可以把你想要的时间全打出来。
|
10
BeautifulSoap OP @Kasumi20 所以这和 nginx 不能记录到达时间有任何关系吗?所有 nginc 都有上游?
顺便生产环境上游是 aws 的 load balancer,再上面是 cloudfront,这两服务查起 log 更麻烦。服务跑在 aws 的 ecs 集群里 |
11
ryd994 2021-04-14 20:49:49 +08:00 via Android 1
因为 logging 是 Nginx 处理请求里最后一个阶段
楼上说的 set 可以试试看。因为 set 是 echo module 实现的,在 rewrite phase 。 参考 https://gist.github.com/denji/9130d1c95e350c58bc50e4b3a9e29bf4 |
12
ihipop 2021-04-14 21:17:44 +08:00 via Android
@BeautifulSoap @BeautifulSoap API 网关又不是只能微服务。。。
|
13
BeautifulSoap OP |
14
datongkaze 2021-04-14 22:05:05 +08:00
可以说是很硬核了,学习了
|
15
wangritian 2021-04-15 09:33:42 +08:00
tcpdump 呗,抓几分钟的包拿到本机 wireshark 慢慢看
|
16
BeautifulSoap OP @wangritian 生产环境运行在 aws 的 ecs 上不可能让你去抓包
|