文件分布式存储问题？？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 2854 天前的主题，其中的信息可能已经有所发展或是发生改变。

筒子们好，
我搞了两台机器，nginx 做简单的负载，有个简单的文件上传下载功能。

问题来了

上传没问题，文件会大概平均上传到两台机器上；
下载有问题，由于 ng 做了 proxy，如果文件在机器 1 上，请求落到机器 2 上，就请求不到了。

解决方法：

1、上传、下载 ur 都指到同一台，ng 配下就好了
2、记录上传的机器 ip，请求时获取 ip 信息，指定请求 ip

请问：
方法 2 可行么，或者有没有其他方法？

机器

上传

请求

文件

17 条回复 • 2017-07-10 09:28:09 +08:00

liprais

2017-07-07 17:22:14 +08:00 via iPhone

搞个 nfs 不就行了

derek80

2017-07-07 17:24:31 +08:00 via Android

用类似 aws s3 服务

notgod

2017-07-07 17:30:45 +08:00 via iPhone

以前弄过
最简单的方案
下载尝试访问 1 的如果文件存在返回
不存在反向代理到 2。反之亦然
因为使用内网不存在带宽流量消耗

另外一个解决方案就是 sersync 做实时同步即可

一般 lb 结构后端提供 n 个 VIP 共同一个 san 存储
便于扩展这样才是最佳的主要将运算和存储分离

如果流量不大业务规模小没必要弄 lb
没瓶颈的

salmon5

2017-07-07 17:39:10 +08:00

一般瓶颈在带宽，不在 nginx，两种方法：
1，换成一台 nginx ；
2，两台 nginx 读写文件通过一个 nfs 盘实现。
最简单的两种方法，别造大轮子了。

ryd994

2017-07-07 21:28:18 +08:00

所以为啥你需要两台 nginx ？

D3EP

2017-07-07 21:32:30 +08:00 via Android

@ryd994 楼主用了一个 nginx 对两台机器做了负载均衡，他应该是这个意思。

t6attack

2017-07-07 21:46:10 +08:00

整个实现逻辑有问题

lightening

2017-07-07 21:52:47 +08:00

Load balancer 后面的系统一定要是 stateless 的。你的文件储存是 stateful 的，显然要单独拉出来集中处理。如果一台机器不够，就要上分布式储存，那就不是简单的 load balancing 问题了。一旦进入分布式系统的领域，就必须放弃 CAP （ consistency, availability, partition tolerance ）中的一个。如果你的文件储存压力不是那么大，建议这部分不要没事找事搞分布式。