多台负载均衡的服务器上传文件后如何确定文件在哪台静态服务器上
现在有两台后端服务器做负载均衡,上传文件时就可能会上传到任意一台服务器,这边上传完存储了一个静态地址,访问时就不知道访问哪台服务器的静态地址。目前想了三个方案都不太可行
1.上传时把服务器地址也记录下来,但如果后期服务器 IP 变更即失效
2.通过挂载的形式统一两台服务器的静态地址,但这个只适用 linux 服务器,如果是 windows 服务器则不支持
3.文件同步的方式,这种方式有同步失败的风险,最终也被 pass 掉。
请问有没有别的合理方式或解决方案?
看看 fastdfs ?
支持内网吗, 目前我们都是内网
感觉是不是需要一个分布式文件系统
有好的工具或解决方案吗 ?
oss
你需要一个分布式文件系统+1 ,win 可以挂载 nfs 或者 smb
minio 可破
目前只能是内网,如何能做到
#4 我想了下,简单的话 你直接 hash 文件名 决定进哪台服务器,取的时候再 hash 下判断文件再哪台服务器上,拼接下静态地址就行了吧?分布式的话上个 minio 就差不多了
回话类,文件类服务不适合使用负载均衡。你们为啥会把文件服务器放在负载均衡后面?即使要用也得用服务去唯一关联起来。直接买 oss 这种服务就可以
我们是专门弄个文件服务器,开个 ftp 、sftp 就行。
各种分布式文件系统自己部署一下就好了,fastdfs 完全可以。fastdfs 大致分成两部分Tracker ServerStorage ServerTracker server 跟踪服务器,负责文件访问的调度和负载均衡,负责管理所有的 Storage Server 和 group 组/卷,Storage Server存储服务器,负责文件存储,文件同步/备份,提供文件访问接口,文件元数据管理。以 group 为单位,每个 group 内可以有多台 Storage Server ,数据互为备份,达到容灾的目的。每个 Storage 在启动以后会主动连接 Tracker ,告知自己所属 group 等存储相关信息,并保持周期性心跳。
最好的方案肯定是分布式文件系统,oss 对象存储服务,用阿里腾讯都可以,或者自建 minio 也行。如果不想用分布式,就想用题中描述的,以下方案或许可破:返回静态地址前,给地址拼一个参数,表明上传的是节点 1 还是 2, 然后 nginx 利用地址中的这个参数做转发,导向正确的节点。
只能内网 而且最好不花钱 -.-
最简单的办法是用同步软件把文件同步一下完事。又不是不能用.jpg
OSS 不得花钱吗。。。 只能内网 而且最好不花钱 -.- 公司内网自己用
想稳定点。。怕同步软件不太行
多台机器之间做文件同步。 一般也不需要多台,两台互备就行了
自定义 404 错误处理:首先,为 404 错误配置一个自定义处理程序。这个处理程序会检查其他后端服务器,以查看它们是否有请求的文件。编写脚本进行检查:当触发自定义 404 错误处理时,该脚本会遍历所有其他的后端服务器以检查文件是否存在。你可以使用如 curl 或其他 HTTP 客户端来进行这个检查。重定向到正确的服务器:如果脚本发现文件存在于其他服务器上,它可以返回一个 302 重定向响应给客户端,指向正确的服务器和文件位置。以 Nginx 和一个简单的 Bash 脚本为例:在你的 Nginx 配置中,为 404 错误添加自定义处理:
正式方案还是需要分布式文件系统或对象存储服务。想一切从简的话有个野路子,直接尝试取从本地取,取不到就把 get 文件请求带上[本次请求为内部转发]参数转发到另一台服务器,再取不到就报错
现成方案就 minio ,楼上也说了。
简单点 NFS 或 SMB 就行了,可靠性强点的话就 Minio
19 楼 GPT ,给的方案贼蠢,还用图片发代码,忍不了了 :)
大佬,你好!你说的是 nginx 上面配置 ip_hash 么,这种不是只固定访问一台后端服务器了么,失去了负载均衡的意义。能具体说下这个方案么,不是很清楚
大佬,你说的不分布式的方案我这边也想过,记录当时上传的具体节点,但是如果服务器 Ip 变了就访问不了了
1 方案,用 DNS 服务器,上传的时候,记录服务器的域名,不要用 IP 。
这就搞笑了。就算改变负载策略,记录了上传的服务器又怎么样?当一个节点挂掉,上面的文件始终都是无法访问到的。既然基于负载的方案都能接受风险,同步文件怎么就不行了?
内网共享存储就行了在其中一台机器开一个 nfs 或 samba 共享,两台机器都加载这个共享,往里面写文件仅有 linux 就 nfs 共享,既有 windows 又有 linux 就用 samba当然,你搞个 minio 也行
首先,proxy_pass 是这么用的吗?这么个四不像的 cgi ,还用 GPT ?然后,你这样碰到不存在的文件不就死循环了吗? 路径 hash 配合 proxy pass 就好了hash 值可以对半分,分到 1 或者 2 上如果 1 服务器拿到 hash 1 的请求,那就本地处理,有就有,没有就是 404.如果拿到 hash 2 的请求,那就 proxy pass 给 2 ,2 说有就是有。缺点就是只有一半的请求可以本地处理。-----但是,按这个思路再进一步,说明你用的负载均衡错了。你用 4 层负载均衡当然就是随机分配。但是如果你用 7 层的负载均衡,比如 Nginx 或者 haproxy 之类的,本来就支持根据 URL hash 分流,也就不存在以上问题。
现在的问题是每个负载服务器都有各自的存文件的地方,那你把他们都存在一个地方不就可以了吗,每个服务器去连接这个存储地址。这就是分布式文件系统,多节点读写模式,楼上提到的传统方案 nfs 、smb 都支持,linux 上直接用包管理器安装就行,windows 开一下 feature 就有了,很简单
首先,minio 好像是免费的吧?
fastdfs ,简单好用
谢谢,那个账号已经被彻底 ban 。
变了也没关系,返回的资源地址里只追加节点编号,不放 ip 。编号和 ip 的对应关系,你在 nginx 里体现好就行,如果节点的 ip 变了,只要编号没变就行。不过折腾这干嘛,直接就用 minio 呗,随着业务发展,到后面很可能还是得上。
简单的 搞个 ftp
nfs 之类的同时挂载到不同服务器最简单。也可以用其他的 oss 之类的。
两边存放上传文件的服务器都挂载同一个 NFS 或类似的共享存储,就不用管他发到那台机器了
挂载一下不久可以了嘛
minio, 或挂载 NFS 之类的
最简单的 go-fastdfs 搞定 www.oschina.net/p/go-fastdfs
后端文件存储独立处理出来,提供多种方式网络共享,Linux 挂载 nfs ,Windows 挂载 smb
部署个 nas 把 用 nfs 的方案,我们目前也是大量再用文件服务,目前这个方案没出什么问题
其实,可以全部服务器查一遍的。。
原则上应该建个数据库记录的,无论是查询或是后期做容灾备份都必不可少
请注意:常规的自动负载均衡策略下,要求多个节点完全一样,包括后期上传的文件。「上传文件时就可能会上传到任意一台服务器」,这个行为本身就是一个 BUG 。方案上面已经给了:用其他同步措施,把多个节点的后期上传文件,做同步。这个虽然是最简单的,同时也是绝大多数情况下最合理的。当然如果你要更合理的话,那也有稍微复杂点的方案:首先,将上传和下载路径的前段部分(含绝对路径),都做成可配置的(而不是自动获取当前服务所在目录);然后,不管是哪个节点,上传文件都保存到一个位置,这个位置与后端服务节点不绑定,而是与宿主服务器的文件系统和 Nginx 绑定;最后,给 Nginx 配个映射,让上传文件能通过 Nginx 直接访问。
应当有一台高性能存储主机作为文件服务器用来专门存储文件,负载均衡只针对上传文件的接口,上传文件接口需要把文件传输到这台文件服务器上,下载文件的接口应当直接指向这台负责存储文件的服务器上
好像大家不知道 nginx 的try_file
可以实现,当然推荐还是用分布式文件系统。
上传还放在单独的服务器上,不应该搞个共享存储,或者对象存储吗?
负载均衡一般不是每个节点数据都一样吗? 不然负载均衡有啥意义呢?所以应该在上传的时候,同步复制到所有节点上吧
#27 说得对, 上传的文件和数据库其实是一个类型,不可能跟着集群多少来走的题主可能希望一套代码打天下了,增加新的服务,虚拟一个文件管理服务,都增加了他的研发成本,运维也复杂, 未来因为集群引发的新问题,他也没去想,见招拆招(最小成本)。-- nfs/smaba ,不靠谱:不方便后端的集群扩展,性能也是瓶颈,单点故障,nfs 也没法弄集群-- nginx 配套固定规则上传, 不靠谱: 扩展集群规则歇菜,后台服务器的单点故障问题-- minio , 靠谱: 其实就是要加个文件服务器,起步 1 台,如果遇到单点故障、上传性能的痛点,就弄 minio 集群
之前我们也是遇到了这个问题,尝试了文件自动同步,最后还是上了 OSS ,这里楼主可以使用 minio
如果你只有两台服务器而且业务看起来不怎么增长的话,最简单的方案就是做一个中间服务取的时候两台服务器都去访问一下。
用 docker 随便跑一个单节点 minio 试试就好了
就两台 都查一遍问题不大
内网不花钱简单啊,A 、B 两个服务器,在 A 上面启动一个 smb 服务,B 挂载这个 smb 服务, 配置 A 、B 都读写相同 smb 目录,主要不是高并发业务,自己业务用用也足够了。总计成本 :耗费运维 30 分钟时间。
看起来你们服务可用性要求很低,那直接下掉一台后端服务器不就行了。还能节省一半的服务器成本。
- 要么分布式存储2. 要么就是直接是带域名的地址,这样就不会有问题了
minio 非常好的选择,不然就自己手搓一个文件服务?
你都负载均衡了,文件还是分开存储的,那均衡有啥用。直接用文件服务器管理文件吧,应用服务器通过内网连接文件服务器
内网搭建一个文件管理系统吧,文件上传后再上传到这个文件系统,走内网的话也没有什么损耗的,你要是这种分开管理,记录在那个服务器倒是好说,但是不方便文件整合和管理啊
多台机器都挂同个 nas 就行了
推荐使用 minio 或者分布式文件系统,minio 会比较简单一点
最简单的方式:挂载一个共享盘
NFS mount
简单省事的话,用 nfs 挂载就行。及时做好备份。
nfs +1
你还记得“软件真的好难做”中的那个有意思的例子吗?那个例子告诉我们软件开发中假设可能会是致命的事。今天,我又在StackOverflow上看到一个关于时间的问题——为什么192…
很早前就想写一篇关于eBPF的文章,但是迟迟没有动手,这两天有点时间,所以就来写一篇,这文章主要还是简单的介绍eBPF 是用来干什么的,并通过几个示例来介绍是怎么玩的,这个技术…
2012年的时候写过一篇叫《程序算法与人生选择》的文章,我用算法来类比如何做选择,说白了就是怎么去计算,但是并没有讲程序员可以发展的方向有哪些。 所以,就算是有这些所谓的方法论…