FastDfs-架构及原理
off999 2025-03-10 19:20 11 浏览 0 评论
1、架构图解析
客户端(client)
- 作为请求的发起方,也就是上传下载等请求的发起方。
跟踪服务器(tracker server)
- 主要任务是调度和负载均衡作用。
- 内存中存储了集群中所有storage server的group和状态信息
- 不记录文件的索引信息,主要存储一些元数据信息(完全由storage提供给),占用内存很少
- tracker根据storage的心跳信息建立group和storage服务列表的映射关系
- 因为元数据完全由storage提供,因此不需要持久化任何数据,所以tracker无状态,各个节点对等,非常容易扩展
存储服务器(storage server)
- 真正存储数据的服务器,文件和文件的元数据信息都保存在storage中,storage本身没有实现文件系统,而是直接使用操作系统调度管理文件
- storage以组(group)或卷(volume)划分集群,一个组可以由多个storage.这多个storage护卫备份,相当于数据是一样的。用于定制副本的数量
- 存储空间将会以group内容量最小的storage为准,也就是短板效应。因为互为备份,超过最小空间就没办法备份了
- 不同数据放在不同的组就能实现数据隔离,同时还可以通过nginx代理到不同的group
- group的容量收到单机存储的限制,如果group内有机器坏掉,只能依赖group内的其他计起恢复,恢复时间会很长。
- storage依赖本地系统,可以配置多个数据存储目录。有10块磁盘的话,都可以挂载为数据目录
- 为了避免同一个目录下文件过多,会创建两级子目录,默认每级256个,总过65535个文件夹。新上传的文件会通过hash方式路由到不同的子目录,然后将整个文件放在该目录。
2、设计思想
轻量级
- 1、tracker server不持久化数据,节点对等,不会成为性能瓶颈
- 2、不对文件分块,对应中小文件没有必要,不分块更加简单,高效
- 3、文件Id包含了组名,我呢见相对路径,文件名可以直接定位文件位置。所以不需要文件索引
- 4、代码量非常少,不到5.2万行
分组存储
- 1、集群由一个或多个组构成,集群容量为所有组的容量总和。
- 2、同组内堕胎Storage互为备份,上传,下载,删除等可以在任何一台上操作。
- 3、因为同组内的容量为容量最小的storage中。就是短板效应。容量不足可以横向增加组实现。
- 4、下载时直接通过apache、nginx等web server即可。
对等结构
- tracker server和storage server均不存在单点问题,节点都是对等的。
3、文件上传原理
文件上传流程分析
1、如何选择tracker和group?
因为tracker server是支持集群,并且节点之间是对等的。
所以客户端在上传文件时,可以随意选择一个tracker server。
而tracker server接收到文件上传时,会通过配置策略为该文件分配一个group.
根据tracker.conf配置文件配置策略
# the method for selecting group to upload files
# 0: round robin 轮询
# 1: specify group 指定group, 与下面的store_group联合使用
# 2: load balance, select the max free space group to upload file 负载均衡,选择一个空闲空间最大的group上传文件。默认策略
store_lookup = 2
# which group to upload file
# when store_lookup set to 1, must set store_group to the group name
# 如果store_lookup为1时,指定group的名称
store_group = group2
2、选择group后,如何选择storage server ?
我们知道,选择group后,因为组内可能存在多个storage server, 并且互为备份,所以我们需要根据策略选择一个执行上传操作。
选择的策略通过tracker.conf配置storaged的选择
# which storage server to upload file
# 0: round robin (default) 轮询,默认策略
# 1: the first server order by ip address 通过ip排序的第一个
# 2: the first server order by priority (the minimal) 通过优先级排序后的第一个(优先级在storage.conf中配置)
# Note: if use_trunk_file set to true, must set store_server to 1 or 2
store_server = 0
storage.conf中配置优先级
# the priority as a source server for uploading file.
# the lower this value, the higher its uploading priority.
# default value is 10 文件上传的优先级,默认值为10
upload_priority=10
3、选择了storage后,我们有可能有多块数据盘,数据存放在哪个盘呢?
因为fastdfs直接使用操作系统的文件管理,容量收到操作系统限制,可以通过多挂载几块磁盘来增大存储空间。数据会根据策略存储在不同的磁盘上。
在storage.conf中如何配置多块磁盘呢
# path(disk or mount point) count, default value is 1, 磁盘或者挂载点的数量
store_path_count=1
# store_path#, based 0, if store_path0 not exists, it's value is base_path
# the paths must be exist 多块磁盘配置多个存储路径,比如可以把store_path_count设置为2,将store_path1的注释打开,配置第二块磁盘的挂载目录
store_path0=/home/fastdfs
#store_path1=/home/yuqing/fastdfs2
4、数据有了存放的地方,会生成文件,文件名称有什么生成规则呢?
由storage的ip,文件创建时间,文件大小,文件crc32和一个随机数拼接而成,然后将该二进制串进行base64编码。组+目录+二级子目录+文件名.后缀 最终组成了文件的id。根据文件id可以直接定位文件,从而省去了一般文件存储需要存索引,通过索引定位文件内容。
4、文件下载原理
文件下载原理跟文件上传前面部分基本一样。只是选择哪个storage服务器下载文件的策略有些不一样。
在tracker.conf中专门为文件下载选择storage有一个配置项
# which storage server to download file
# 0: round robin (default) 轮询,默认策略
# 1: the source storage server which the current file uploaded to 选择该文件上传的那台服务器,也叫做源storage
download_server = 0
5、文件同步原理
因为同一个组内的storage是互为备份的,并且文件上传只会传到其中的一台。那么另外的服务器如何备份的呢?此时我们可能想到mysql的binlog日志。
- fastdfs也有自己的binlog日志,在每个storage写入后,会将文件的元数据写入binlog日志
- storage也会记录组内其他storage对该文件的同步进度,以便异常情况能够实现增量同步
- 进度通过时间戳记录,所以需要保证集群内的时钟同步
- 同步进度同样会上报tracker,tracker在选择storage时会以进度为参考
6、文件删除
文件删除和文件下载类似,只是下载是找到文件进行下载,删除是找到文件进行删除
相关推荐
- Python自动化脚本应用与示例(python自动化脚本教程)
-
Python是编写自动化脚本的绝佳选择,因其语法简洁、库丰富且跨平台兼容性强。以下是Python自动化脚本的常见应用场景及示例,帮助你快速上手:一、常见自动化场景文件与目录操作O批量重命名文件...
- 如何使用Python实现一个APP(如何用python做一个程序)
-
要使用Python实现一个APP,你可以选择使用一些流行的移动应用开发框架,如Kivy、PyQt或Tkinter。这里以Kivy为例,它是一个跨平台的Python框架,可以用于创建漂亮的图形用户界面(...
- 免费定时运行Python程序并存储输出文档的服务推荐
-
免费定时运行Python程序并存储输出文档的服务推荐以下是几种可以免费定时运行Python程序并存储输出结果的云服务方案:1.PythonAnywhere特点:提供免费的Python托管环境支持定时...
- 【Python程序开发系列】如何让python脚本一直在后台保持运行
-
这是我的第385篇原创文章。一、引言让Python脚本在后台持续运行,有几种常见的方式,具体方式可以根据你的系统环境和需求选择。二、Linux或macOS系统2.1使用nohup命令no...
- 运行和执行Python程序(运行python的程序)
-
一、Python是一种解释型的脚本编程语言,这样的编程语言一般支持两种代码运行方式:交互式编程在命令行窗口中直接输入代码,按下回车键就可以运行代码,并立即看到输出结果;执行完一行代码,你还可以继续...
- Python 初学者指南:计算程序的运行时长
-
在编写Python程序时,了解程序的运行时长是一项很有用的技能。这不仅能帮助你评估代码的效率,还能在优化程序性能时提供关键的数据支持。对于初学者来说,计算程序运行时长其实并不复杂,接下来就让我们看...
- pyest+appium实现APP自动化测试,思路全总结在这里
-
每天进步一点点,关注我们哦,每天分享测试技术文章本文章出自【码同学软件测试】码同学公众号:自动化软件测试码同学抖音号:小码哥聊软件测试01appium环境搭建安装nodejshttp://nodej...
- 血脉觉醒后,编程小白我是如何通过Deepseek和Trae轻松开发软件的
-
以下就是作为一个编程小白的我,是如何一步步开发软件的保姆级教程,请点赞收藏:第一步:打开#deepseek#(首先关闭深度思考和联网搜索)输入或复制你要让它做一个什么样软件的要求和提示词(你可以先用...
- 我用Deepseek+Trae写的python小软件,小白也能轻松用上模型啦!
-
利用AI大模型deepseek,搭配TraeCN,用半个小时做了一个本地Ollama安装部署和一键卸载的小工具,哈哈哈!感觉还不错#deepseek#一直想做一个本地Ollama安装部署和一键卸载...
- 在安卓设备上运行Python的方法(安卓能运行python吗)
-
技术背景在安卓设备上运行Python可以为开发者提供更多的开发选择和灵活性,能够利用Python丰富的库和简洁的语法来开发各种应用,如游戏、脚本工具等。然而,由于安卓系统原生不支持Python,需要借...
- 零基础小白,DeepSeek全自动编程,超详细提示词,一键生成软件!
-
我前面发表了文章,详细说了编程零基础小白,如何利用DeepSeek进行编程的全过程,感兴趣的可以去看看:DeepSeek全自动编程很多人不会写提示词,不知道怎么开始对话。话不多说,请先看下图中的对话,...
- 小白用DeepSeek+Python编写软件(用python制作软件)
-
周末无事,用DeepSeek生成全部代码,写了一个mp3音乐播放器,几分钟搞定,DeepSeek确实太强大了。我的提示语是这么写的:“请用Python语言写一个音乐播放器,支持常见音乐格式,我是Pyt...
- 零基础使用DeepSeek开发Windows应用程序,超简单超实用!
-
你敢相信,我居然用DeepSeek开发了一个能用的Windows软件!整个过程就像和学霸同桌组队做作业,我负责提需求,DeepSeek负责写代码改bug,全程碰到任何问题直接丢给DeepSeek即可。...
- 第二篇:如何安装Python并运行你的第一个程序
-
欢迎回到我的Python入门教程系列!在上一篇中,我们讨论了为什么Python是一门值得学习的编程语言。今天,我们将迈出第一步:安装Python并运行你的第一个程序。无论你是Windows、macOS...
- Python 运行,带你找入口,快速读懂程序
-
有C或Java编程开发经验的软件开发者,初次接触python程序,当你想快速读懂python项目工程时,是否觉得python程序有些太过随意,让你看有些无所适从,进而有些茫然。这是...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- Python自动化脚本应用与示例(python自动化脚本教程)
- 如何使用Python实现一个APP(如何用python做一个程序)
- 免费定时运行Python程序并存储输出文档的服务推荐
- 【Python程序开发系列】如何让python脚本一直在后台保持运行
- 运行和执行Python程序(运行python的程序)
- Python 初学者指南:计算程序的运行时长
- pyest+appium实现APP自动化测试,思路全总结在这里
- 血脉觉醒后,编程小白我是如何通过Deepseek和Trae轻松开发软件的
- 我用Deepseek+Trae写的python小软件,小白也能轻松用上模型啦!
- 在安卓设备上运行Python的方法(安卓能运行python吗)
- 标签列表
-
- python计时 (54)
- python安装路径 (54)
- python类型转换 (75)
- python进度条 (54)
- python的for循环 (56)
- python串口编程 (60)
- python写入txt (51)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python字典增加键值对 (53)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python qt (52)
- python人脸识别 (54)
- python斐波那契数列 (51)
- python多态 (60)
- python命令行参数 (53)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- centos7安装python (53)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)