rosedb是一个高性能、快速、内嵌的k-v数据库,支持多种数据结构,包含 String、List、Hash、Set、Sorted Set,接口名称风格和Redis类似,rosedb基于LSM Tree模型和WAL,纯Golang实现,易于使用、扩展。
软件特色
支持丰富的数据结构:字符串、列表、哈希表、集合、有序集合。
内嵌使用简单至极,无需任何安装部署(import "github.com/roseduan/rosedb")。
低延迟、高吞吐(具体请见英文 README 的 Benchmark)。
不同数据类型的操作可以完全并行。
支持客户端命令行操作。
支持过期时间。
软件介绍
一个 rosedb 实例,其实就是系统上的一个文件夹,在这个文件夹中,除了一些配置外,最主要的便是数据文件。一个实例中,只会存在一个活跃的数据文件进行写操作,如果这个文件的大小达到了设置的上限,那么这个文件会被关闭,然后创建一个新的活跃文件。
其余的文件,我称之为已归档文件,这些文件都是已经被关闭,不能在上面进行写操作,但是可以进行读操作。
所以整个数据库实例就是当前活跃文件、已归档文件、其他配置的一个集合:
在每一个文件中,写数据的操作只会追加到文件的末尾,这保证了写操作不会进行额外的磁盘寻址。写入的数据是以一个个被称为 Entry 的结构组织起来的,Entry 的主要数据结构如下:
因此一个数据文件可以看做是多个 Entry 的集合:
当写入数据时,如果是 String 类型,为了支持 string 类型的 key 前缀扫描和范围扫描,我将 key 存放到了跳表中,如果是其他类型的数据,则直接存放至对应的数据结构中。然后将 key、value 等信息,封装成 Entry 持久化到数据文件中。
如果是删除操作,那么也会被封装成一个 Entry,标记其是一个删除操作,然后持久化到数据文件中,这样的话就会带来一个问题,数据文件中可能会存在大量的冗余数据,造成不必要的磁盘空间浪费。为了解决这个问题,我写了一个 reclaim 方法,你可以将其理解为对数据文件进行重新整理,使其变得更加的紧凑。
reclaim 方法的执行流程也比较的简单,首先建立一个临时的文件夹,用于存放临时数据文件。然后遍历整个数据库实例中的所有已归档文件,依次遍历数据文件中的每个 Entry,将有效的 Entry 写到新的临时数据文件中,最后将临时文件拷贝为新的数据文件,原数据文件则删除。
这样便使得数据文件的内容更加紧凑,并且去除了无用的 Entry,避免占据额外的磁盘空间。
待办
这个项目其实还有很多可以完善的地方,比如下面列举到的一些,如果你对这个项目比较熟悉了,可以挑选一个自己感兴趣的 Todo List,自己去实现,然后提 Pr,成为这个项目的 Contributor,我相信这一定会对你有帮助的,赶快行动起来吧!
支持 TTL
String 类型 key 加入前缀扫描
写一个简单的客户端,支持命令行操作
数据库启动优化
reclaim 性能优化
支持事务,ACID 特性
文件数据压缩存储(snappy、zstd、zlib)
缓存淘汰策略(LRU、LFU、Random)
支持更多的命令操作(type,keys,mset,mget,zcount,etc...)
完善相关文档
- 本地下载(推荐): 本地下载