Redis:遠程字典服務-中文百科頻道

定義

redis是一個key-value存儲系統。和Memcached類似，它支持存儲的value類型相對更多，包括string(字符串)、list(鍊表)、set(集合)、zset(sorted set --有序集合)和hash（哈希類型）。這些數據類型都支持push/pop、add/remove及取交集并集和差集及更豐富的操作，而且這些操作都是原子性的。在此基礎上，redis支持各種不同方式的排序。與memcached一樣，為了保證效率，數據都是緩存在内存中。區别的是redis會周期性的把更新的數據寫入磁盤或者把修改操作寫入追加的記錄文件，并且在此基礎上實現了master-slave(主從)同步。

Redis 是一個高性能的key-value數據庫。 redis的出現，很大程度補償了memcached這類key/value存儲的不足，在部分場合可以對關系數據庫起到很好的補充作用。它提供了Java，C/C++，C#，PHP，JavaScript，Perl，Object-C，Python，Ruby，Erlang等客戶端，使用很方便。

Redis支持主從同步。數據可以從主服務器向任意數量的從服務器上同步，從服務器可以是關聯其他從服務器的主服務器。這使得Redis可執行單層樹複制。存盤可以有意無意的對數據進行寫操作。由于完全實現了發布/訂閱機制，使得從數據庫在任何地方同步樹時，可訂閱一個頻道并接收主服務器完整的消息發布記錄。同步對讀取操作的可擴展性和數據冗餘很有幫助。

redis的官網地址，非常好記，是redis.io。（域名後綴io屬于國家域名，是british Indian Ocean territory，即英屬印度洋領地），Vmware在資助着redis項目的開發和維護。

作者

redis的作者，叫Salvatore Sanfilippo，來自意大利的西西裡島，居住在卡塔尼亞。目前供職于Pivotal公司。他使用的網名是antirez。

性能

下面是官方的bench-mark數據：

測試完成了50個并發執行100000個請求。

設置和獲取的值是一個256字節字符串。

Linux box是運行Linux 2.6,這是X3320 Xeon 2.5 ghz。

文本執行使用loopback接口(127.0.0.1)。

結果:讀的速度是110000次/s,寫的速度是81000次/s 。

支持語言

ActionScript

C++

Clojure

Common Lisp

Dart

Erlang

Haskell

Haxe

Java

Node.js

Lua

Objective-C

Perl

PHP

Pure Data

Python

Ruby

Scala

Smalltalk

Tcl

常用命令

就DB來說，Redis成績已經很驚人了，且不說memcachedb和Tokyo Cabinet之流，就說原版的memcached，速度似乎也隻能達到這個級别。Redis根本是使用内存存儲，持久化的關鍵是這三條指令：SAVE BGSAVE LASTSAVE …

當接收到SAVE指令的時候，Redis就會dump數據到一個文件裡面。

值得一說的是它的獨家功能：存儲列表和集合，這是它與mc之流相比更有競争力的地方。

不介紹mc裡面已經有的内容，隻列出特殊的：

TYPE key — 用來獲取某key的類型

KEYS pattern — 匹配所有符合模式的key，比如KEYS * 就列出所有的key了，當然，複雜度O(n)

RANDOMKEY - 返回随機的一個key

RENAME oldkeynewkey— key也可以改名

列表操作，精華

RPUSH key string — 将某個值加入到一個key列表末尾

LPUSH key string — 将某個值加入到一個key列表頭部

LLEN key — 列表長度

LRANGE key start end — 返回列表中某個範圍的值，相當于mysql裡面的分頁查詢那樣

LTRIM key start end — 隻保留列表中某個範圍的值

LINDEX key index — 獲取列表中特定索引号的值，要注意是O(n)複雜度

LSET key index value — 設置列表中某個位置的值

LPOP key

RPOP key — 和上面的LPOP一樣，就是類似棧或隊列的那種取頭取尾指令，可以當成消息隊列來使用了

集合操作

SADD key member — 增加元素

SREM key member — 删除元素

SCARD key — 返回集合大小

SISMEMBER key member — 判斷某個值是否在集合中

SINTER key1 key2 ... keyN — 獲取多個集合的交集元素

SMEMBERS key — 列出集合的所有元素

還有Multiple DB的命令，可以更換db，數據可以隔離開，默認是存放在DB 0。

數據模型

Redis的外圍由一個鍵、值映射的字典構成。與其他非關系型數據庫主要不同在于：Redis中值的類型不僅限于字符串，還支持如下抽象數據類型：

字符串列表

無序不重複的字符串集合

有序不重複的字符串集合

鍵、值都為字符串的哈希表

值的類型決定了值本身支持的操作。Redis支持不同無序、有序的列表，無序、有序的集合間的交集、并集等高級服務器端原子操作。

數據結構

redis提供五種數據類型：string，hash，list，set及zset(sorted set)。

string（字符串）

string是最簡單的類型，你可以理解成與Memcached一模一樣的類型，一個key對應一個value，其上支持的操作與Memcached的操作類似。但它的功能更豐富。

redis采用結構sdshdr和sds封裝了字符串，字符串相關的操作實現在源文件sds.h/sds.c中。

list(雙向鍊表)

list是一個鍊表結構，主要功能是push、pop、獲取一個範圍的所有值等等。操作中key理解為鍊表的名字。

dict(hash表)

set是集合，和我們數學中的集合概念相似，對集合的操作有添加删除元素，有對多個集合求交并差等操作。操作中key理解為集合的名字。

dict中table為dictEntry指針的數組，數組中每個成員為hash值相同元素的單向鍊表。set是在dict的基礎上實現的，指定了key的比較函數為dictEncObjKeyCompare，若key相等則不再插入。

zset(排序set)

zset是set的一個升級版本，他在set的基礎上增加了一個順序屬性，這一屬性在添加修改元素的時候可以指定，每次指定後，zset會自動重新按新的值調整順序。可以理解了有兩列的mysql表，一列存value，一列存順序。操作中key理解為zset的名字。

zset利用dict維護key -> value的映射關系，用zsl(zskiplist)保存value的有序關系。zsl實際是叉數

不穩定的多叉樹，每條鍊上的元素從根節點到葉子節點保持升序排序。

存儲

redis使用了兩種文件格式：全量數據和增量請求。

全量數據格式是把内存中的數據寫入磁盤，便于下次讀取文件進行加載；

增量請求文件則是把内存中的數據序列化為操作請求，用于讀取文件進行replay得到數據，序列化的操作包括SET、RPUSH、SADD、ZADD。

redis的存儲分為内存存儲、磁盤存儲和log文件三部分，配置文件中有三個參數對其進行配置。

save seconds updates，save配置，指出在多長時間内，有多少次更新操作，就将數據同步到數據文件。這個可以多個條件配合，比如默認配置文件中的設置，就設置了三個條件。

appendonly yes/no ，appendonly配置，指出是否在每次更新操作後進行日志記錄，如果不開啟，可能會在斷電時導緻一段時間内的數據丢失。因為redis本身同步數據文件是按上面的save條件來同步的，所以有的數據會在一段時間内隻存在于内存中。

appendfsync no/always/everysec ，appendfsync配置，no表示等操作系統進行數據緩存同步到磁盤，always表示每次更新操作後手動調用fsync()将數據寫到磁盤，everysec表示每秒同步一次。

安裝

獲取源碼、解壓、進入源碼目錄

使用wget工具等下載：

wget （百度不讓用鍊接）

tar xzf redis-1.2.6.tar.gz

cd redis-1.2.6。

編譯生成可執行文件

由于makefile文件已經寫好，我們隻需要直接在源碼目錄執行make命令進行編譯即可：

make

make-test

sudo make install

make命令執行完成後，會在當前目錄下生成本個可執行文件，分别是redis-server、redis-cli、redis-benchmark、redis-stat，它們的作用如下：

redis-server：Redis服務器的daemon啟動程序

redis-cli：Redis命令行操作工具。當然，你也可以用telnet根據其純文本協議來操作

redis-benchmark：Redis性能測試工具，測試Redis在你的系統及你的配置下的讀寫性能

redis-stat：Redis狀态檢測工具，可以檢測Redis當前狀态參數及延遲狀況。

建立Redis目錄（非必須）

這個過程不是必須的，隻是為了将Redis相關的資源統一管理而進行的操作。

執行以下命令建立相關目錄并拷貝相關文件至目錄中：

sudo -s

mkdir -p /usr/local/redis/bin

mkdir -p /usr/local/redis/etc

mkdir -p /usr/local/redis/var

cp redis-server redis-cli redis-benchmark redis-stat /usr/local/redis/bin/

cp redis.conf /usr/local/redis/etc/

配置參數

在我們成功安裝Redis後，我們直接執行redis-server即可運行Redis，此時它是按照默認配置來運行的（默認配置甚至不是後台運行）。我們希望Redis按我們的要求運行，則我們需要修改配置文件，Redis的配置文件就是我們上面第二個cp操作的redis.conf文件，它被我們拷貝到了/usr/local/redis/etc/目錄下。修改它就可以配置我們的server了。如何修改？下面是redis.conf的主要配置參數的意義：

daemonize：是否以後台daemon方式運行

pidfile：pid文件位置

port：監聽的端口号

timeout：請求超時時間

loglevel：log信息級别

logfile：log文件位置

databases：開啟數據庫的數量

save * *：保存快照的頻率，第一個*表示多長時間，第二個*表示執行多少次寫操作。在一定時間内執行一定數量的寫操作時，自動保存快照。可設置多個條件。

rdbcompression：是否使用壓縮

dbfilename：數據快照文件名（隻是文件名，不包括目錄）

appendonly：是否開啟appendonlylog，開啟的話每次寫操作會記一條log，這會提高數據抗風險能力，但影響效率。

appendfsync：appendonlylog如何同步到磁盤（三個選項，分别是每次寫都強制調用fsync、每秒啟用一次fsync、不調用fsync等待系統自己同步）

Redis常用内存優化手段與參數

通過我們上面的一些實現上的分析可以看出redis實際上的内存管理成本非常高，即占用了過多的内存，作者對這點也非常清楚，所以提供了一系列的參數和手段來控制和節省内存，我們分别來讨論下。

首先最重要的一點是不要開啟Redis的VM選項，即虛拟内存功能，這個本來是作為Redis存儲超出物理内存數據的一種數據在内存與磁盤換入換出的一個持久化策略，但是其内存管理成本也非常的高，并且我們後續會分析此種持久化策略并不成熟，所以要關閉VM功能，請檢查你的redis.conf文件中 vm-enabled 為 no。

其次最好設置下redis.conf中的maxmemory選項，該選項是告訴Redis當使用了多少物理内存後就開始拒絕後續的寫入請求，該參數能很好的保護好你的Redis不會因為使用了過多的物理内存而導緻swap,最終嚴重影響性能甚至崩潰。

另外Redis為不同數據類型分别提供了一組參數來控制内存使用，我們在前面詳細分析過Redis Hash是value内部為一個HashMap，如果該Map的成員數比較少，則會采用類似一維線性的緊湊格式來存儲該Map, 即省去了大量指針的内存開銷，這個參數控制對應在redis.conf配置文件中下面2項：

hash-max-zipmap-entries 64

hash-max-zipmap-value 512

hash-max-zipmap-entries

含義是當value這個Map内部不超過多少個成員時會采用線性緊湊格式存儲，默認是64,即value内部有64個以下的成員就是使用線性緊湊存儲，超過該值自動轉成真正的HashMap。

hash-max-zipmap-value 含義是當 value這個Map内部的每個成員值長度不超過多少字節就會采用線性緊湊存儲來節省空間。

以上2個條件任意一個條件超過設置值都會轉換成真正的HashMap，也就不會再節省内存了，那麼這個值是不是設置的越大越好呢，答案當然是否定的，HashMap的優勢就是查找和操作的時間複雜度都是O(1)的，而放棄Hash采用一維存儲則是O(n)的時間複雜度，如果

成員數量很少，則影響不大，否則會嚴重影響性能，所以要權衡好這個值的設置，總體上還是最根本的時間成本和空間成本上的權衡。

同樣類似的參數

list-max-ziplist-entries 512

說明：list數據類型多少節點以下會采用去指針的緊湊存儲格式。

list-max-ziplist-value 64

說明：list數據類型節點值大小小于多少字節會采用緊湊存儲格式。

set-max-intset-entries 512

說明：set數據類型内部數據如果全部是數值型，且包含多少節點以下會采用緊湊格式存儲。

最後想說的是Redis内部實現沒有對内存分配方面做過多的優化，在一定程度上會存在内存碎片，不過大多數情況下這個不會成為Redis的性能瓶頸，不過如果在Redis内部存儲的大部分數據是數值型的話，Redis内部采用了一個shared integer的方式來省去分配内存的開銷，即在系統啟動時先分配一個從1~n 那麼多個數值對象放在一個池子中，如果存儲的數據恰好是這個數值範圍内的數據，則直接從池子裡取出該對象，并且通過引用計數的方式來共享，這樣在系統存儲了大量數值下，也能一定程度上節省内存并且提高性能，這個參數值n的設置需要修改源代碼中的一行宏定義REDIS_SHARED_INTEGERS，該值默認是10000，可以根據自己的需要進行修改，修改後重新編譯就可以了。

另外redis 的6種過期策略redis 中的默認的過期策略是volatile-lru 。設置方式

config set maxmemory-policy volatile-lru

maxmemory-policy 六種方式

volatile-lru：隻對設置了過期時間的key進行LRU（默認值）

allkeys-lru ：是從所有key裡删除不經常使用的key

volatile-random：随機删除即将過期key

allkeys-random：随機删除

volatile-ttl ：删除即将過期的

noeviction ：永不過期，返回錯誤

maxmemory-samples 3 是說每次進行淘汰的時候會随機抽取3個key 從裡面淘汰最不經常使用的（默認選項）