在Tair中使用Lua指令碼的基本文法與使用規範 -

雲原生記憶體資料庫Tair執行個體支援Lua相關命令，通過Lua指令碼可高效地處理CAS（compare-and-set）命令，進一步提升Tair的效能，同時可以輕鬆實現以前較難實現或者不能高效實現的模式。本文介紹在Tair中使用Lua指令碼的基本文法與使用規範。

注意事項

Data Management控制台目前暫不支援使用Lua指令碼等相關命令，請通過用戶端或Redis-cli串連Tair執行個體使用Lua指令碼。

基本文法

命令	文法	說明
EVAL	`EVAL script numkeys [key [key ...]] [arg [arg ...]]`	執行給定的指令碼和參數，並返回結果。參數說明： script：Lua指令碼。 numkeys：指定KEYS[]參數的數量，非負整數。 KEYS[]：傳入的Redis鍵參數。 ARGV[]：傳入的指令碼參數。KEYS[]與ARGV[]的索引均從1開始。說明與SCRIPT LOAD命令一樣，EVAL命令也會將Lua指令碼緩衝至Tair。混用或濫用KEYS[]與ARGV[]可能會導致Tair產生不符合預期的行為，尤其在叢集模式下，詳情請參見。推薦使用KEYS[]與ARGV[]的方式傳遞參數。不推薦將參數編碼進指令碼中，過多類似行為會導致LUA虛擬機器記憶體使用量量上升，且無法及時回收，極端情況下會導致執行個體主庫與備庫記憶體溢出（Out of Memory），造成資料丟失。
EVALSHA	`EVALSHA sha1 numkeys key [key ...] arg [arg ...]`	給定指令碼的SHA1校正和，Tair將再次執行指令碼。使用EVALSHA命令時，若sha1值對應的指令碼未緩衝至Tair中，Tair會返回NOSCRIPT錯誤，請通過EVAL或SCRIPT LOAD命令將目標指令碼緩衝至Redis中後進行重試，詳情請參見。
SCRIPT LOAD	`SCRIPT LOAD script`	將給定的script指令碼緩衝在Tair中，並返回該指令碼的SHA1校正和。
SCRIPT EXISTS	`SCRIPT EXISTS script [script ...]`	給定一個（或多個）指令碼的SHA1，返回每個SHA1對應的指令碼是否已緩衝在當前Tair服務。指令碼已存在則返回1，不存在則返回0。
SCRIPT KILL	`SCRIPT KILL`	停止正在啟動並執行Lua指令碼。
SCRIPT FLUSH	`SCRIPT FLUSH`	清空當前Tair伺服器中的所有Lua指令碼緩衝。

更多關於Redis命令的介紹，請參見Redis Commands。

以下為部分命令的樣本，本文在執行以下命令前執行了SET foo value_test。

EVAL命令樣本：

EVAL "return redis.call('GET', KEYS[1])" 1 foo

返回樣本：

"value_test"

SCRIPT LOAD命令樣本：

SCRIPT LOAD "return redis.call('GET', KEYS[1])"

返回樣本：

"620cd258c2c9c88c9d10db67812ccf663d96bdc6"

EVALSHA命令樣本：

EVALSHA 620cd258c2c9c88c9d10db67812ccf663d96bdc6 1 foo

返回樣本：

"value_test"

SCRIPT EXISTS命令樣本：

SCRIPT EXISTS 620cd258c2c9c88c9d10db67812ccf663d96bdc6 ffffffffffffffffffffffffffffffffffffffff

返回樣本：

1) (integer) 1
2) (integer) 0

SCRIPT FLUSH命令樣本：
警告
該命令會清空執行個體中的所有Lua指令碼緩衝，請提前備份Lua指令碼。
```
SCRIPT FLUSH
```
返回樣本：
```
OK
```

最佳化記憶體、網路開銷

現象：

在Tair中緩衝了大量功能重複的指令碼，佔用大量記憶體空間甚至引發記憶體溢出（Out of Memory），錯誤樣本如下。

EVAL "return redis.call('set', 'k1', 'v1')" 0
EVAL "return redis.call('set', 'k2', 'v2')" 0

解決方案：

請避免將參數作為常量寫在Lua指令碼中，以減少記憶體空間的浪費。

# 與錯誤樣本實現相同功能但僅需緩衝一次指令碼。
EVAL "return redis.call('set', KEYS[1], ARGV[1])" 1 k1 v1
EVAL "return redis.call('set', KEYS[1], ARGV[1])" 1 k2 v2

更加建議採用如下寫法，在減少記憶體的同時，降低網路開銷。

SCRIPT LOAD "return redis.call('set', KEYS[1], ARGV[1])"    # 執行後，Redis將返回"55b22c0d0cedf3866879ce7c854970626dcef0c3"
EVALSHA 55b22c0d0cedf3866879ce7c854970626dcef0c3 1 k1 v1
EVALSHA 55b22c0d0cedf3866879ce7c854970626dcef0c3 1 k2 v2

清理Lua指令碼的記憶體佔用

現象：

由於Lua指令碼緩衝將計入Tair的記憶體使用量量中，並會導致used_memory升高，當Tair的記憶體使用量量接近甚至超過maxmemory時，可能引發記憶體溢出（Out Of Memory），報錯樣本如下。

-OOM command not allowed when used memory > 'maxmemory'.

解決方案：

通過用戶端執行SCRIPT FLUSH命令清除Lua指令碼緩衝，但與FLUSHALL不同，SCRIPT FLUSH命令為同步操作。若Tair緩衝的Lua指令碼過多，SCRIPT FLUSH命令會阻塞Tair較長時間，可能導致執行個體不可用，請謹慎處理，建議在業務低峰期執行該操作。

說明

在控制台上單擊清除數據只能清除資料，無法清除Lua指令碼緩衝。

同時，請避免編寫過大的Lua指令碼，防止佔用過多的記憶體；避免在Lua指令碼中大批量寫入資料，否則會導致記憶體使用量急劇升高，甚至造成執行個體OOM。在業務允許的情況下，建議開啟資料逐出（Tair預設開啟，模式為volatile-lru）節省記憶體空間。但無論是否開啟資料逐出，Tair均不會逐出Lua指令碼緩衝。

處理NOSCRIPT錯誤

現象：

使用EVALSHA命令時，若sha1值對應的指令碼未緩衝至Tair中，Tair會返回NOSCRIPT錯誤，報錯樣本如下。

(error) NOSCRIPT No matching script. Please use EVAL.

解決方案：

請通過EVAL命令或SCRIPT LOAD命令將目標指令碼緩衝至Tair中後進行重試。但由於Tair不保證Lua指令碼的持久化、複製能力，Tair在部分情境下仍會清除Lua指令碼緩衝（例如執行個體遷移、變更配置等），這要求您的用戶端需具備處理該錯誤的能力，詳情請參見。

以下為一種處理NOSCRIPT錯誤的Python Demo樣本，該demo利用Lua指令碼實現了字串prepend操作。

說明

您可以考慮通過Python的redis-py解決該類錯誤，redis-py提供了封裝Redis Lua的一些底層邏輯判斷（例如NOSCRIPT錯誤的catch）的Script類。

import redis
import hashlib

# strin是一個Lua指令碼的字串，函數以字串的格式返回strin的sha1值。
def calcSha1(strin):
    sha1_obj = hashlib.sha1()
    sha1_obj.update(strin.encode('utf-8'))
    sha1_val = sha1_obj.hexdigest()
    return sha1_val

class MyRedis(redis.Redis):

    def __init__(self, host="localhost", port=6379, password=None, decode_responses=False):
        redis.Redis.__init__(self, host=host, port=port, password=password, decode_responses=decode_responses)

    def prepend_inLua(self, key, value):
        script_content = """\
        local suffix = redis.call("get", KEYS[1])
        local prefix = ARGV[1]
        local new_value = prefix..suffix
        return redis.call("set", KEYS[1], new_value)
        """
        script_sha1 = calcSha1(script_content)
        if self.script_exists(script_sha1)[0] == True:      # 檢查Tair是否已緩衝該指令碼。
            return self.evalsha(script_sha1, 1, key, value) # 如果已緩衝，則用EVALSHA執行指令碼
        else:
            return self.eval(script_content, 1, key, value) # 否則用EVAL執行指令碼，注意EVAL有將指令碼緩衝到Tair的作用。這裡也可以考慮採用SCRIPT LOAD與EVALSHA的方式。

r = MyRedis(host="r-******.redis.rds.aliyuncs.com", password="***:***", port=6379, decode_responses=True)

print(r.prepend_inLua("k", "v"))
print(r.get("k"))

處理Lua指令碼逾時

現象：
由於Lua指令碼在Tair中是原子執行的，Lua慢請求可能會導致Tair阻塞。單個Lua指令碼阻塞Tair最多5秒，5秒後Tair會給所有其他命令返回如下BUSY error報錯，直到指令碼執行結束。
```
BUSY Redis is busy running a script. You can only call SCRIPT KILL or SHUTDOWN NOSAVE.
```
解決方案：
您可以通過SCRIPT KILL命令終止Lua指令碼或等待Lua指令碼執行結束。
說明
- SCRIPT KILL命令在執行慢Lua指令碼的前5秒不會生效（Tair阻塞中）。
- 建議您編寫Lua指令碼時預估指令碼的執行時間，同時檢查死迴圈等問題，避免過長時間阻塞Tair導致服務不可用，必要時請拆分Lua指令碼。

現象：

若當前Lua指令碼已執行寫命令，則SCRIPT KILL命令將無法生效，報錯樣本如下。

(error) UNKILLABLE Sorry the script already executed write commands against the dataset. You can either wait the script termination or kill the server in a hard way using the SHUTDOWN NOSAVE command.

解決方案：

請在控制台的執行個體列表中單擊對應執行個體重啟。

指令碼緩衝、持久化與複製

現象：

在不重啟、不調用SCRIPT FLUSH命令的情況下，Tair會一直緩衝執行過的Lua指令碼。但在部分情況下（例如執行個體遷移、變更配置、版本升級、切換等等），Tair無法保證Lua指令碼的持久化，也無法保證Lua指令碼能夠被同步至其他節點。

解決方案：

由於Tair不保證Lua指令碼的持久化、複製能力，請您在本機存放區所有Lua指令碼，在必要時通過EVAL或SCRIPT LOAD命令將Lua指令碼重新緩衝至Tair中，避免執行個體重啟、HA切換等操作時Tair中Lua指令碼被清空而帶來的NOSCRIPT錯誤。

叢集中Lua指令碼的限制

Redis Cluster對使用Lua指令碼增加了一些限制，在此基礎上，Tair叢集版對使用Lua指令碼存在如下額外限制：

小版本限制，若無法執行EVAL的相關命令，並報錯ERR command eval not support for normal user時，請升級小版本後重試，具體操作請參見升級小版本。
所有Key必須在一個slot上，否則報錯-ERR eval/evalsha command keys must be in same slot\r\n。
您可以通過CLUSTER KEYSLOT命令擷取目標Key的雜湊槽（Hash Slot）進行確認。
對單個節點執行SCRIPT LOAD命令時，不保證將該Lua指令碼存入至其他節點中。
不支援發布訂閱命令，包括PSUBSCRIBE、PUBSUB、PUBLISH、PUNSUBSCRIBE、SUBSCRIBE和UNSUBSCRIBE。
不支援UNPACK函數。

說明

若您能夠在代碼中確保所有操作都在相同slot（如果不能保障這一點，執行會出錯），且希望打破Tair叢集的Lua限制，可以在控制台將script_check_enable修改為0，則後端不會對指令碼進行校正，但仍需要使用KEYS數組至少傳遞一個key，供代理節點執行路由轉寄。具體操作，請參見設定執行個體參數。

代理模式（Proxy）對Lua的額外檢測項

您也可以通過script_check_enable參數關閉以下檢查項（不推薦）。

所有key都應該由KEYS數組來傳遞，redis.call/pcall中調用的Tair命令，key的位置必須是KEYS array，且不能使用Lua變數替換KEYS，否則返回錯誤資訊：-ERR bad lua script for redis cluster, all the keys that the script uses should be passed using the KEYS array\r\n。

說明

僅Tair記憶體型（相容Redis 5.0），且小版本低於5.0.9的執行個體存在該限制。

正確與錯誤命令樣本如下：

# 本樣本的準備工作需執行如下命令。
SET foo foo_value
SET {foo}bar bar_value

# 正確樣本：
EVAL "return redis.call('mget', KEYS[1], KEYS[2])" 2 foo {foo}bar

# 錯誤樣本：
EVAL "return redis.call('mget', KEYS[1], '{foo}bar')" 1 foo                      # '{foo}bar'作為Key，應該使用KEYS數組進行傳遞。
EVAL "local i = 2 return redis.call('mget', KEYS[1], KEYS[i])" 2 foo {foo}bar    # 在代理模式（Proxy）不允許執行此指令碼，因為KEYS資料的索引是變數，但在直連模式中無此限制。
EVAL "return redis.call('mget', KEYS[1], ARGV[1])" 1 foo {foo}bar                # 不應該使用ARGV[1]資料元素作為Key。

redis.call/pcall中調用的Tair命令必須是字串常量，否則返回錯誤資訊：-ERR bad lua script for redis cluster, first parameter of redis.call/redis.pcall must be a single literal string。
正確與錯誤命令樣本如下：
```
# 正確樣本
eval "redis.call('GET', KEYS[1])" 1 foo

# 錯誤樣本
eval "local cmd = 'GET'; redis.call(cmd, KEYS[1])" 1 foo
```
調用必須要帶有Key，否則返回錯誤資訊：-ERR for redis cluster, eval/evalsha number of keys can't be negative or zero\r\n。
說明
僅Tair記憶體型（相容Redis 5.0），且小版本低於5.0.9的執行個體存在該限制。
正確與錯誤命令樣本如下：
```
# 正確樣本
EVAL "return redis.call('get', KEYS[1])" 1 fooeval

# 錯誤樣本
EVAL "return redis.call('get', 'foo')" 0
```
不支援Redis嵌套方式調用，否則直接返回錯誤資訊：-ERR bad lua script for redis cluster, nested redis.call/redis.pcall。
您可以使用局部變數的方式進行調用，正確與錯誤命令樣本如下：
```
# 正確樣本
EVAL "local value = redis.call('GET', KEYS[1]); redis.call('SET', KEYS[2], value)" 2 foo bar

# 錯誤樣本
EVAL "redis.call('SET', KEYS[1], redis.call('GET', KEYS[2]))" 2 foo bar
```
不支援在MULTI、EXEC事務中使用EVAL、EVALSHA、SCRIPT系列命令。
不支援在Lua中執行跨Tair節點的命令，例如KEYS、SCAN等。
為了保證Lua執行的原子性，Proxy會根據KEYS參數將Lua發送到一個Tair節點執行並擷取結果，從而導致該結果與全域結果不一致。

說明

若您需要使用代理模式下受限的部分功能，您可以嘗試開通使用Tair叢集版的直連模式。但是由於Tair叢集版在遷移、變更配置時都會通過proxy代理遷移資料，直連模式下不符合代理模式的Lua指令碼會遷移、變更配置失敗。

建議您在直連模式下使用Lua指令碼時應儘可能符合代理模式下的限制規範，避免後續Lua指令碼遷移、變更配置失敗。