redisson分布式锁原理剖析

相信使用过redis的，或者正在做分布式开发的童鞋都知道redisson组件，它的功能很多，但我们使用最频繁的应该还是它的分布式锁功能，少量的代码，却实现了加锁、锁续命(看门狗)、锁订阅、解锁、锁等待（自旋）等功能，我们来看看都是如何实现的。

加锁

//获取锁对象

RLock redissonLock = redisson.getLock(lockKey);

//加分布式锁

redissonLock.lock();

根据redissonLock.lock()方法跟踪到具体的private <T> RFuture<Long> tryAcquireAsync(long leaseTime, TimeUnit unit, final long threadId)方法，真正获取加锁的逻辑是在tryAcquireAsync该方法中调用的tryLockInnerAsync()方法，看看这个方法是怎么实现的？

<T> RFuture<T> tryLockInnerAsync(long leaseTime, TimeUnit unit, long threadId, RedisStrictCommand<T> command) {

    internalLockLeaseTime = unit.toMillis(leaseTime);

    return commandExecutor.evalWriteAsync(getName(), LongCodec.INSTANCE, command,

               // 判断是否存在分布式锁，getName()也就是KEYS[1]，也就是锁key名

              "if (redis.call('exists', KEYS[1]) == 0) then " +

               // 加锁，执行hset 锁key名 1

                  "redis.call('hset', KEYS[1], ARGV[2], 1); " +

               // 设置过期时间

                  "redis.call('pexpire', KEYS[1], ARGV[1]); " +

                  "return nil; " +

              "end; " +

               // 这个分支是redisson的重入锁逻辑，锁还在，锁计数+1，重新设置过期时长

              "if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +

                  "redis.call('hincrby', KEYS[1], ARGV[2], 1); " +

                  "redis.call('pexpire', KEYS[1], ARGV[1]); " +

                  "return nil; " +

              "end; " +

              // 返回锁的剩余过期时长

              "return redis.call('pttl', KEYS[1]);",

                Collections.<Object>singletonList(getName()), internalLockLeaseTime, getLockName(threadId));

}

发现底层是结合lua脚本实现了加锁逻辑。

为什么底层结合了Lua脚本？

Redis是在2.6推出了脚本功能，允许开发者使用Lua语言编写脚本传到redis执行。使用脚本的好处如下：

1、减少网络开销：本来5次网络请求的操作，可以用一个请求完成，原先5次请求的逻辑，可以一次性放到redis中执行，较少了网络往返时延。这点跟管道有点类似。

2、原子操作：Redis会将整个脚本作为一个整体执行，中间不会被其他命令插入。管道不是原子的，不过

redis的批量操作命令(类似mset)是原子的。

也就意味着虽然脚本中有多条redis指令，那即使有多条线程并发执行，在同一时刻也只有一个线程能够执行这段逻辑，等这段逻辑执行完，分布式锁也就获取到了，其它线程再进来就获取不到分布式锁了。

锁续命（自旋）

大家都听过锁续命，肯定也知道这里涉及到看门狗的概念。在调用tryLockInnerAsync()方法时，第一个参数是commandExecutor.getConnectionManager().getCfg().getLockWatchdogTimeout()也就是默认的看门狗过期时间是private long lockWatchdogTimeout = 30 * 1000毫秒。

private <T> RFuture<Long> tryAcquireAsync(long leaseTime, TimeUnit unit, final long threadId) {

    if (leaseTime != -1) {

        return tryLockInnerAsync(leaseTime, unit, threadId, RedisCommands.EVAL_LONG);

    }

    RFuture<Long> ttlRemainingFuture = tryLockInnerAsync(commandExecutor.getConnectionManager().getCfg().getLockWatchdogTimeout(), TimeUnit.MILLISECONDS, threadId, RedisCommands.EVAL_LONG);

    // 添加监听器，判断获取锁是否成功，成功的话，添加定时任务：定期更新锁过期时间

    ttlRemainingFuture.addListener(new FutureListener<Long>() {

        @Override

        public void operationComplete(Future<Long> future) throws Exception {

            if (!future.isSuccess()) {

                return;

            }

            // 根据tryLockInnerAsync方法，加锁成功，return nil 也就是null

            Long ttlRemaining = future.getNow();

            // lock acquired

            if (ttlRemaining == null) {

                // 添加定时任务：定期更新锁过期时间

                scheduleExpirationRenewal(threadId);

            }

        }

    });

    return ttlRemainingFuture;

}

当线程获取到锁后，会进入if (ttlRemaining == null)分支，调用定期更新锁过期时间scheduleExpirationRenewal方法，我们看看该方法实现：

private void scheduleExpirationRenewal(final long threadId) {

    if (expirationRenewalMap.containsKey(getEntryName())) {

        return;

    }

    Timeout task = commandExecutor.getConnectionManager().newTimeout(new TimerTask() {

        @Override

        public void run(Timeout timeout) throws Exception {

            RFuture<Boolean> future = commandExecutor.evalWriteAsync(getName(), LongCodec.INSTANCE, RedisCommands.EVAL_BOOLEAN,

                    // 检测KEYS[1]锁是否还在，在的话再次设置过期时间

                    "if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +

                        "redis.call('pexpire', KEYS[1], ARGV[1]); " +

                        "return 1; " +

                    "end; " +

                    "return 0;",

                      Collections.<Object>singletonList(getName()), internalLockLeaseTime, getLockName(threadId));

            future.addListener(new FutureListener<Boolean>() {

                @Override

                public void operationComplete(Future<Boolean> future) throws Exception {

                    expirationRenewalMap.remove(getEntryName());

                    if (!future.isSuccess()) {

                        log.error("Can't update lock " + getName() + " expiration", future.cause());

                        return;

                    }

                    // 通过上面lua脚本执行后会返回1，也就true，再次调用更新过期时间进行续期

                    if (future.getNow()) {

                        // reschedule itself

                        scheduleExpirationRenewal(threadId);

                    }

                }

            });

        }

        // 延迟 internalLockLeaseTime / 3再执行续命

    }, internalLockLeaseTime / 3, TimeUnit.MILLISECONDS);

    if (expirationRenewalMap.putIfAbsent(getEntryName(), task) != null) {

        task.cancel();

    }

}

发现scheduleExpirationRenewal方法只是用了Timeout作为任务，并没有使用java的Timer()之类的定时器，而是在Timeout任务run()方法中定义了RFuture对象，通过给RFuture对象设置listener，在listener中通过Lua脚本执行结果进行判断是否还需要进行续期。通过这样的方式来给分布式锁进行续期。

这种方式实现定时更新确实很巧妙，定期时间很灵活。

锁订阅及锁等待

锁订阅是针对那些没有获取到分布式锁的线程而言的。来看看整个获取锁的方法：

public void lockInterruptibly(long leaseTime, TimeUnit unit) throws InterruptedException {

        long threadId = Thread.currentThread().getId();

        Long ttl = tryAcquire(leaseTime, unit, threadId);

        // lock acquired,获取到锁，直接退出

        if (ttl == null) {

            return;

        }

		// 没有获取到锁，进行订阅

        RFuture<RedissonLockEntry> future = subscribe(threadId);

        commandExecutor.syncSubscription(future);

        try {

            while (true) {

                ttl = tryAcquire(leaseTime, unit, threadId);

                // lock acquired

                if (ttl == null) {

                    break;

                }

                // waiting for message

                if (ttl >= 0) {

                    getEntry(threadId).getLatch().tryAcquire(ttl, TimeUnit.MILLISECONDS);

                } else {

                    getEntry(threadId).getLatch().acquire();

                }

            }

        } finally {

            unsubscribe(future, threadId);

        }

//        get(lockAsync(leaseTime, unit));

    }

当第一个线程获取到锁后，会在if (ttl == null)分支进行返回，第二个及以后的线程进来在没获取到锁时，只能接着走下面的逻辑，进行锁的订阅。

接着进入到一个while循环，首先还是会进行一次尝试获取锁（万一此时第一个线程已经释放锁了呢），通过tryAcquire(leaseTime, unit, threadId)方法，如果没有获取到锁的话，会返回锁的剩余过期时间，如果剩余过期时间大于0，则当前线程通过Semaphore信号号，将当前线程阻塞，底层执行LockSupport.parkNanos(this, nanosTimeout)线程挂起剩余过期时间后，会自动进行唤醒，再次执行tryAcquire尝试获取锁。所有没有获取到锁的线程都会执行这个流程。

一定要等待剩余过期时间后才唤醒吗？

假设线程一获取到锁，过期时间默认为30s,当前执行业务逻辑已经过了5s,那其他线程走到这里，则需要等待25s后才行进行唤醒，那万一线程一执行业务逻辑只要10s，那其他线程还需要等待20s吗？这样岂不是导致效率很低？

答案是否定的，详细看解锁逻辑。

解锁

解锁：redissonLock.unlock();

我们来看看具体的解锁逻辑:

protected RFuture<Boolean> unlockInnerAsync(long threadId) {

    return commandExecutor.evalWriteAsync(getName(), LongCodec.INSTANCE, RedisCommands.EVAL_BOOLEAN,

            // 锁不存在，发布unlockMessage解锁消息，通知其他等待线程

            "if (redis.call('exists', KEYS[1]) == 0) then " +

                "redis.call('publish', KEYS[2], ARGV[1]); " +

                "return 1; " +

            "end;" +

            // 不存在该锁，异常捕捉

            "if (redis.call('hexists', KEYS[1], ARGV[3]) == 0) then " +

                "return nil;" +

            "end; " +

            // redisson可重入锁计数-1，依旧>0，则重新设置过期时间

            "local counter = redis.call('hincrby', KEYS[1], ARGV[3], -1); " +

            "if (counter > 0) then " +

                "redis.call('pexpire', KEYS[1], ARGV[2]); " +

                "return 0; " +

            // redis删除锁，发布unlockMessage解锁消息，通知其他等待线程

            "else " +

                "redis.call('del', KEYS[1]); " +

                "redis.call('publish', KEYS[2], ARGV[1]); " +

                "return 1; "+

            "end; " +

            "return nil;",

            Arrays.<Object>asList(getName(), getChannelName()), LockPubSub.unlockMessage, internalLockLeaseTime, getLockName(threadId));

}

发现解锁逻辑底层也是用了一个lua脚本实现。具体的说明可以看代码注释，删除锁后，并发布解锁消息，通知到其它线程，也就意味着不会其它等待的线程一直等待。

Semophore信号量的订阅中有个onMessage方法，

protected void onMessage(RedissonLockEntry value, Long message) {

    // 唤醒线程

    value.getLatch().release(message.intValue());

    while (true) {

        Runnable runnableToExecute = null;

        synchronized (value) {

            Runnable runnable = value.getListeners().poll();

            if (runnable != null) {

                if (value.getLatch().tryAcquire()) {

                    runnableToExecute = runnable;

                } else {

                    value.addListener(runnable);

                }

            }

        }

        if (runnableToExecute != null) {

            runnableToExecute.run();

        } else {

            return;

        }

    }

}

解锁后通过if (opStatus)分支取消锁续期逻辑。

你可能想看：

response.sendRedirect（）和request.getRequestDispatcher（）。forward（request，response）有什么区别[重复]

response.sendRedirect("login.jsp");不添加上下文路径（指的是捆绑了servlet的应用程序/模块），将在相应应用程序的上下文路径之前。用于将资源重定向到其他服务器或域...

Kafka事务原理剖析

Producer端代码如下;(props);String;(TOPIC2;String;record;isolation.level，事务隔离级别;需要将其设置为"read_committed";当配...

网页报错Message: date: It is not safe to rely on the system's timezone settings. You are *required* to use the date.timezone s

实际上，从 PHP 5.1.0 ，当对使用date()等函数时，如果timezone设置不正确，在每一次调用时间函数时,都会产生E_NOTICE 或者 E_WARNING 信息。而又在php5.1.0...

快速解决&is marked as crashed and should be repaired&故障

Table '.\Tablename\posts' is marked as crashed and should be repaired. 提示说论坛的帖子表posts被标记有问题，需要修复。我记得...

安装系统出现remove disks or other media press any key to restart??? 谁能交我怎么做？

安装程序不能点击确定。。这种情况主要是你的PE内核太高造成的,比如你使用Win7内核的PE.就不能在PE里运行XP安装的,需要更换成XP内核版本的PE才行,remove disks or other ...

分布式与集群的区别是什么？

分布式是指将不同功能，或不同地点，或拥有不同数据的多台计算机通过网络连接起来，由控制系统统一管理，完成大规模信息处理的计算机系统。集群是指将多台服务器集中在一起提供同一种服务，在逻辑上可以看做是一台服...

开放分布式云Platform9获得2600万美元融资

位于加利福尼亚州山景城的开放分布式云公司Platform9今天宣布完成了由Celesta Capital牵头，Cota Capital、NGP Capital和其他投资者跟投的2600万美元融资。Pl...

分布式搜索引擎01

Mysql:关系型数据库:数据在存储时数据和数据之间有一定的关联关系:数据在存储时数据和数据之间没有关联关系:存储介质(存储位置):内存:用来代替Mysql的查询:分布式搜索引擎01:Kibana-D...

腾讯云TDSQL数据库助力印尼BNC银行完成新核心分布式迁移!

目前，新系统运行平稳顺畅已支持超2000万用户，到2023年要为超5000万印尼居民提供支付、借贷、资产管理、生活支付等服务；也带来了大量数据、高频交易、数据结构不足的巨大挑战，腾讯云数据库TDSQL...

require,enquire,inquire,acquire的意思是什么？有何区别

与of、about连用表示问、询问，与into连用表示调查。enquire后面一般接 about。

从专业角度看，荣耀10上的超声波指纹解锁原理是什么？

荣耀10采用了新一代超声波指纹技术。除此之外，指纹区域还是多功能导航键，轻点可返回，一滑实现多任务，一压又回到主页面。这么神奇的技术，它的原理是什么呢？对比而言，按压式电容传感器做出的是二维指纹图像。...

高中英语答疑：several hundred中的hundred用单数还是复数

英语中，像hundred, thousand, million, billion这些数词，可用来表示“具体”的数字，也可以用来表示“大概”（不确切）的数字。表示具体数目，之前加one , two, t...

有人使用redux开发工具在TS中遇到此错误吗？“类型#39;Window#39;上不存在属性#39;__REDUX_DEVTOOLS_EXTENSION_COMPOSE__#39; ”？

在类型;import { Provider } from 'react-redux';compose;import thunk from 'redux-thunk';));Provider store...

电脑开机有时候显示Remove disks or other media Press any key to

出现此问题的原因为：电脑的系统出现了问题导致的。

c语言中expected expression before是什么意思？

c语言中expected expression before意思是之前预期的表达。输出到标准输出流stdout，从标准流stdin输入。应用时要为输出输入流指定设备，有两种方法：第一、通过FDEV_...

可是she reads space news and business也可以改成Does she read space news or business news

你这样改就成了选择疑问句。就像别人问你，你是吃苹果还是吃梨，你不能回答：是的，我吃。这里你可以回答space news也可以回答business news或者回答，she reads BOTH spa...

ghost一键恢复失败,刚才找虚拟光驱没找到,现在无法重启,bootmgr is missing press crl alt del to restart

最简单是买张系统光盘，在其启动界面，1、先点“一键几分区”会全盘分区格好，，2、重启后在其启动界面里点“一键装系统到c盘”，大概意思而己具体文字可能不同。 !!!!!首先备份重要数据!!!!!!...

WordPress付费主题模板有哪些？WordPress付费主题推荐

很多新手在搭建WordPress网站时对于主题的选择可能会比较纠结，因为WordPress主题模板和插件类型多样，有免费的也有付费的，不同行业类型网站用的主题也会有所差别。为了能使用更多高级功能，现在...

WordPress定制开发、WordPress建站中出现死亡白屏怎么办

WordPress定制开发、WordPress建站中出现死亡白屏怎么办？这是很多的程序师在WordPress定制开发、WordPress建站中常遇见的问题。下面北京六翼开源的王工给大家介绍一下。在少数...

鸿图之下鸿图[hóng tú]什么意思?近义词和反义词是什么?英文翻译是什么?

鸿图[hóng tó][鸿图]基本描述了伟大的基础行业。它通常是指帝位。参照宏图[鸿图]详细说明宏伟的基础行业。它常指王业帝位。玄宗“幸并州推恩谕”：“兴王始封之地，鸿图创业之初，包括生育灵、大造区宇...

标签: 分布式开发 keys

分享给朋友：

问答百科

redisson分布式锁原理剖析

redisson分布式锁原理剖析

加锁

锁续命（自旋）

锁订阅及锁等待

解锁

Copyright © 2024 问答百科网 All Rights Reserved.
蜀ICP备11000655号-9