[分布式设计] 没有 Redis 分布式锁如何保证操作的一致性？

背景
应用实例部署在多个机房，不同机房的应用实例使用同一个 DB ，但是受 xxx 风险规则，不同机房不能够使用同一个 Redis：

然而应用中有一个定时任务会按时扫描 DB 中的某个表的记录执行相应的动作 Action ，并将结果回写到这条记录中。
一个非常直觉的想法是，使用分布式锁实现某个记录只有一个应用实例在操作。但受限于上述规则而无法实现。
因此，想问下该怎么实现才能保证一个记录不会被多个实例同时操作呢？
思考
目前几个非常直觉的想法是：
1.应用在扫表后会得到一批记录，每次在执行动作 Action 之前，给这个记录加个行锁？理论上是可行的，但不知道这种加锁的方式是否合适以及代价/风险。
2.每次只让一个机房的应用实例扫表，这样子同机房就可以使用 Redis
3.给 DB 加个字段让每个机房只搞自己的，当某个机房发生故障的时候手动改配置，让另外一个健康机房可以扫故障机房的单子。
感觉方法都有点野蛮... 另外这需求其实用消息队列应该是比较优质的解法，但目前规模不大，都不太想用到 Q...

我感觉怎么设计都会有问题，一个最核心的问题是你的 action 是可以重放的吗。如果不是的话，即使有 redis 分布式锁，你怎么解决如果扫到一个 action ，执行了一半挂了的情况呢。

尽量设计成一个实例操作一部分数据，没必要用锁竞争。做好监控的话，实例挂了的情况其实很少见，直接处理就行了。

使用 db 实现分布式锁是一样的啊，乐观锁 update

同意楼上观点

这个挺好的

db 建一个 lock 表，里面只有一个主键和一个 version ，就能实现乐观锁

楼主想要实现的就是分布式锁，感觉学的有点死了，分布式锁可以通过 redis 实现，当然也可以通过 mysql 实现

＃8 不好意思，惯性思维 mysql 了，其他 db 也是一样

既然是数据库，那直接行锁啊😂，如果没有大量并发，用 redis 加锁也属实倒反天罡

行锁可能会跟其它业务逻辑中的行锁打架，锁时间长了影响业务，加多了还容易死锁，2. 如果扫表负载不高，直接指定某个机房负责扫表也行，不用分配也不用轮流3. 不用加字段，直接按 ID 分配机房就行，出问题了手动切2 或 3 都行，把切机房的开关做方便点

"不同机房的应用实例使用同一个 DB" 这不就是天然实现分布式锁的基础设施么，没必要纠结非要使用 redis ，把 redis 分布式锁 setnx 和 expire ，用数据库的方式实现一遍就可以了呀，举个例子，来个 lock 表，lock_name 作为唯一索引，加一个 lock_status 状态,expire_time 过期时间，获取锁的时候 update lock set lock_status = 1 where lock_name = xxx and (lock_status = 0 or expire_time<now()) 释放锁的时候 update lock set lock_status = 0 where lock_name = xxx and lock_status = 1

直接最简单的，数据库悲观锁 for update ，隔离级别设置为 RC ，貌似 RR 会有间隙锁导致的死锁。

扫表看起来也是弱一致性动作。也要考虑协调问题

我们的做法是第一个做好幂等，也就是任务可以被重复执行但不会出现错误，另一个是根据某个字段做分片，取余或者一致型哈希算法去做，一个机房只处理一部分数据

select for update 语句可以实现分布式锁。

MySQL 在高并发下更新同一条数据可能会出现死锁，不如 Redis 用的省事儿。不过我也只是看过些案例没自己用 mysql 这么加过锁，也不清楚别的数据库是否也有这类问题

1 ） DB 实现分布式锁2 ）如果可访问多机房的话，引入调度节点

7 楼的方案没啥问题，你也没有数据同步什么的，顶天就是个缓存数据不一致

实际上是可以重放的，被扫的这个表实际包含新建的任务和之前执行失败的任务的记录。

每个实例操作一部分数据这个有什么最佳实践吗？

select for update

啊？这不是最传统的简单方案就可以解决的吗mysql 抢占啊增加一个状态字段假设 active_status = 0 未启动按照不同机房你最多有 2 个实例参与抢占update table set active_status = 1 where id = xxx看影响行数 = 1 视为抢占成功，开始执行就行了。。其他的 return为啥还需要分布式锁之类的，mysql update 一定是原子的啊

-- 创建锁表CREATE TABLE distributed_lock ( lock_name VARCHAR(255) PRIMARY KEY, locked_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP);-- 尝试获取锁INSERT INTO distributed_lock (lock_name) VALUES ('my_lock')ON DUPLICATE KEY UPDATE locked_at = CURRENT_TIMESTAMP;-- 检查是否获取成功SELECT COUNT() FROM distributed_lock WHERE lock_name = 'my_lock';-- 创建锁表CREATE TABLE distributed_lock ( lock_name VARCHAR(255) PRIMARY KEY, locked_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP);-- 尝试获取锁INSERT INTO distributed_lock (lock_name) VALUES ('my_lock')ON DUPLICATE KEY UPDATE locked_at = CURRENT_TIMESTAMP;-- 检查是否获取成功SELECT COUNT() FROM distributed_lock WHERE lock_name = 'my_lock';

不应该是悲观锁吗？

学习一下

合速度

[分布式设计] 没有 Redis 分布式锁如何保证操作的一致性？

近期文章

热门推荐