分类《数据库》

为什么在高并发的场景下，需要将 MySQL 的事务隔离级别设为读已提交？

2024 4 23 02:22 AM 0 条评论 21 次查看

为缩短篇幅，本文假定读者已知晓 transaction isolation level（事务隔离级别）的基础知识。

MySQL 的默认事务隔离级别是 repeatable read（可重复读），而在都市传说中，各个互联网大厂都会将其改为 read committed（读已提交），这是为什么呢？

从字面上理解，可重复读满足了一个事务在读取某行后，如果另一个事务修改了该行，再次读取它时，能保持第一次读到的值。可是，这又有什么意义呢？谁会在一个事务里多次读取同一行呢？
其实它的实现是这样：当事务开始后，从它第一次读取数据时，就创建了一个快照，之后都是对这个快照进行查询，直到这个事务结束。也就是说，可重复读的主要作用是让事务只访问这个事务和它之前已有的数据，而不是字面上的读同一行不会变。
而读已提交只需要在每次读取时创建一个快照，读取完这个快照就用不到了。
由此可见，可重复读需要维护一个较长的快照，这自然要消耗更多的资源。

不过现实中我们不会这样简单地使用事务。一个正常的事务如果要基于读取到的数据来修改，会使用 SELECT ... FOR UPDATE 的形式来加锁。
如果这里可以利用唯一索引的话，MySQL 会对唯一索引中满足条件的行添加行锁，否则需要加 gap lock 和 next-key lock，这两把锁会增加被锁定的范围。例如表 test 有一个被索引的列 a，有一行 a 为 100 的数据。当执行 SELECT * FROM test WHERE a = 1 FOR UPDATE 后，其他事务无法插入任何 a < 100 的数据，因为被这两把锁给锁住了。
而读已提交则不会添加这两种锁，并且当需要锁住的行不存在时，并不会对其加锁，而是允许其他事务插入。
由此可见，可重复读可能锁住了更多的数据，更容易造成死锁。

key / value 数据库的选型

2018 7 13 03:49 PM 5 条评论 2434 次查看

分类：数据库标签：无

一直以来在我的观念中，key/value 数据库就三种选项：

内存可存放：Redis
单机磁盘可存放：RocksDB
超过 TB 级：Cassandra、HBase……

然而在实际项目中使用 RocksDB 时，才发现了一堆问题，折腾许久才搞定。

如何构建 timeline

2015 10 5 09:37 PM 0 条评论 4009 次查看

分类：数据库标签：Redis

虽然我没有考证过，但至少从 Twitter 开始，timeline 这个词出现在互联网上也快 10 年了。这些年来，很多互联网产品依靠着各式各样的 timelines，吸引了无数的用户。
然而这篇文章并不是研究 timeline 的历史，而只是探索其实现方式而已。

用 Redis 存储 ID 连续的数据

2014 8 11 02:14 AM 7 条评论 2209 次查看

分类：数据库标签：Python, Redis

之前在设计「Doodle 2」和开发「知乎日报」时，我面对最多的数据类型就是带 ID 的数据了。
在使用关系型数据库时，自增的主键可以满足这个需求，而在 Redis 中就稍微麻烦些了。

关于 Redis 的几种数据库设计方案的内存占用测试

2013 4 15 04:32 AM 6 条评论 4749 次查看

分类：数据库标签：Python, 性能, Redis

最近在做一个项目，数据库使用的是 Redis。在设计数据结构时，不知道哪种实现是最优的，于是做了下测试。

测试环境如下：

OS X10.8.3
Redis 2.6.12
Python 2.7.4
redis-py 2.7.2
hiredis 0.1.1
ujson 1.30
MessagePack 0.3.0

注意：

因为是拿 Python 测试的，所以可能对其他语言并不完全适用。
使用的测试数据是特定的，可能对更小或更大的数据并不完全适用。

SQLite在多线程环境下的应用

2011 10 25 10:13 PM 19 条评论 38059 次查看

分类：数据库标签：C, Objective-C, Python, iOS开发, 性能

这几天研究了一下SQLite这个嵌入式数据库在多线程环境下的应用，感觉里面的学问还挺多，于是就在此分享一下。

Twitter为什么会使用NoSQL？

2010 4 26 03:18 PM 9 条评论 4287 次查看

分类：数据库标签：无

由于平时经常接触Google App Engine，所以对NoSQL也算比较关注。在设计网站时，总会不由自主地考虑使用NoSQL是否合适，而在给我的网站添加社交功能时，我也不禁想到了一个问题：Twitter为何会采用那么麻烦的NoSQL？

Java、PHP、Python与MySQL交互的性能测试

2009 12 7 05:27 PM 9 条评论 7437 次查看

分类：数据库标签：Java, PHP, Python, 性能

这几天看源码弄清了一件事：WEB服务器接收浏览器请求、将请求传给PHP/Python进程（FCGI等）、与数据库进行交互都是用socket（套接字）。
也就是说，这些行为都是进程间通信。一台WEB服务器在硬件、操作系统不变的情况下，它的性能主要取决于socket通信的速度。如果所有进程都在一台服务器上的话，这个速度就取决于通信的效率了。

sqlite3的性能不错

2009 11 30 04:48 AM 0 条评论 3793 次查看

分类：数据库标签：性能

Python 2.5里内置了sqlite3模块，可以直接创建sqlite数据库。虽然是个小型的数据库，不过测试后发现性能确实不错，看来足以用于嵌入式开发。

keakon的涂鸦馆