MYSQL_多版本并發控制、存儲引擎、索引簡介
發表時間:2023-07-16 來源:明輝站整理相關軟件相關文章人氣:
[摘要]多版本并發控制mysql的大多數事務型存儲引擎實現的都不是簡單的行級鎖;谔嵘l性能的考慮,它們一般都同時實現了多版本并發控制?梢哉J為MVCC是行級鎖的一種變種,但是它很多情況下避免了加鎖操作...
多版本并發控制
mysql的大多數事務型存儲引擎實現的都不是簡單的行級鎖;谔嵘l性能的考慮,它們一般都同時實現了多版本并發控制。
可以認為MVCC是行級鎖的一種變種,但是它很多情況下避免了加鎖操作,因為開銷更低。
InnoDB的MVCC,是通過在每行記錄最后保存的兩個隱藏的列來實現,這兩個列,一個保存了行的創建時間,一個保存行的過期時間(或刪除時間),當然存儲的并不是實際的時間值,而是系統版本好。每開始一個新的事務,系統版本號都會自動遞增。事務開始時刻的系統版本號會作為事務的版本號,用來查詢到的每行版本號進行比較。
REPEATABLE READ隔離級別下,MVCC的實現:
MVCC只在REPEATABLE READ跟READ COMMITED兩個隔離級別工作。其他兩個隔離級別都和MVCC不兼容。因為READ UNCOMMITED總是讀取最新的數據行,而不是符合當前事務版本的數據行。而SERIALIZABLE則會對所有讀取的數據的行都加鎖。
存儲引擎
InnoDB存儲引擎
InnoDB是MYSQL的默認事務型引擎,也是最重要、使用最廣泛的存儲引擎。除非有非常特別的原因需要使用其他的存儲引擎,否則應該優先考慮InnoDB引擎。
InnoDB采用MVCC來支持高并發,并且實現了四個標準的隔離級別。默認級別是REPEATABLE READ(可重復讀),并且通過間隙鎖+MVCC策略防止幻讀的實現,間隙鎖使得InnoDB不僅僅鎖定查詢設計的行,還會對索引中的間隙進行鎖定,以防止幻影行的插入。
間隙鎖:當我們用范圍條件而不是相等條件檢索數據,并請求共享或排他鎖時,InnoDB會給符合條件的已有數據記錄的索引項加鎖;對于鍵值在條件范圍內但并不存在的記錄,叫做“間隙(GAP)”,InnoDB也會對這個“間隙”加鎖,這種鎖機制就是所謂的間隙鎖(Next-Key鎖)。
參考:間隙鎖(Next-Key鎖)
主索引是聚簇索引,在索引中保存了數據,從而避免直接讀取磁盤,因此對查詢性能有很大的提升。
InnoDB內部做了很多優化,包括從磁盤讀取數據時采用的可預測性預讀,能夠自動在內存中創建hash索引以加速度操作的自適應哈希索引,以及能夠加速插入操作的插入緩沖區等。
MyISAM存儲引擎
在mysql5.1以及之前的版本,MyISAM是默認的存儲引擎。MyISAM提供了大量的特性,包括全文索引、壓縮、空間函數等,但是不支持事務和行級鎖,而且有一個毫無疑問的缺陷是崩潰之后無法安全恢復。
對于只讀的數據、或者表比較小、可以忍受修復操作,則依然可以使用MyISAM引擎。
創建MyISAM表的時候,如果指定了DELAY_KEY_WRITE選項,在每次修改執行完成時,不會立刻將修改的索引數據寫入磁盤,而是會寫到內存中的鍵緩沖區,只有在清理鍵緩沖區或者關閉表的時候才會將對應的索引塊寫入到磁盤。這種方式可以極大地提升寫入性能,但是在數據庫或者主機崩潰時會造成索引損壞,需要執行修復操作。
比較
事務:InnoDB支持事務,MyISAM不支持事務。
鎖粒度:InnoDB支持表級鎖跟行級鎖,而MyISAM只支持表級鎖。
外鍵:InnoDB支持外鍵。
備份:InnoDB支持熱備份,但需要工具。
崩潰恢復:MyISAM崩潰后發生損壞的概率比InnoDB高很多,而且恢復的速度也比較慢。
其他特性:MyISAM支持全文索引、壓縮、空間函數等特性。
備份的類型
冷備(cold backup):需要關mysql服務,讀寫請求均不允許狀態下進行;
溫備(warm backup): 服務在線,但僅支持讀請求,不允許寫請求;
熱備(hot backup):備份的同時,業務不受影響。
索引
索引(也叫做“鍵(key)”)是存儲引擎用于快速查找記錄中的一種數據結構。
B-Tree索引
大多數mysql引擎都支持這種索引。
雖然使用術語“B-Tree",但是不同的存儲引擎可能使用不同的存儲結構,NDB集群存儲引擎內部實際用的是T-Tree,InnoDB則使用B+Tree。
B-Tree索引能夠加快訪問數據的速度,因為存儲引擎不需要進行全表掃描來獲取需要的數據,取而代之的是從索引的根節點開始搜索,因此查找速度會快很多。
B-Tree對索引列是順序組織存儲的,很適合查找范圍數據。因為索引樹是有序的,所以除了用戶查找,還可以用來排序和分組。
可以指定多個列作為索引列,多個索引列共同組成索引鍵。B-Tree索引適用于全鍵值、鍵值范圍或鍵前綴查找,其中鍵前綴查找只適用與根據最左前綴查找。查找一定得按照索引的最左列開始。
B-Tree索引的數據結構
B-Tree
為了描述B-Tree,首先定義一條數據記錄為二元組[key,data],key作為記錄的鍵值,對于不同數據記錄,key是互不相同的,data為數據記錄除key外的數據。
查找算法:首先在根節點進行二分查找,如果找到則返回對應節點的data,否則在相應區間的指針指向的節點遞歸進行查找。
由于插入刪除新的數據記錄會破壞B-Tree的性質,因此在插入刪除時,需要對樹進行一個分裂、合并、旋轉等操作以保持 B-Tree 性質。

B+Tree
與B-Tree相比,B+Tree有以下特點:

帶有順序訪問指針的B+Tree
一般在數據庫系統或文件系統中使用的B+Tree結構都在經典B+Tree的基礎上進行了優化,增加了順序訪問指針。

這個優化的目的是為了提供區間訪問的性能,例如圖中如果要查詢key為18到49的所有記錄。
優勢
紅黑樹等平衡樹也可以用來實現索引,但是文件系統及數據庫系統普遍采用B-Tree作為索引結構,主要有以下兩個原因:
更好的檢索次數:平衡樹檢索數據的時間復雜度等于樹高h,而樹高大致為O(h) = O(logN),其中d為每個節點的出度。紅黑樹的出度為2,而B-Tree的出度一般都很大,紅黑樹的樹高h明顯比B-Tree打非常多,因此檢索次數也就更多。B+Tree相比較B-Tree更合適外存索引,因為B+Tree內節點去掉了data域,因此可以擁有更大的出度,檢索效率會更高。
利用計算機預讀特性:為了減少磁盤 I/O,磁盤往往不是嚴格按需讀取,而是每次都會預讀。這樣做的理論依據是計算機科學中著名的局部性原理:當一個數據被用到時,其附近的數據也通常會馬上被使用。預讀過程中,磁盤進行順序讀取,順序讀取不需要進行磁盤尋道,并且只需要很短的旋轉時間,因此速度會非?。操作系統一般將內存和磁盤分割成固態大小的塊,每一塊稱為一頁,內存與磁盤以頁為單位交換數據。數據庫系統將索引的一個節點的大小設置為頁的大小,使得一次 I/O 就能完全載入一個節點,并且可以利用預讀特性,相鄰的節點也能夠被預先載入。
參考:MySQL索引背后的數據結構及算法原理
哈希索引
InnoDB引擎有一個特殊的功能叫“自適應哈希索引”,當某個索引值被使用得非常頻繁,會在B+Tree索引之上再創建一個哈希索引,這樣就讓B+Tree索引具有哈希索引的一些優點,比如快速的哈希查找。
哈希索引能在O(1)時間進行查找,但是失去了有序性,它具有以下限制:
空間數據索引(R-Tree)
MyISAM表支持空間索引,可以用作地理數據存儲?臻g索引會從所有維度來索引數據,查詢時可以根據任意維度來組合查詢。
必須使用Mysql的GIS相關函數如MBRONTAINS()等來維護數據。
全文索引
全文索引是一種特殊類型的索引,它查找的是文本中的關鍵字,而不是直接比較索引中的值。查找條件使用 MATCH AGAINST,而不是普通的 WHERE。
全文索引一般使用倒排序索引實現,它記錄著關鍵詞到期所在文檔的映射。
MyISAM存儲引擎支持全文索引,InnoDB存儲引擎在Mysql 5.6.4版本中也開始支持全文索引。
索引的優點
以上就是MYSQL_多版本并發控制、存儲引擎、索引簡介的詳細內容,更多請關注php中文網其它相關文章!
學習教程快速掌握從入門到精通的SQL知識。