千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁(yè)  >  技術(shù)干貨  > 為什么分布式數(shù)據(jù)庫(kù)這么喜歡用kv store?

為什么分布式數(shù)據(jù)庫(kù)這么喜歡用kv store?

來(lái)源:千鋒教育
發(fā)布人:xqq
時(shí)間: 2023-10-12 22:21:18 1697120478

一、為什么分布式數(shù)據(jù)庫(kù)這么喜歡用kv store

雖然不論是單機(jī)數(shù)據(jù)庫(kù)(MySQL、PostgreSQL等等),還是題主說(shuō)到的分布式數(shù)據(jù)庫(kù)(CockroachDB、TiDB),都存在KV這個(gè)抽象,但對(duì)于KV這個(gè)接口的設(shè)計(jì),還是存在差別的。

數(shù)據(jù)庫(kù)通常會(huì)有這么幾個(gè)模塊,KV存儲(chǔ)、事務(wù)、索引,這三者之間的關(guān)系看起來(lái)涇渭分明,但實(shí)際上交織耦合,其中存在很多設(shè)計(jì)點(diǎn)。

名列前茅種設(shè)計(jì)是目前share-nothing分布式數(shù)據(jù)庫(kù)用的比較多的:基于單機(jī)KV存儲(chǔ)實(shí)現(xiàn)分布式KV,再基于分布式KV實(shí)現(xiàn)事務(wù),在distributed transactional key-value store的基礎(chǔ)上再實(shí)現(xiàn)global index,以及查詢引擎。在這種設(shè)計(jì)下,單機(jī)的KV存儲(chǔ)甚至不需要支持事務(wù),因?yàn)橥耆梢曰谶@個(gè)KV實(shí)現(xiàn)分布式事務(wù)。典型代表是TiDB。

這種設(shè)計(jì)的好處不再贅述,看一下局限性:分層太過(guò)清晰,想打通多個(gè)層次的時(shí)候反而比較復(fù)雜。例如分布式事務(wù),是不是可以和Consensus Protocol融合,實(shí)現(xiàn)安全的MVCC Follower Read?是不是可以借助單機(jī)引擎的事務(wù),來(lái)優(yōu)化單個(gè)region內(nèi)的事務(wù)避免分布式事務(wù)的開銷?

所以第二種設(shè)計(jì),保留單機(jī)事務(wù)的概念,把單機(jī)事務(wù)當(dāng)做common case,而分布式事務(wù)只是錦上添花。奠定了這么一個(gè)基本概念之后,通常索引也會(huì)優(yōu)先做成單機(jī)的,全局索引的優(yōu)先級(jí)降低甚至不做。在這種設(shè)計(jì)下,單機(jī)的KV存儲(chǔ),事實(shí)上就需要支持事務(wù),甚至,為了在此基礎(chǔ)上做分布式事務(wù),還需要提供一些額外的接口,例如point-in-time snapshot read。典型代表是MongoDB。

由于具有了原生的單機(jī)事務(wù),因此在common case下會(huì)很高效,可以當(dāng)單機(jī)數(shù)據(jù)庫(kù)來(lái)用。但其痛點(diǎn)也隨之產(chǎn)生:如何基于單機(jī)事務(wù)做分布式事務(wù),兩階段提交怎么做,事務(wù)隔離怎么做,多版本讀怎么做?并且,這些功能往往會(huì)耦合于單機(jī)的事務(wù)引擎,可想而知其復(fù)雜度。

如果單獨(dú)考慮第二種設(shè)計(jì)中的索引實(shí)現(xiàn),又會(huì)產(chǎn)生多種的KV接口設(shè)計(jì)。索引是基于KV做,還是下沉到KV中?

前面一種相對(duì)清晰,但性能方面有所折衷,由于索引的創(chuàng)建是基于純粹的KV接口,bulk load不好做,并且索引本身也是多版本的后面一種設(shè)計(jì),由于存儲(chǔ)引擎具有了schema信息,索引可以有更多的優(yōu)化空間。例如索引可以做成單版本的(PostgreSQL),指向多版本的heap file,以省去多版本的開銷;例如像X-Engine那樣,利用LSM 的特性實(shí)現(xiàn)更加高效的Fast DDL

簡(jiǎn)單總結(jié)一下,雖然大部分?jǐn)?shù)據(jù)庫(kù)都有KV存儲(chǔ)這個(gè)抽象,但仍然存在很大的設(shè)計(jì)空間,例如單機(jī)的KV是否需要支持事務(wù),是否需要感知schema,是否需要暴露多版本的接口。因此,不能籠統(tǒng)地說(shuō)分布式數(shù)據(jù)庫(kù)都喜歡用KV store。

延伸閱讀:

二、主要的單機(jī)存儲(chǔ)引擎

1、哈希存儲(chǔ):hash的CRUD是非??斓?。但缺點(diǎn)是不支持順序掃描。bitcask是一個(gè)基于hash表結(jié)構(gòu)的存儲(chǔ)系統(tǒng)。他將寫操作(包括刪除標(biāo)識(shí))追加到文件尾。并定期合并新老文件&記錄。

2、B樹:既支持隨機(jī)讀取又支持范圍查找的系統(tǒng)。查找時(shí)間復(fù)雜度為logd(n)(d為每個(gè)節(jié)點(diǎn)的出度)。Mysql的InnoDB的引擎和OS的文件系統(tǒng)使用的就是B+樹。(為什么選擇使用B樹的變種B+樹,讀者有興趣可以去探究下。提示:磁盤讀?。?/p>

3、LSM樹(Log Structured Merge Tree):由B+數(shù)改進(jìn)而來(lái)。其思想為:將增量寫操作保存在內(nèi)存中,超過(guò)閾值時(shí)刷入磁盤,從而減少隨機(jī)寫磁盤操作。讀操作則需要合并磁盤數(shù)據(jù)和內(nèi)存中的寫操作。通過(guò)Memtable/SSTable實(shí)現(xiàn),實(shí)現(xiàn)細(xì)節(jié)在此不做深入探究。比較適合寫操作較多的業(yè)務(wù)場(chǎng)景。BigTable/HBase/Cassandra中的列簇的數(shù)據(jù)存儲(chǔ)方式采用的即是LSM樹。

聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請(qǐng)您保持通訊暢通,專屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
Web前端用來(lái)做什么?

一、網(wǎng)頁(yè)開發(fā)Web前端在網(wǎng)頁(yè)開發(fā)中起到了至關(guān)重要的作用。它負(fù)責(zé)將網(wǎng)頁(yè)設(shè)計(jì)師設(shè)計(jì)的界面轉(zhuǎn)化為可交互的頁(yè)面。通過(guò)HTML、CSS和JavaScript等技術(shù),...詳情>>

2023-10-12 23:57:56
為什么要用flow?

一、用flow的原因Flow是一種靜態(tài)類型檢查工具,用于JavaScript代碼。它的主要目的是幫助開發(fā)者在編寫JavaScript代碼時(shí)發(fā)現(xiàn)和預(yù)防類型相關(guān)的錯(cuò)誤...詳情>>

2023-10-12 23:46:58
OceanBase、TiDB這類NewSQL的定位是什么?

一、OceanBase、TiDB這類NewSQL的定位oceanbase tidb spanner是share nothing的架構(gòu),單個(gè)分區(qū)有paxos保證可用性的前提下,還有近乎線性的擴(kuò)展...詳情>>

2023-10-12 23:36:12
linux有什么優(yōu)點(diǎn)?

1、開源Linux的主要優(yōu)點(diǎn)之一是它是一個(gè)開放源代碼的操作系統(tǒng),即每個(gè)人都可以輕松獲得其源代碼。任何有編程能力的人都可以出于任何目的貢獻(xiàn),修...詳情>>

2023-10-12 23:08:52
Python特點(diǎn)及應(yīng)用?

一、Python的特點(diǎn)Python是一種高級(jí)編程語(yǔ)言,由Guido van Rossum于上世紀(jì)90年代初開發(fā),它具有以下特點(diǎn):1、語(yǔ)法簡(jiǎn)潔易讀Python使用縮進(jìn)來(lái)表示...詳情>>

2023-10-12 23:00:52
快速通道
久久亚洲中文字幕精品一区四,亚洲日本另类欧美一区二区,久久久久久久这里只有免费费精品,高清国产激情视频在线观看
在线视频国产制服丝袜 | 亚洲偷自拍手机在线 | 日韩精品一区二区三区中文不卡 | 亚洲人在线观看视频 | 亚洲愉拍一区二区三区 | 亚洲精品免费福利网站 |