千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁  >  應(yīng)聘面試  >  大數(shù)據(jù)面試題  > 批次累加

批次累加

來源:千鋒教育
發(fā)布人:wjy
時(shí)間: 2022-09-02 15:35:53 1662104153

UpdataStateBykey updataStateBykey是特殊的reduceByKey, 相當(dāng)于oldValue+reduceByKey(newValue1,newValue2),通過傳入一個(gè)updateFunc來實(shí)現(xiàn)批次間數(shù)據(jù)累加的操作。

實(shí)現(xiàn)它必須設(shè)置checkPoint路徑,updataStateBykey會自動將每次計(jì)算的結(jié)果持久化到磁盤,批次間的數(shù)據(jù)則是緩存在內(nèi)存中。

缺點(diǎn):大量占用內(nèi)存,大量產(chǎn)生小文件 MapwithState mapwithState是spark1.6新增的累加操作,目前還在測試中,它的原理網(wǎng)上查不到,只知道是updataStateBykey的升級版,效率提升10倍。

缺點(diǎn):資料不全,社區(qū)很小 不建議使用狀態(tài)流累加操作,建議用窗口+第三方存儲(redis)來達(dá)到同樣的效果。

Spark Streaming中的updateStateByKey和mapWithState的區(qū)別和使用。

UpdateStateByKey:統(tǒng)計(jì)全局的key的狀態(tài),但是就算沒有數(shù)據(jù)輸入,他也會在每一個(gè)批次的時(shí)候返回之前的key的狀態(tài)。

這樣的缺點(diǎn)就是,如果數(shù)據(jù)量太大的話,而且我們需要checkpoint數(shù)據(jù),這樣會占用較大的存儲。

如果要使用updateStateByKey,就需要設(shè)置一個(gè)checkpoint目錄(updateStateByKey自己是無法保存key的狀態(tài)的),開啟checkpoint機(jī)制。因?yàn)閗ey的state是在內(nèi)存維護(hù)的,如果宕機(jī),則重啟之后之前維護(hù)的狀態(tài)就沒有了,所以要長期保存它的話需要啟用checkpoint,以便恢復(fù)數(shù)據(jù)。 

MapWithState:也是用于全局統(tǒng)計(jì)key的狀態(tài),但是它如果沒有數(shù)據(jù)輸入,便不會返回之前的key的狀態(tài),有一點(diǎn)增量的感覺。

這樣做的好處是,我們可以只關(guān)心那些已經(jīng)發(fā)生變化的key,對于沒有數(shù)據(jù)輸入,則不會返回那些沒有變化的key的數(shù)據(jù)。

這樣即使數(shù)據(jù)量很大,checkpoint也不會像updateStateByKey那樣,占用太多的存儲。

批次累加

tags:
聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請您保持通訊暢通,專屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
快速通道
久久亚洲中文字幕精品一区四,亚洲日本另类欧美一区二区,久久久久久久这里只有免费费精品,高清国产激情视频在线观看
日本久久9网站 | 日韩精品亚洲专区在线播放 | 亚洲日韩乱码人人爽人人澡人人 | 日本三级A∨在线观看 | 亚洲国产精品欧美日韩一区二区 | 日韩中字一区国产综合 |