IT培訓(xùn)網(wǎng)
IT在線學(xué)習(xí)
近年來大數(shù)據(jù)技術(shù)人才層出不窮,但無論如何求職者只有經(jīng)過層層面試才能獲得施展才華的機(jī)會(huì),而面試的首關(guān)就是一套技術(shù)面試題,所以中公優(yōu)就業(yè)小編整理了一些常見的大數(shù)據(jù)面試題,希望對(duì)大家有幫助。
1、舉一個(gè)簡(jiǎn)單的例子說明mapreduce是怎么來運(yùn)行的 ?
2、secondarynamenode的主要職責(zé)是什么?簡(jiǎn)述其工作機(jī)制
3、Sqoop用起來感覺怎樣?
4、kafka 數(shù)據(jù)高可用的原理是什么
5、MapReduce 中排序發(fā)生在哪幾個(gè)階段?這些排序是否可以避免?為什么?
6、100w 個(gè)數(shù)中找出最大的 100 個(gè)數(shù)。
7、一個(gè)文本文件,大約有一萬(wàn)行,每行一個(gè)詞,要求統(tǒng)計(jì)出其中最頻繁出現(xiàn)的前10個(gè)詞,請(qǐng)給出思想,給出時(shí)間復(fù)雜度分析。
8、已知某個(gè)文件內(nèi)包含一些電話號(hào)碼,每個(gè)號(hào)碼為8位數(shù)字,統(tǒng)計(jì)不同號(hào)碼的個(gè)數(shù)。
9、有一千萬(wàn)條短信,有重復(fù),以文本文件的形式保存,一行一條,有重復(fù)。 請(qǐng)用 5 分鐘時(shí)間,找出重復(fù)出現(xiàn)最多的前 10 條。
10、每個(gè)文件至少有1000萬(wàn)行,請(qǐng)用程序完成以下工作,
1)每個(gè)文件的個(gè)子的IP
2)出現(xiàn)在b.text而沒有出現(xiàn)在a.text的IP
3)每個(gè)user出現(xiàn)的次數(shù)以及每個(gè)user對(duì)應(yīng)的IP的個(gè)數(shù)
相關(guān)推薦:
【大數(shù)據(jù)面試題】10道常見的大數(shù)據(jù)面試題(三)
【大數(shù)據(jù)培訓(xùn)教程】把握時(shí)代風(fēng)口,做大數(shù)據(jù)架構(gòu)師
更多內(nèi)容
>>本文地址:http://hqfphsz.com/jiuye/2018/45570.html
聲明:本站稿件版權(quán)均屬中公教育優(yōu)就業(yè)所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
1 您的年齡
2 您的學(xué)歷
3 您更想做哪個(gè)方向的工作?