400-650-7353
您所在的位置:首頁 > IT就業(yè)指南 > 面試題 > 【大數(shù)據(jù)面試題】10道常見的大數(shù)據(jù)面試題(三)

【大數(shù)據(jù)面試題】10道常見的大數(shù)據(jù)面試題(三)

  • 來源:互聯(lián)網(wǎng)
  • 2018-11-09 19:39:28
  • 閱讀()
  • 分享
  • 手機端入口

面試是通往各大企業(yè)的必經(jīng)之路,尤其是對于程序員面試,這種技術(shù)人員的面試,比一般的面試還要復(fù)雜,是要經(jīng)歷好幾輪的。大數(shù)據(jù)工程師的面試也不例外,首先一輪便是面試,主要考察的是自己掌握的技術(shù)知識,所以優(yōu)就業(yè)小編給大家整理了一些常見的大數(shù)據(jù)面試題

1、了解zookeeper嗎?介紹一下它,它的選舉機制和集群的搭建。

2、spark streming在實時處理時會發(fā)生什么故障,如何停止,解決。

3、RDD中reduceBykey與groupByKey哪個性能好,為什么。

4、Hbase 內(nèi)部結(jié)構(gòu)和hbase 表里面怎么對應(yīng)的。

【大數(shù)據(jù)面試題】10道常見的大數(shù)據(jù)面試題(三)

5、講述一下mapreduce的流程。

6、kafka集群的規(guī)模,消費速度是多少。

7、給40億個不重復(fù)的unsigned int的整數(shù),沒排過序的,然后再給一個數(shù),如何快速判斷這個數(shù)是否在那40億個數(shù)當(dāng)中?

8、給定a、b兩個文件,各存放50億個url,每個url各占64字節(jié),內(nèi)存限制是4G,讓你找出a、b文件共同的url?

9、尋找熱門查詢:搜索引擎會通過日志文件把用戶每次檢索使用的所有檢索串都記錄下來,每個查詢串的長度為1-255字節(jié) 假設(shè)目前有一千萬個記錄(這些查詢串的重復(fù)度比較高,雖然總數(shù)是1千萬,但如果除去重復(fù)后,不超過3百萬個。一個查詢串的重復(fù)度越高,說明查詢它的用戶越多,也就是越熱門),請你統(tǒng)計最熱門的10個查詢串,要求使用的內(nèi)存不能超過1G。

10、首先集群的目的是為了節(jié)省成本,用廉價的pc機,取代小型機及大型機。小型機和大型機有什么特點?

相關(guān)推薦:

【大數(shù)據(jù)面試題】10道常見的大數(shù)據(jù)面試題(二)

【大數(shù)據(jù)培訓(xùn)教程】把握時代風(fēng)口,做大數(shù)據(jù)架構(gòu)師

文章“【大數(shù)據(jù)面試題】10道常見的大數(shù)據(jù)面試題(三)”已幫助

更多內(nèi)容

>>本文地址:http://hqfphsz.com/jiuye/2018/45538.html

THE END  

聲明:本站稿件版權(quán)均屬中公教育優(yōu)就業(yè)所有,未經(jīng)許可不得擅自轉(zhuǎn)載。

1 您的年齡

2 您的學(xué)歷

3 您更想做哪個方向的工作?

獲取測試結(jié)果
  • 大前端大前端
  • 大數(shù)據(jù)大數(shù)據(jù)
  • 互聯(lián)網(wǎng)營銷互聯(lián)網(wǎng)營銷
  • JavaJava
  • Linux云計算Linux
  • Python+人工智能Python
  • 嵌入式物聯(lián)網(wǎng)嵌入式
  • 全域電商運營全域電商運營
  • 軟件測試軟件測試
  • 室內(nèi)設(shè)計室內(nèi)設(shè)計
  • 平面設(shè)計平面設(shè)計
  • 電商設(shè)計電商設(shè)計
  • 網(wǎng)頁設(shè)計網(wǎng)頁設(shè)計
  • 全鏈路UI/UE設(shè)計UI設(shè)計
  • VR/AR游戲開發(fā)VR/AR
  • 網(wǎng)絡(luò)安全網(wǎng)絡(luò)安全
  • 新媒體與短視頻運營新媒體
  • 直播帶貨直播帶貨
  • 智能機器人軟件開發(fā)智能機器人
 

快速通道fast track

近期開班時間TIME