- 相關推薦
百度數(shù)據(jù)分析員面試測試題
大概一個月前,筆者接到百度的面試電話,去應試數(shù)據(jù)分析員的工作。盡管無意去工作,但是還是希望能看看他們的測試題到底是怎么樣的。于是接觸到了一下的題目:
總共十個題目(當然全是excel函數(shù)題):
1、根據(jù)員工的身份證號,統(tǒng)計員工的生日。眾所周知,我國居民身份證號有18位和15位數(shù)之分。對于同樣位數(shù)的身份證號統(tǒng)計想必不是很難,但是混雜了兩種情況的統(tǒng)計怎么來做呢?
背景材料:
15位的身份證號碼:450104771010156
(1)1~6位為地區(qū)代碼
(2)7~8位為出生年份(2位),9~10位為出生月份,11~12位為出生日期
(3)第13~15位為順序號,并能夠判斷性別,奇數(shù)為男,偶數(shù)為女。
18位的身份證號碼:450104197710101516
(1)1~6位為地區(qū)代碼,
(2)7~10位為出生年份(4位),如1977
(3)11~12位為出生月份,如10
(4)13~14位為出生日期,如10
(5)第15~17位為順序號
2、從備注材料中抽提其中的物料代碼,代碼的格式是“0000-00000”,備注是文字和數(shù)字的混合。如“某某客戶投訴0000-00000產(chǎn)品有質(zhì)量問題,香氣偏淡”。讓你寫出函數(shù)從中提取出物料代碼。
3、AB列各有N多個單字節(jié)文本,但其中個別單元格有空白。要求:B3單元格有文字就顯示B3單元格,若B3無文字而A3有,則顯示A3單元格文字,如果A3也沒有文字,則顯示“濟南”。
4.有個物料庫存區(qū)域,有諸多原料進倉數(shù)據(jù),單個原料有多次進倉記錄的,讓統(tǒng)計部分原料的庫存總數(shù)量。
5、考勤情況統(tǒng)計。A代表上班,K曠工,S遲到,B病假,W出差
按照日期記錄每個員工的考勤情況。月底對員工考勤情況進行統(tǒng)計。
6、小數(shù)點的取舍。保留小數(shù)點后兩位,和截留取整。
7、有一副用數(shù)字0填充單元格組成的圖畫,讓改變該副圖畫的背景顏色。
還有三個題時隔久遠,一時想不起了,抱歉,只能發(fā)這幾個題了。
知道答案的可以在隨后的評論中寫出,猜不出的可以問我。
--
--以下為本人收集的幾種數(shù)據(jù)分析工具--
1.QUEST
QUEST是IBM公司Almaden研究中心開發(fā)的一個多任務數(shù)據(jù)挖掘系統(tǒng),目的是為新一代決策支持系統(tǒng)的應用開發(fā)提供高效的數(shù)據(jù)開采基本構件。系統(tǒng)具有如下特點:
提供了專門在大型數(shù)據(jù)庫上進行各種開采的功能:關聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、時間序列聚類、決策樹分類、遞增式主動開采等。
各種開采算法具有近似線性(O(n))計算復雜度,可適用于任意大小的數(shù)據(jù)庫。
算法具有找全性,即能將所有滿足指定類型的模式全部尋找出來。
為各種發(fā)現(xiàn)功能設計了相應的并行算法。
2.MineSet
MineSet是由SGI公司和美國Standford大學聯(lián)合開發(fā)的多任務數(shù)據(jù)挖掘系統(tǒng)。MineSet集成多種數(shù)據(jù)挖掘算法和可視化工具,幫助用戶直觀地、實時地發(fā)掘、理解大量數(shù)據(jù)背后的知識。MineSet有如下特點:
MineSet以先進的可視化顯示方法聞名于世。
提供多種 萃誥蚰J健0 ǚ擲嗥鰲⒒毓檳J、关 嬖頡⒕劾喙欏⑴卸狹兄匾 取?br>
支持多種關系數(shù)據(jù)庫。可以直接從Oracle、Informix、Sybase的表讀取數(shù)據(jù),也可以通過SQL命令執(zhí)行查詢。
多種數(shù)據(jù)轉換功能。在進行挖掘前,MineSet可以去除不必要的數(shù)據(jù)項,統(tǒng)計、集合、分組數(shù)據(jù),轉換數(shù)據(jù)類型,構造表達式由已有數(shù)據(jù)項生成新的數(shù)據(jù)項,對數(shù)據(jù)采樣等。
操作簡單、支持國際字符、可以直接發(fā)布到Web。
3.DBMiner
DBMiner是加拿大SimonFraser大學開發(fā)的一個多任務數(shù)據(jù)挖掘系統(tǒng),它的前身是DBLearn。該系統(tǒng)設計的目的是把關系數(shù)據(jù)庫和數(shù)據(jù)開采集成在一起,以面向?qū)傩缘亩嗉壐拍顬榛A發(fā)現(xiàn)各種知識。DBMiner系統(tǒng)具有如下特色:
能完成多種知識的發(fā)現(xiàn):泛化規(guī)則、特性規(guī)則、關聯(lián)規(guī)則、分類規(guī)則、演化知識、偏離知識等。
綜合了多種數(shù)據(jù)開采技術:面向?qū)傩缘臍w納、統(tǒng)計分析、逐級深化發(fā)現(xiàn)多級規(guī)則、元規(guī)則引導發(fā)現(xiàn)等方法。
提出了一種交互式的類SQL語言數(shù)據(jù)開采查詢語言DMQL。
能與關系數(shù)據(jù)庫平滑集成。
實現(xiàn)了基于客戶/服務器體系結構的Unix和pC(Windows/NT)版本的系統(tǒng)。
4.EXCEL MATLAB Origin 等等
當前流行的圖形可視化和數(shù)據(jù)分析軟件有Matlab,Mathmatica和Maple等。這些軟件功能強大,可滿足科技工作中的許多需要,但使用這些軟件需要一定的計算機編程知識和矩陣知識,并熟悉其中大量的函數(shù)和命令。而使用Origin就像使用Excel和Word那樣簡單,只需點擊鼠標,選擇菜單命令就可以完成大部分工作,獲得滿意的結果。 但它又比excel要強大些。一般日常的話可以用Excel,然后加載宏,里面有一些分析工具,不過有時需要數(shù)據(jù)庫軟件支持。
【百度數(shù)據(jù)分析員面試測試題】相關文章:
數(shù)據(jù)分析員工作總結01-26
數(shù)據(jù)分析員崗位職責03-07
數(shù)據(jù)分析員崗位職責說明07-10
數(shù)據(jù)分析員工作總結2篇02-02
數(shù)據(jù)分析員工作總結4篇01-26
數(shù)據(jù)分析員工作總結3篇02-23
數(shù)據(jù)分析員崗位職責5篇03-07