- 相關(guān)推薦
面試經(jīng)驗分享之機(jī)器學(xué)習(xí)、大數(shù)據(jù)問題
本人的專業(yè)方向是機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘,就業(yè)意向是互聯(lián)網(wǎng)行業(yè)與本專業(yè)相關(guān)的工作崗位。各個企業(yè)對這類崗位的命名可能有所不同。以下是小編整理的面試經(jīng)驗分享之機(jī)器學(xué)習(xí)、大數(shù)據(jù)問題,歡迎大家借鑒與參考,希望對大家有所幫助。
機(jī)器學(xué)習(xí)、大數(shù)據(jù)相關(guān)崗位的職責(zé)
自己參與面試的提供算法崗位的公司有 BAT、小米、360、飛維美地、宜信、猿題庫 等,根據(jù)業(yè)務(wù)的不同,崗位職責(zé)大概分為:
1、平臺搭建類
數(shù)據(jù)計算平臺搭建,基礎(chǔ)算法實現(xiàn),當(dāng)然,要求支持大樣本量、高維度數(shù)據(jù),所以可能還需要底層開發(fā)、并行計算、分布式計算等方面的知識;
2、算法研究類
文本挖掘,如領(lǐng)域知識圖譜構(gòu)建、垃圾短信過濾等;
推薦,廣告推薦、APP 推薦、題目推薦、新聞推薦等;
排序,搜索結(jié)果排序、廣告排序等;
廣告投放效果分析;
互聯(lián)網(wǎng)信用評價;
圖像識別、理解。
3、數(shù)據(jù)挖掘類
商業(yè)智能,如統(tǒng)計報表;
用戶體驗分析,預(yù)測流失用戶。
以上是根據(jù)本人求職季有限的接觸所做的總結(jié)。有的應(yīng)用方向比較成熟,業(yè)界有足夠的技術(shù)積累,比如搜索、推薦,也有的方向還有很多開放性問題等待探索,比如互聯(lián)網(wǎng)金融、互聯(lián)網(wǎng)教育。在面試的過程中,一方面要盡力向企業(yè)展現(xiàn)自己的能力,另一方面也是在增進(jìn)對行業(yè)發(fā)展現(xiàn)狀與未來趨勢的理解,特別是可以從一些剛起步的企業(yè)和團(tuán)隊那里,了解到一些有價值的一手問題。
以下首先介紹面試中遇到的一些真實問題,然后談一談答題和面試準(zhǔn)備上的建議。
面試問題
1、你在研究/項目/實習(xí)經(jīng)歷中主要用過哪些機(jī)器學(xué)習(xí)/數(shù)據(jù)挖掘的算法?
2、你熟悉的機(jī)器學(xué)習(xí)/數(shù)據(jù)挖掘算法主要有哪些?
3、你用過哪些機(jī)器學(xué)習(xí)/數(shù)據(jù)挖掘工具或框架?
4、基礎(chǔ)知識
無監(jiān)督和有監(jiān)督算法的區(qū)別?
SVM 的推導(dǎo),特性?多分類怎么處理?
LR 的推導(dǎo),特性?
決策樹的特性?
SVM、LR、決策樹的對比?
GBDT 和 決策森林 的區(qū)別?
如何判斷函數(shù)凸或非凸?
解釋對偶的概念。
如何進(jìn)行特征選擇?
為什么會產(chǎn)生過擬合,有哪些方法可以預(yù)防或克服過擬合?
介紹卷積神經(jīng)網(wǎng)絡(luò),和 DBN 有什么區(qū)別?
采用 EM 算法求解的模型有哪些,為什么不用牛頓法或梯度下降法?
用 EM 算法推導(dǎo)解釋 Kmeans。
用過哪些聚類算法,解釋密度聚類算法。
聚類算法中的距離度量有哪些?
如何進(jìn)行實體識別?
解釋貝葉斯公式和樸素貝葉斯分類。
寫一個 Hadoop 版本的 wordcount。
5、開放問題
給你公司內(nèi)部群組的聊天記錄,怎樣區(qū)分出主管和員工?
如何評估網(wǎng)站內(nèi)容的真實性(針對代刷、作弊類)?
深度學(xué)習(xí)在推薦系統(tǒng)上可能有怎樣的發(fā)揮?
路段平均車速反映了路況,在道路上布控采集車輛速度,如何對路況做出合理估計?采集數(shù)據(jù)中的異常值如何處理?
如何根據(jù)語料計算兩個詞詞義的相似度?
如何判斷自己實現(xiàn)的 LR、Kmeans 算法是否正確?
100億數(shù)字,怎么統(tǒng)計前100大的?
答題思路
1、用過什么算法?
最好是在項目/實習(xí)的大數(shù)據(jù)場景里用過,比如推薦里用過 CF、LR,分類里用過 SVM、GBDT;
一般用法是什么,是不是自己實現(xiàn)的,有什么比較知名的實現(xiàn),使用過程中踩過哪些坑;
優(yōu)缺點分析。
2、熟悉的算法有哪些?
基礎(chǔ)算法要多說,其它算法要挑熟悉程度高的說,不光列舉算法,也適當(dāng)說說應(yīng)用場合;
面試官和你的研究方向可能不匹配,不過在基礎(chǔ)算法上你們還是有很多共同語言的,你說得太高大上可能效果并不好,一方面面試官還是要問基礎(chǔ)的,另一方面一旦面試官突發(fā)奇想讓你給他講解高大上的內(nèi)容,而你只是泛泛的了解,那就傻叉了。
3、用過哪些框架/算法包?
主流的分布式框架如 Hadoop,Spark,Graphlab,Parameter Server 等擇一或多使用了解;
通用算法包,如 mahout,scikit,weka 等;
專用算法包,如 opencv,theano,torch7,ICTCLAS 等。
4、基礎(chǔ)知識
個人感覺高頻話題是 SVM、LR、決策樹(決策森林)和聚類算法,要重點準(zhǔn)備;
算法要從以下幾個方面來掌握
產(chǎn)生背景,適用場合(數(shù)據(jù)規(guī)模,特征維度,是否有 Online 算法,離散/連續(xù)特征處理等角度);
原理推導(dǎo)(最大間隔,軟間隔,對偶);
求解方法(隨機(jī)梯度下降、擬牛頓法等優(yōu)化算法);
優(yōu)缺點,相關(guān)改進(jìn);
和其他基本方法的對比;
不能停留在能看懂的程度,還要
對知識進(jìn)行結(jié)構(gòu)化整理,比如撰寫自己的 cheet sheet,我覺得面試是在有限時間內(nèi)向面試官輸出自己知識的過程,如果僅僅是在面試現(xiàn)場才開始調(diào)動知識、組織表達(dá),總還是不如系統(tǒng)的梳理準(zhǔn)備;
從面試官的角度多問自己一些問題,通過查找資料總結(jié)出全面的解答,比如如何預(yù)防或克服過擬合。
5、開放問題
由于問題具有綜合性和開放性,所以不僅僅考察對算法的了解,還需要足夠的實戰(zhàn)經(jīng)驗作基礎(chǔ);
先不要考慮完善性或可實現(xiàn)性,調(diào)動你的一切知識儲備和經(jīng)驗儲備去設(shè)計,有多少說多少,想到什么說什么,方案都是在你和面試官討論的過程里逐步完善的,不過面試官有兩種風(fēng)格:引導(dǎo)你思考考慮不周之處 or 指責(zé)你沒有考慮到某些情況,遇到后者的話還請注意靈活調(diào)整答題策略;
和同學(xué)朋友開展討論,可以從上一節(jié)列出的問題開始。
準(zhǔn)備建議
1、基礎(chǔ)算法復(fù)習(xí)兩條線
材料閱讀 包括經(jīng)典教材(比如 PRML,模式分類)、網(wǎng)上系列博客(比如 研究者July),系統(tǒng)梳理基礎(chǔ)算法知識;
面試反饋 面試過程中會讓你發(fā)現(xiàn)自己的薄弱環(huán)節(jié)和知識盲區(qū),把這些問題記錄下來,在下一次面試前搞懂搞透。
2、除算法知識,還應(yīng)適當(dāng)掌握一些系統(tǒng)架構(gòu)方面的知識,可以從網(wǎng)上分享的阿里、京東、新浪微博等的架構(gòu)介紹 PPT 入手,也可以從 Hadoop、Spark 等的設(shè)計實現(xiàn)切入。
3、如果真的是以就業(yè)為導(dǎo)向就要在平時注意實戰(zhàn)經(jīng)驗的積累,在科研項目、實習(xí)、比賽(Kaggle,Netflix,天貓大數(shù)據(jù)競賽等)中摸清算法特性、熟悉相關(guān)工具與模塊的使用。
拓展:面試的經(jīng)驗技巧
重要因素
成功的求職者面試需要帶什么東西?那天我正在面試一個高級職位的候選人,盡管有數(shù)以百計的人選面試此職位,但是我被競爭者和競爭失敗者之間明顯巨大的差異震驚了。這些候選人值得我們考慮他們共有的某些特點:
能量
面試者需要推動。他們通常被困在一個屋子里就是一整天,他們希望候選人能夠帶給他們興奮和靈感。充滿活力地進(jìn)入一個房間要比你保持冷靜地進(jìn)入一個房間好得多。所有艱難的工作都需要很多能量,而重要的是你要表現(xiàn)出你擁有很多能量。
雄心壯志
很少有組織機(jī)構(gòu)需要的只是一雙安全的雙手。很少的公司會積極尋求蠻勇的冒險者,但是每個人都希望他的員工可以推動工作超出它的自然邊界。我們總是在尋找可以給予我們的東西比我們要求的更多的人,尋找對組織和他們自己有雄心的人,尋找能夠說服我們可以達(dá)到兩者協(xié)調(diào)一致的人。
想法
大多數(shù)候選人來的時候準(zhǔn)備好的觀點只不過是根據(jù)自己的猜測準(zhǔn)備的。也就是說他們很仔細(xì)、順從并沒有冒險精神。但是收斂過多的創(chuàng)造力比激發(fā)創(chuàng)造力要容易得多。因此要豁出來,不要猜測,自己思考!很少的老板會對能夠讀懂他們想法的人感興趣。
信心
我知道人們很可能過度自信,但是我?guī)缀踹沒有看過誰這樣呢。相反,大多數(shù)候選人給人留下的印象是躊躇的、謹(jǐn)慎的和充滿恐懼的。但是如果想激發(fā)其他人對你的信任,你需要展示出你自己身上擁有自信。這并不意味著要表現(xiàn)出一幅傲慢的銷售姿態(tài);這并不意味著要因為曾經(jīng)的成績而感到驕傲并興高采烈地談?wù)撨@些成績。
好奇心
我以前曾經(jīng)寫過對你周圍的世界有好奇心有多么重要,但是在面試中,你需要展現(xiàn)這一點。你知道面試的人會問你你是否有問題要問。來的時候準(zhǔn)備一些你對該組織、個人和文化真正好奇的問題,不要留下即興發(fā)揮的機(jī)會。努力思考那些可以展示出你進(jìn)行了調(diào)查并想了解更多的問題。
你會注意到,在這個列表列出的所有特點中,我并沒有提到技巧。那是因為如果你已經(jīng)被選中參加一個面試,你的基本技能已經(jīng)得到認(rèn)可。面試存在的目的就是讓雇主看到簡歷上沒有的東西,確保你能準(zhǔn)確清楚地說出這些東西。
面試準(zhǔn)備
有效準(zhǔn)備
(1)充分了解應(yīng)聘單位。對用人單位的性質(zhì)、地址、業(yè)務(wù)范圍、經(jīng)營業(yè)績、發(fā)展前景、對應(yīng)聘崗位職務(wù)及所需的專業(yè)知識和技能等要有一個全面的了解。單位的性質(zhì)不同,對求職者面試的側(cè)重點不同。如果是公務(wù)員面試,內(nèi)容和要求與企業(yè)公司相差很大。公務(wù)員側(cè)重于時事、政治、經(jīng)濟(jì)、管理、服務(wù)意識等方面。而一位資深人力資源專員說:“面試時,我們都會問求職者對我們公司了解多少,如果他能很詳細(xì)地回答出我們公司的歷史、現(xiàn)狀、主要產(chǎn)品,我們會高興,會認(rèn)為他很重視我們公司,對我們公司也有信心!蓖瑫r還應(yīng)該通過熟人、朋友或有關(guān)部門了解當(dāng)天對你進(jìn)行面試考官的有關(guān)情況及面試的方式過程。以及面試時間安排,索取可能提供給你的任何說明材料。
。2)使自己的能力與用人單位工作的要求相符合!爸褐,百戰(zhàn)不殆”。求職者面試前應(yīng)對自己的能力、特長、個性、興趣、愛好、長短處、人生目標(biāo)、擇業(yè)傾向有清醒認(rèn)識。認(rèn)真閱讀你所收集到的所有信息并牢記它們。盡量使自己的能力與工作要求相適應(yīng)。參加面試時,通過顯示你對知識的掌握和理解來表達(dá)你希望進(jìn)入這一職業(yè)工作的愿望。
。3)模擬可能詢問應(yīng)聘的問題。面試前不經(jīng)過角色模擬,便無法達(dá)到最佳的效果。一些負(fù)責(zé)招聘的人事主管提出,求職者應(yīng)當(dāng)樂意提問題,這樣招聘者才能知道求職者的水準(zhǔn)及想了解的問題。
。4)對可能遇到的問題進(jìn)行準(zhǔn)備。這項準(zhǔn)備有助于認(rèn)清自己真正的想法,有助于在面試的現(xiàn)場能夠清晰的自我表達(dá)。
。5)練習(xí)處理對你面試不利的事情。即使曾有一些不愉快的受挫經(jīng)歷,即使自己曾經(jīng)犯過錯,也可作為一段可供學(xué)習(xí)的經(jīng)驗加以陳訴。務(wù)必用積極的事情抵消消極的事情,最好不要說有損自己形象的話。
注意點
a.提早到達(dá)較為從容;
b.進(jìn)入房間應(yīng)先敲門;
c.坐姿端正,眼神自然,手腳安定;
d.每次答話應(yīng)干脆俐落,不打斷對方談話。
自我認(rèn)知
要自信地應(yīng)對面試,首先要對自己有清楚的認(rèn)識:
。1)寫出幾件自己認(rèn)為可以稱得上成功的事情,并逐一分析這些成就,列出你最主要的幾項技能。
。2)同一件事情,各人有各人截然不同的處理方式,這取決于每個人不同的個性。為弄清自己的個性,可以通過分析成就,用一些形容詞來歸納自己的性格。
。3)確定與你的個性、興趣相符的工作環(huán)境。工作環(huán)境不僅指具體的環(huán)境,更重要的是工作單位的文化背景。一位求職者到一家由幾個工程師開設(shè)的公司面試,她說:“那里給人的感覺就象軍隊,棕色的地毯、黃色的屏風(fēng)、陳舊的家具……我不會在這兒工作的!
心理準(zhǔn)備
面試就好比是一場考試,在測試每個人的能力,也在測試每個人的心理素質(zhì)和臨場發(fā)揮。因此,要成功面試,首先要充滿信心!疤旄呷硒B飛,海闊憑魚躍”。保持良好的狀態(tài),快樂的心情,會大有好處。其次,要抓住招聘者的心。招聘者可能會先評價一個求職者的衣著、外表、儀態(tài)及行為舉止;也可能會對求職者的專業(yè)知識、口才、談話技巧做整體性的考核;還可能會從面談中了解求職者的性格及人際關(guān)系,并從談話過程中了解求職者的情緒狀況、人格成熟度、工作理想、抱負(fù)及上進(jìn)心。
知識準(zhǔn)備
與應(yīng)聘崗位相關(guān)的專業(yè)知識、業(yè)務(wù)技能等要熟知,備上一份求職材料,供招聘者查閱參考。準(zhǔn)備當(dāng)天可能用到的個人資料或作品,攜帶相關(guān)證件,以便在面試過程中進(jìn)一步向招聘者提供有關(guān)自己個人的相關(guān)資料。
體能、儀表準(zhǔn)備
面試前要保證充分的睡眠和愉快的心情,以保持良好的精神狀態(tài),面試前還應(yīng)注意修飾自己的儀表,使穿著打扮等與年齡、身份、個性等相協(xié)調(diào),與應(yīng)聘的職業(yè)崗位相一致。這一點將在以下的內(nèi)容中較為詳細(xì)地闡明。
應(yīng)對面試
一要背熟自己的求職履歷。常常遇到有些求職太過頻繁,而自己的求職履歷則又是經(jīng)過精心“包裝”的人,輪到面試時有時連自己都記不清究竟“工作經(jīng)驗”是怎樣“排列組合”的了,一上陣便迅速“露出馬腳”,不戰(zhàn)自敗。
二要準(zhǔn)備好同所申請的職位相吻合的“道具”。身上穿的、手上戴的、渾身上下的衣著均能反映出求職者對所申請的職位的理解程度。試想如果一家五星級酒店招一名公關(guān)經(jīng)理,而應(yīng)聘者下雨天穿著高統(tǒng)套鞋去面試恐怕同所申請的職位形象相去甚遠(yuǎn)。所以面試時的“道具”也應(yīng)有所選擇。
三要準(zhǔn)備好同自己身份相吻合的語言。每個人都應(yīng)對語言和遣詞用字有所選擇,面試不同于閑聊,張嘴就來,可以不假思索。每句話,每一個詞都應(yīng)有所挑選。如不少不諳世面的求職者參加面試時張口閉口“你們公司怎么怎么”,聽多了肯定會引起別人的反感。應(yīng)該十分有禮貌客氣地說“貴公司”,禮多人不怪嘛!
四要準(zhǔn)備好同選擇的職業(yè)和身份相吻合的行為規(guī)范。面試時的細(xì)小行為最能說明一個人的真實情況,試想一個個人物品雜亂無章,甚至連鋼筆都找不到的人,是很難受到面試考官的青睞的。
【面試經(jīng)驗分享之機(jī)器學(xué)習(xí)、大數(shù)據(jù)問題】相關(guān)文章:
外企面試經(jīng)驗分享09-26
HR面試經(jīng)驗分享08-06
護(hù)士面試經(jīng)驗分享08-03
面試問題之五大“最”07-22
面試經(jīng)驗及心情分享09-25
嘉吉面試經(jīng)驗分享03-03
美的面試技巧經(jīng)驗分享08-03
成功的面試技巧經(jīng)驗分享08-04
大數(shù)據(jù)面試常見問題08-05