如何找資料科學實習?用漏斗分析思考!沒相關工作經驗也能做資料分析

by 好豪
Published: Updated:

要找到好的工作機會通常競爭都十分激烈,有許多同學會從在學期間就開始累積實習工作經驗,讓自己畢業後更有競爭力能爭取到理想的職缺。然而,在資料科學領域,好的實習機會的競爭程度並不亞於找正職工作,甚至有些資料分析實習職缺,會要求同學要有相關經驗才有機會錄取,但我們都是沒有經驗才會來找實習啊!這種矛盾究竟該怎麼解決呢?我將在這篇文章跟你分享。

想找資料科學實習累積經驗
卻有公司要求要有經驗才能錄取實習
你也曾困惑過這種矛盾嗎?

筆者好豪在大學畢業以前,就累積了三份實習經驗,這還不包含在校內的多項資料科學專案,我將在這篇筆記分享我的經驗,用「漏斗分析」的思維,一一解析從尋找職缺、整理履歷、到挑戰面試的各階段該怎麼準備才更有效率,希望幫助正在大學、或研究所就讀的你,更順利地找到資料科學或數據分析的實習工作。

找實習的漏斗分析

漏斗分析 是探索一系列有順序的行為與事件如何導引到一個特定目標的分析方法,漏斗分析的關鍵是轉換率(Conversion Rate),意思是我們會探討:

  • 完成事件 1 之後、繼續完成事件 2 的比率有多高
  • 完成事件 2 之後、繼續完成事件 3 的比率有多高
  • 完成事件 3 之後、繼續完成事件 4 的比率有多高
  • 以此類推

因為此分析法要求事件或行為是有順序的,通常時間點後面的事件,完成總數會越低,這個總數越來越低的自然現象透過資料視覺化繪製長條圖之後,會像漏斗一樣越來越窄,因此被稱為漏斗分析。

為什麼要介紹漏斗分析呢?因為找資料科學實習也可以用漏斗分析來思考!

尋找資料科學實習的過程,可以分解成一系列有順序的行為:

  1. 尋找實習職缺
  2. 投遞履歷
  3. 應徵面試
  4. 成功錄取

根據上面的定義,我們漏斗分析的特定目標是「成功錄取實習」,而邁向這個目標的系統化方法就是提高每個階段的轉換率,換句話說,只要提升每個階段漏斗的寬度,漏斗終點的寬度—實習錄取成功率—也將提升!反過來說,要是你在漏斗某個階段的轉換率特別低,它將成為瓶頸、摧毀你在其他階段的努力,造成最終的錄取率下降喔!

運用漏斗分析思考找實習的每個階段該努力什麼
才能有系統地提升錄取資料科學實習的成功率

接下來,我將以我的經驗,一一分享該怎麼增加找實習這個漏斗每個階段的成功率:

  1. 尋找實習職缺 ➞ 放寬實習機會的定義、擴大視野
  2. 投遞履歷 ➞ 提煉出自己的精華經歷
  3. 應徵面試 ➞ 把握好學校就學得到的基本功

睜大眼睛尋找實習機會

資料科學的實習機會,比你想像中的多
只要你運用想像力來擴大視野!

我以前是這麼尋找資料科學實習機會的:每天打開求職網站、或者 Facebook 的找工作相關社團,拼命滑手機關注有沒有「資料科學實習」關鍵字的新徵才訊息。如果你的作法跟我一樣,很快就會覺得資料科學相關的實習機會好少,或者,覺得好的實習機會跟演唱會的門票一樣會「秒殺」、晚一點看到就已經應徵額滿。事實上,不是實習機會太少,是這種找實習作法的範圍太窄!

首先,我們不用拘泥於「資料科學」這個頭銜的實習職缺,重點在於工作內容會不會包含資料分析。未來在找正職工作的時候,你的未來主管不會只看你的實習頭銜是否有資料科學關鍵字,而是會進一步看你在實習工作內究竟做過什麼跟資料有關的事。你可以找一份跟 Facebook 行銷有關的 社群小編 實習工作,即使你的頭銜不是資料科學家,你未來還是可以在履歷強調你透過資料分析出數位廣告各個渠道的成本效益差別、或是你用自然語言處理技巧找出更有效的貼文策略,只要你找到的實習工作有機會讓你用資料解決問題,這對於你未來找資料科學正職工作無疑是直接加分的。

苦苦找不到資料科學實習機會?
我也想和《3年A班》這部日劇的主角一樣大喊:
「請用想像力!」

放寬實習機會的定義也是拓展職缺搜索範圍的方式。想要累積資料科學經歷,並不只限定於企業實習,在校園也有很多值得學習經驗的好機會。在大學的每個學院或系所,都有可能需要有統計分析技能的同學來擔任專任或兼任助理,協助教授進行研究,這就是磨練自己的好機會,就以下面圖片這則 台大心理系的徵才訊息 為例:

在校園尋找統計分析工作機會的範例
(資料來源:2023 年 6 月,台大心理系,請注意,原徵才訊息隨時可能因徵才到期而移除)

看到徵才條件包含了統計、R 語言、Python、還有 實驗設計 等等,這每一項幾乎都是成為資料科學家的必備技能啊!要是能透過在教授的實驗室工作練起這些技能,有什麼資料科學經歷比這更寶貴呢?

此外,想要在校內擴充自己的資料科學實戰經驗,不見得要限定尋找支薪工作,專題研究也會是寶貴的學習機會。筆者好豪大學時,主動和校內的教授聯絡,詢問他是否願意指導我專題研究,並有幸獲得加入實驗室的機會,透過專題研究,我不只累積了許多寫程式、跑統計軟體的經驗,最後研究成果更成為我的作品集之一,畢業後我在 找正職工作面試 的時候,這些資料分析經歷總是能吸引面試官目光、讓我能和他大聊特聊。

找到更多適合的職缺就能有更多投履歷的機會,而專注找數據分析工作內容、不拘泥於「資料科學家」的實習頭銜,不只擴大你的視野、能發掘更多值得嘗試挑戰的職缺,若是你找到的資料分析實習或研究機會是跟你在校就讀的科系有關,也將提高你錄取的機率!


無業配、單純是忍不住要在此分享,中研院的資訊科學研究所每年都招募暑期實習生,我曾經是其中一員,不只磨練了許多資料分析技能、認識尊敬的研究員們以及志同道合的實習同仁,更讓我對資料科學這個領域增加了許多熱情!十分推薦給對資料科學有興趣並且還在校就讀的你參考。雖然是暑期實習,近幾年都是年初的 2 月就開始申請,有興趣的話請及早準備囉!

2023 年中研院暑期實習公告頁面連結(每年網址將會不同,請自行關注最新公告)。


把經驗萃取成履歷

不要太執著於過去沒有工作經驗
其實你有資料科學經驗!你只需要整理好你的故事

曾有很多同學問我,因為過去沒有資料科學實習經驗,履歷不知道該寫什麼,到底該怎麼辦?通常,只要多聊兩句後就會發現,其實他們的確有相關經驗、不是沒東西寫進履歷,而是不知道該怎麼寫。

會在乎「怎麼找資料科學實習」這個問題的人(是的,包括正在閱讀的你 ʕ •ᴥ•ʔ ),大多已經不是第一次接觸資料科學這個領域了,或許曾經修過統計學的課、在社團負責整理財務報表、又或者常常用 Excel 來處理生活中大大小小的資料問題,這些都可以算是資料科學經驗,只需要你整理好你如何與資料科學邂逅的故事、就值得寫進履歷了!

一個常見的技巧,是善用 STAR 架構來寫清楚自己的經歷或專案,我在 這篇文章 對 STAR 架構有更完整的介紹,這裡我先將這個技巧簡述成三個重要動作:

  • 說明這個專案打算解決什麼問題
  • 你採取了什麼行動來解決問題
  • 你的解決方案創造了什麼成果

我想以在網路上找到的某一份 統計學期末報告 來舉例,我並沒有詳細閱讀與驗證這份報告,單純是擷取特定結論,分享課堂上的報告可以如何寫成履歷、或者面試中可以談論的經歷:

  • 問題:驗證「吃早餐對大學生之學習表現有幫助」的假設
  • 行動:設計並蒐集問卷,進行吃早餐花費金額與學習表現的相關性分析
  • 成果:
    • 發現並不是早餐花費越高,學習表現就一定越好
    • 年級越高的學生,平均早餐花費金額也越高

在履歷上寫下這段,目標是明確讓未來主管看到自己有「問卷調查」以及「相關性檢定」等技能。更重要的是,之後如果有機會進入面試關卡,你在履歷上寫了什麼、那就會是面試討論的內容,所以,你需要先想好,你的經歷對公司(或產品)可以有什麼幫助、強調你可以怎麼為團隊貢獻。舉例而言,假設我是這份報告的作者,我會想在面試的時候主動分享

  • 「我的研究發現,並不是花越多錢吃早餐、對學習表現就越好」
  • 「我認為這份研究成果可以幫助公司節省員工福利成本
  • 「若能加入公司實習,我能夠協助進行公司福利支出與員工表現的相關性研究」
  • 「只要驗證『降低目前公司福利支出,員工同樣能有良好表現』的假設,公司將能成功節省成本」

或許這些舉例很天馬行空,就算錄取實習也不見得能真的做到,但你發想這些延伸議題的目的是讓未來主管知道:我具有把資料科學應用在實際問題的思考能力,我想幫公司解決問題,而不只是埋首課本的小書蟲。

(延伸閱讀:實踐價值溝通,不只說自己的經歷多專業、更要強調它對團隊帶來什麼價值)

運用你的想像力!不管是課堂報告還是生活瑣事,只要你是用資料科學來解決一個問題、創造出改變,它都可以寫成值得放在履歷裡的專案、成為陪伴你實習求職旅途的好故事。履歷寫得豐富,也才更有機會攻進面試關卡。

準備好面試的基本功

面試會遇到的挑戰五花八門
至少,你「應該知道」的事情,要做好 100 分的準備

我在大學還有剛出社會的時候也曾覺得準備面試好辛苦,問題與知識永遠準備不完,現在回想,我認為我犯的最大的錯—也是很多人會犯的錯—就是沒有花最多心力在「基本功」,我將從技術與專業面試來說明這一點。

資料科學的技術面試包括統計學、程式設計、機器學習等等知識,通常大家會害怕資料科學知識範圍無遠弗屆,隨機森林、A/B 測試、甚至現在正夯的 ChatGPT 與 LLM 模型等等,要是每個都要精讀演算法細節、背熟算式、或者論文一篇篇翻出來看,怎麼可能看得完!在我的面試經驗,非常深入的資料科學知識或者統計模型的數學性質細節確實不需要樣樣精通,「為什麼」要用某個資料科學方法的應用層面問題,才是技術面試的關鍵。

舉例而言,筆者好豪大三的時候曾經面試某間新創公司的資料科學實習工作,當時面試官問我「資料如何分群分析」,我興奮地跟她談論自己在校擔任研究助理時運用過的 多階層模型,介紹自己如何自學 Stata 軟體、將資料依照國家與族群分群分析、驗證了什麼社會學的假設等等。面試官對我的回答內容有興趣,便問了一個延伸問題:「聽起來這項分析需要事先知道每筆資料屬於哪個群體,但要是我們不知道資料屬於什麼群體,又該怎麼分群呢?」,當下,我答不出來。

也許看到這個問題的你很快就想到,這是 非監督式學習 能處理的情境,即使這個延伸問題要討論的內容非常基本,但當時的我知識廣度不足、面試準備方向也不正確,所以答不出來。就算我熱衷於我喜歡的資料科學方法、上述的多階層模型我可以侃侃而談該怎麼設計研究以及背後的貝氏統計運算,我卻沒有把握好我應該知道的基本功、沒有掌握資料科學在不同情況該怎麼應用的大方向問題(Big Picture),最後,面試當然是沒有錄取。

我在剛開始找資料科學實習的時候
連「非監督式學習」這個詞都講不清楚
希望你不要跟我犯一樣的錯!
(圖片來源:Wikipedia

透過自己的例子,我想強調的是,如果你能成為某個領域的專家當然很好,然而資料科學實習面試很重視基本功,面試會考驗未來的實習生知不知道如何判斷與選擇資料分析方法來解決問題,而不是計較於是否精通統計模型的公式、是否知道哪個演算法最厲害等等細節。

在此,提供一個小練習幫助你學習掌握大方向:請拿起你已經讀過的任何一本統計學與機器學習課本,翻開目錄、閱讀每一則大小章節標題,然後問自己:

  • 這個章節在說什麼?
  • 這個章節為什麼重要?
  • 這個章節跟上一個、還有下一個章節,有什麼關聯?

在我的求職經驗中,統計與機器學習技術面試出現過的問題,至少 50% 都是用上述這個自問技巧會練習到的,也就是說,這項練習對準備面試有直接的幫助!而且這個練習不要求你額外看論文或技術文章,單純專注在你在課堂上學過的知識,呼應這個小節一開始就提到的:練好基本功、把你「應該知道」的事情準備到 100 分。

(補充:上述這項「閱讀目錄」的練習,來自我在大學時學到的《雪球速讀法》,如果你有興趣,歡迎閱讀我的 速讀技巧筆記

結語

找資料科學實習的過程,就像漏斗一樣、各階段環環相扣,要懂得多方找職缺才有更多機會投履歷、整理漂亮的履歷更可能受邀面試、把最基礎的知識唸得扎實才能通過面試、最後錄取。希望這篇筆記介紹的漏斗分析思維,能幫助努力找資料科學實習的你,不需太糾結於「沒有相關經驗」,而是診斷自己還沒拿到實習的癥結點在哪個階段,然後對症下藥!

最後,如果你已經在本文提及的每個面向都盡力了,還是找不到實習怎麼辦?千萬不要妄自菲薄!沒有錄取實習的理由太多,連景氣不好造成的實習機會太少都是一種可能的理由,我們能做的只有繼續努力,下個實習機會出現的時候,想辦法不要讓它溜走!


這篇筆記主要想幫助還在校就讀、想找實習的同學們,若你對資料科學的職涯發展有更多興趣,歡迎你閱讀我寫過的其他文章:

熱愛資料科學的讀者請繼續關注本部落格或追蹤 Facebook 粉絲專頁,未來我會寫更多資料科學面試與履歷撰寫等等心得文章。也可以點選下方按鈕,將本文分享給正在往資料科學家邁進的朋友!

推薦閱讀