data-science
好豪的 2025 展望:Instagram 經營與 YouTube 頻道!
data-science
featured
data-analytics
如果你喜歡「好豪筆記」的資料科學與職涯經驗分享,推薦你追蹤我的 Instagram 帳號 @hao2huang,它將會是我 2025 知識分享的主力平台。
R 語言還是 Python?給資料科學新手的程式語言選擇指南
python
data-science
python
data-analytics
比起 R 語言,我建議以台灣資料科學職場為目標的新手先專注 Python,在這篇文章,我基於自己涉略資料科學 10 年、同時擁有 R 語言跟 Python 的應用經驗,將先比較兩個程式語言,並説明為什麼更推薦優先學習 Python。
t 檢定與中央極限定理:你真的懂常態分佈嗎?
data-science
data-analytics
statistics
身為一名資料科學家,每次討論到 t 檢定與中央極限定理,學生與同事常會問起關於常態分佈的問題,這個看似簡單的概念,卻常常讓初學者感到困惑。
資料科學家會被 AI 取代嗎?解讀 OpenAI 徵才訊息展望未來
data-science
featured
data-analytics
ChatGPT 崛起對資料科學家職涯造成什麼衝擊?數據分析技能會被 AI 取代嗎?本文深入探討 AI 時代下,資料科學家的角色轉變與未來發展。我們將從 OpenAI 的徵才需求出發、分析資料科學家所需的關鍵技能,如北極星指標、A/B測試、因果推論等,幫助你釐清如何投入數據分析職涯。
北極星指標設計:讓商業直覺與機器學習雙劍合璧 — LinkedIn 的資料科學案例
business-thinking
data-science
data-analytics
LinkedIn 的 Data + Intuition 數據分析框架提供了定義北極星指標的方法,不只活用機器學習、更重視商業直覺,淬煉出能夠真正捕捉產品價值、並能引導行動方案的新指標。這篇文章將詳細介紹 LinkedIn 定義北極星指標的方法、以及如何驅動產品進步。
Naive Bayes 分類模型:簡單卻強大的機器學習基本功 — Udemy 課程心得
data-science
data-analytics
statistics
儘管深度學習模型光彩奪目,Naive Bayes 依然因為它簡單、高效、好解釋而有其地位。本文將介紹 Naive Bayes 為何仍是必備的數據建模基本功、簡介其貝氏統計核心概念如何應用在分類問題、最後也分享我在 Udemy 課程學習 Naive Bayes 的心得。
A/B Test 看到顯著也不能信?小心統計檢定力不足!
data-science
ab-testing
data-analytics
statistics
A/B Test 看到「顯著結果」,就代表實驗有效、應該做出改變嗎? 答案是:不見得!很有可能統計檢定力不足,造成實驗不可信。這篇文章將分享統計檢定力不足會造成什麼 A/B 測試問題,以及如何正確使用 Power Analysis 來分析你的顯著結果。
外商資料科學家/數據分析師,2024 年面試經驗分享
data-science
找工作
data-analytics
interview
這篇文章是 2024 年面試資深資料科學家與數據分析師的經驗分享,以亞洲地區的大科技公司為主,筆者總共投遞了 26 個職位的履歷、實際拿到 2 封錄取信。文章內將分享各公司面試的流程與經歷、以及我學到的新經驗,最後也會簡短聊聊我為何已經人在外商還要出來找工作。
A/B Test 如何設定顯著水準?從 0.05 改成 0.01 算是夠嚴格的實驗嗎?
data-science
ab-testing
data-analytics
statistics
這篇文章將會探討 A/B Test 如何設定顯著水準來維持實驗可信程度,回答「從 0.05 改成 0.01 算是夠嚴格的 A/B Test 嗎?」。本文將介紹偽陽性率,它與顯著水準、統計檢定力、以及決策品質的關聯,並學習如何透過控制偽陽性率來為 A/B 測試結果選擇適當的顯著水準。
倖存者偏差,怎麼在數據分析中避免?居然還有死者偏誤!
data-science
data-analytics
statistics
要在資料科學領域深耕,除了要懂統計理論以外,擁有偵測出資料偏誤的嗅覺更是必備能力。這則筆記將分享極其常見的倖存者偏差、以及與其相似的「死者偏誤」與右設限資料,我將用圖表介紹這些偏誤的意義與真實案例,並分享該如何用漏斗分析避免倖存者偏差、用存活分析來正確計算右設限資料。