快轉到主要內容

data-science

從《天堂 M》手遊機率爭議學會二項式檢定與 P-value 解讀
data-science python statistics
2021 年,一位知名實況主在手遊中製作機率性寶物,475 次花費製作只有 11 次成功,遊戲公司卻宣稱成功率有 10%,你相信嗎?統計檢定可以解決你的疑惑!這篇文章將介紹二項式檢定如何檢驗抽獎成功率,並且帶你一步步計算 P-value、學會清楚解讀 P-value。
Python Pandas 的長資料與寬資料轉換
python data-science pandas python data-analytics
這則筆記將跟你分享為何區分長與寬資料能讓你的資料科學工作更有效率,並且教學 Python 的 Pandas 套件裡面好用的長寬資料轉換函式:stack()、unstack()、melt()、pivot(),也說明該如何選擇該用哪一個函式,讓你流暢地重塑資料。
圖解信賴區間,兩種常見的錯誤解讀
data-science featured data-analytics statistics
你知道信賴區間的 95% 機率是指什麼嗎?你也知道標準差跟標準誤哪裡不一樣嗎?這篇筆記不會寫任何艱澀的數學公式,將用圖解還有白話的方式介紹信賴區間信心水準以及標準誤常被解讀錯誤的觀念,並且為你釐清標準差、標準誤、與信賴區間寬度的關係。
2021 年,外商資料科學家求職經驗分享
data-science 找工作 data-analytics interview
這則筆記包含橫跨新加坡、泰國、還有台灣的外商資料科學家面試經驗,著重在數據分析與產品分析相關職缺。本文介紹面試最重視的三大面向:數據指標、溝通能力、統計學專業知識,以及你非知道不可的面試題目,我將分享我的學習方法與資源。
不只是敲鍵盤:Coding Interview 請別忘記「溝通」
data-science 找工作 interview
Coding Interview 除了考程式與演算法,「溝通」也是技術面試裡非常重要的檢驗項目。這則筆記將分享我找資料科學工作的面試經驗、介紹為什麼 Coding 面試需要溝通、並教學技術面試不得不注意的三項溝通要點。
多重檢定問題:一定會有人中樂透
data-science ab-testing data-analytics statistics
看到有人中獎、不代表他特別幸運。這篇文章將從樂透彩的機率計算出發,和你分享什麼是多重檢定問題,他到底跟樂透、A/B Test、或者探索性資料分析有什麼關聯,並且介紹用來解決多重檢定問題的 Bonferroni 校正。
資料科學競賽,能獲得什麼?
data-science kaggle
只要你對資料科學或機器學習有興趣,想必聽過 “Kaggle” 資料科學競賽平台,但是,你知道到底為什麼資料科學家們都熱衷於參加競賽嗎?這篇文章將以筆者個人參賽經驗為出發點,帶你了解參加資料科學競賽的好處、以及如何著手準備競賽。
2021 年 Tomofun 狗音辨識機器學習競賽,第 10 名作法分享
data-science kaggle python
Tomofun 狗音辨識 AI 百萬挑戰賽,主題是運用機器學習來辨識居家環境中的聲音,我最終取得了第 10 名的成績。這則筆記裡,我將說明如何用深度學習進行音訊辨識,並且介紹我所研讀的論文中,運用了哪些技巧幫助我提高音訊辨識準確度。
比例資料的 A/B Test 該用卡方還是 Z 檢定?
data-science ab-testing r-language data-analytics statistics
這篇筆記會教學比例資料的 A/B Testing 究竟該用什麼統計檢定,我將會介紹 Z 檢定與卡方檢定之間的關聯,以及什麼情況下這兩者都可以使用。我也分享了 R 語言程式碼,幫助你學會如何算出 Z 檢定與卡方檢定的 P-value。
2021 年玉山銀行中文手寫影像辨識競賽作法分享,以及手寫文字圖片合成基本教學
data-science kaggle python computer-vision
2021 年春夏,我與隊友們參加「你,識字嗎?玉山人工智慧公開挑戰賽 2021 夏季賽」,取得了第 20 名的成績(Top 4%)。在這則筆記裡,我將寫下我的競賽解法、以及得獎者的解法,並且用 Python 教學這次比賽的重要技巧—手寫文字圖片合成。