Google Colab 是讓你用網頁瀏覽器就能寫 Python 程式並執行的超讚平台,除了提供強大運算資源、還有免費的 GPU 可以用,你是資料科學家的話肯定會愛它!這篇文章分享我超愛 Colab 的 5 個理由,希望能推坑你一起使用這個好工具。
數據分析
-
-
好奇心會殺死貓,也會害到你的 A/B Testing 結果喔!這則筆記將分享執行 A/B Testing 不得不知道的 Novelty 與 Primacy Effect 問題,讓你了解為什麼顧客的「好奇」與「守舊」傾向會影響 A/B Testing 判讀,並介紹怎麼解決這些問題。
-
想要釋放 Pandas 的強大威力,你不能不會 Lambda 匿名函式的運用方法!Lambda 匿名函式將會幫助你寫出更專業好讀的 Pandas 程式碼、並且更高效率工作省去多餘的打字時間。這篇文章將用五個案例分享 Pandas 內 Lambda 函式的超實用使用技巧。
-
如果你還不了解標準誤與標準差有什麼差別,也不熟悉還有樣本數會如何影響標準誤,這篇文章將幫助你徹底學習!本文將從四種不同角度帶你認識標準誤,除了白話解釋與圖解,也附上 Python 程式碼讓你可以親手玩玩看、培養標準誤的統計直覺。
-
這篇文章將簡介因果推論(Causal Inference)這個研究領域,用範例說明分析因果關係的三大困難點:混淆變項、自我選擇偏誤、以及反事實,並且介紹因果推論方法怎麼解救沒辦法 A/B Testing 的情境、還有如何用資料科學創造「平行世界」!
-
Pandas 的 Method Chaining 是「一行只有一個資料處理動作」的程式碼寫作風格,讓你的 Pandas 程式碼更簡潔、更好讀、更好維護。這篇文章將分享在資料分析中超常用的幾項 Method Chaining 運用技巧,強化你的 Pandas 實力。
-
這則筆記將跟你分享為何區分長與寬資料能讓你的資料科學工作更有效率,並且教學 Python 的 Pandas 套件裡面好用的長寬資料轉換函式:stack()、unstack()、melt()、pivot(),也說明該如何選擇該用哪一個函式,讓你流暢地重塑資料。
-
你知道信賴區間的 95% 機率是指什麼嗎?你也知道標準差跟標準誤哪裡不一樣嗎?這篇筆記不會寫任何艱澀的數學公式,將用圖解還有白話的方式介紹信賴區間信心水準以及標準誤常被解讀錯誤的觀念,並且為你釐清標準差、標準誤、與信賴區間寬度的關係。
-
這則筆記包含橫跨新加坡、泰國、還有台灣的外商資料科學家面試經驗,著重在數據分析與產品分析相關職缺。本文介紹面試最重視的三大面向:數據指標、溝通能力、統計學專業知識,以及你非知道不可的面試題目,我將分享我的學習方法與資源。
-
看到有人中獎、不代表他特別幸運。這篇文章將從樂透彩的機率計算出發,和你分享什麼是多重檢定問題,他到底跟樂透、A/B Testing、或者探索性資料分析有什麼關聯,並且介紹用來解決多重檢定問題的 Bonferroni 校正。
- 1
- 2