快轉到主要內容

data-science

R 語言自學資源分享:從入門到資料科學實戰
data-science featured r-language data-analytics machine-learning online-course self-taught
R 語言一直是幫助我提高分析產能不可或缺的工具,統計模型、機器學習、網頁爬蟲等等無所不能。這篇筆記整理出我讀過後,覺得特別有收穫、而且適合自學的教材,包括書籍、線上課程、以及練習題,希望讓更多人知道 R 語言厲害之處。
A/A Test:商業實驗不能忘的前置動作
data-science ab-testing python data-analytics statistics
A/A Test 是 A/B Test 上線執行以前的重要前置準備,這篇筆記將與你分享 A/A Test 檢測的兩個重要項目:流量隨機分配檢驗(Sample Ratio Mismatch)、以及偽陽性錯誤檢驗,並且附上Python 程式碼讓讀者能一起學習實作。
是不是常態分佈?Q-Q Plot 一看就懂
data-science r-language statistics
我們進行許多常見的統計分析之前,檢驗資料「是否符合常態分佈」都是必要的動作。本文將介紹一種檢驗資料是否為常態分佈的視覺化方法:Q-Q Plot,除了說明 Q-Q Plot 到底該怎麼看、也附上 R 語言程式碼教學如何製圖。
2021 年 AIdea 機器學習競賽,動態足壓影像辨識,Top 5% 作法分享
data-science kaggle deep-learning computer-vision
AIdea「動態足壓影像辨識」競賽,要用機器學習分析腳掌圖片、預測特定座標點,我在這場賽事裡達到第 18 名的成績,這篇心得筆記將介紹我使用的深度學習模型、並且分享我實驗後發現對提升預測準確度很有用的幾項數據分析技巧。
Data Augmentation 教學:Image + Keypoints 同步資料增強
data-science kaggle python computer-vision
有些機器學習的影像分析任務,不只要辨識圖片是什麼,還需要同時找出物件「在哪裡」的位置資訊。這篇教學將帶你快速認識在 Python3 進行資料增強好用的 Albumentations 套件,並且把教學如何讓圖片與標註點同步進行資料增強(Keypoints Augmentation)。
Shopee Code League 2021:數據分析問題解法與 Union-Find 演算法教學
data-science kaggle algorithm
Shopee Code League 2021 是蝦皮購物舉辦的全東南亞線上資料科學競賽,在這則筆記,我將分享第一週 Data Analytics 賽事 Multi-Channel Contacts 的競賽心得:介紹 Union-Find 演算法、以及它如何又快又準確地解決這次的數據分析難題。
北極星指標:把「賺錢」從口號化為行動的橋樑
business-thinking data-science growth-hacking product-manager
北極星指標是產品成功的關鍵數據,用於指引產品開發方向、為團隊的每項任務賦予價值。本篇筆記將介紹北極星指標的基本觀念:透過思考框架,把「賺錢」從口號化為行動。並且將以 Spotify 為範例,說明北極星指標在實戰中如何活用。
最讚的 PyTorch 免費初學課程,由臉書 AI 團隊教學! — Udacity 課程心得
python course data-science pytorch deep-learning self-taught
Udacity 的 Intro to Deep Learning with PyTorch 是由 Facebook 的人工智慧團隊開設的免費線上課程,精美動畫教學加上滿滿的程式實作習題,很適合想好好練習 PyTorch 實踐深度學習的學生!
一張疫情圖表,學會《Google 必修的圖表簡報術》的設計師思維
book data-science data-analytics data-visualization
一張金融時報的疫情圖表,2020 年 3 月新冠肺炎疫情迅速蔓延時於各大新聞網爆紅,我認為這張疫情圖表是最佳的資料視覺化範例之一,它包含《Google 必修的圖表簡報術》這本書提及最重要的幾項技巧。這則筆記將整理出這張疫情圖表值得注意的細節、以及作者展現的設計師思維。
Sequential Testing:只需要加減法的 A/B Test?
data-science ab-testing python data-analytics statistics
專門提供商業實驗的 Optimizely 研發 New Stats Enigine 來加速實驗流程、又能維持決策準確率。本文將介紹機率理論相似、但是更簡單的方法:Sequential A/B Testing,它不止允許偷看數據、需要的樣本數比標準假設檢定還少、檢驗甚至只需要加減法!