摘要:從一場成發開始 最近政大的上學期剛結束,政大數據分析社(NCCU DA)也結束了成果發表,有幸與 Alyssa 社會學半路出家資料科學 、彭其捷Jack 一起擔任評審,在其中看到了很多有趣的作品,卻也看到許多剛接觸數據分析的人可以改進的地方.於是在最後的環節中給了一些反饋。 轉頭一想,這些點也不只出現在學生或者數據分析新手中,許多經常碰到數字的人也會無意識出現這些小毛病,卻會對分析與後續報告造成很大的問題。因此對於大量接觸數字的人、或者做數據分析時,我有五點小建議,這五個點分別是: 避免過度分析,善用機器學習 思考數據資產,要假說而非猜想 在提出策略前,先確保了解問題 確保你的目標明確,通過取捨來思考策略 思考你的建議不確定性,並透過分析來降低這些不確定性 避免過度分析,善用機器學習 分析開始時,一個很常見的問題就是大家在拿到一張表的時候就想要看不同類別之間的關聯。這是一個幫助我們理解數據的過程,但終究不是目的。許多人會在簡報前部分畫許多圖,美其名是探索性數據分析(EDA),但是都跟目標沒什麼關聯,只是抓到數字就拿過來畫圖解釋一番。又或者當欄位眾多時就會對數據表感到乏力,而忘記從假說出發來排序數據驗證的優先級。

看完政大數據分析社期末專案,給數據分析人的五個建議
看完政大數據分析社期末專案,給數據分析人的五個建議
戴士翔 | Dennis Dai

NTU MiIB| Data Scientist @ FAANG,DA mentor @ XChange。曾在FMCG巨頭/日商管顧/MBB管顧/高成長電商從事商業分析與數位轉型,專注分享管顧、商業、數據分析的思考,串連不同領域的數據科學家。分析/演講/合作歡迎來信:dennis.dai.1011@gmail.com