F2P Data|選擇 BA 線上課程 & 第一堂 Python 課

Jeff, Lu Chia-Ching
10 min readJul 9, 2019

2018年中,為了要申請 Business Analytics/BA/MIS 碩士,我就開始 Data Science/Business Analytics 的自學。但身為一個大學不太碰數學,只有基礎統計和 R 知識的商院人,一開始面對滿滿的學習資源真的很選擇障礙…。我相信隨機挑一個課程,效果都不會太差,但最重要的是:如何最快最有效率的幫助我的 MS 申請也增加我的 BA 能力?

Photo by Clément H on Unsplash

本文適合對象

這篇主要分享當時選擇線上課程的心得和 Python for Everybody on Coursera 課程,適合同樣剛進入這個領域的初心者。必須先說,同樣身為新手,我選擇在自己也非完全理解的階段就分享,是希望我能在還記得入門者的感受、困惑下,能趕快紀錄起在這階段我覺得有價值的觀點想法。(如果有任何指教或想補充的,歡迎留言或直接敲我 Linkedin 囉 : ) )

有關選擇課程的研究

由於我當時要一邊練英文一邊弄申請的到處跑,所以很自然地就想到靠線上課程入門 Python。但能彈性上課的 MOOC 課程卻又有另一個課題,那就是 Coursera、Udemy、edX 這些 MOOC 平台都有超大量的程式課程 (光在 Udemy 超過4.5顆星評價的 Python 課程有接近4000個!),更不用算其他 Datacamp、Dataquest、Treehouse…等等專業機構。所以再真正開始學 coding 之前,我就決定首先確定自己要什麼,再來花點時間研究各類課程/平台的優缺點。

在 Udemy 超過4.5顆星評價的 python 課程有接近4000個!

目標確定是非常重要的事, 就像我相信大部分學 programming 的人都是想要轉職,但也一定有看到這篇文章的人是單純學興趣或還只是在找方向,所以不隨波逐流的 Learning with purpose 是線上學習一定要有的觀念。

“嘗試新方向”也可以是一種目標!

我再次確定目標是 “精實又有彈性的 Python 課程,並且能在申請 profile 上加分”,就決定要找美國大學的線上課程來上。理由很自然的就是大部分大學的線上課程都有提供結業的 certificate 可充實自己的履歷,也有從入門到進階的不同學程讓學生比較有系統的學習。這樣的邏輯讓我先放棄了大多數人以"實用"為目的的學習方式,因此我先排除了 Udemy, DataCamp 這種平台

另一方面,“準備作品/做 project” 這件事雖然也很吸引人,但最後還是先被我放棄 (時間心力上的投入有太多不確定因素,且也不確定自己適合這樣硬幹),不然主打 project-based、純文字形式的 Dataquest 應該也會非常有趣,甚至直接找個 Kaggle challenge 來做更快,也許等之後有機會再來試試。

主打 project-based 的 Dataquest

題外話一下,MOOC 對申請 Master 的幫助其實非常的迷,根據個人經驗和網路資訊來看是沒有一定的實質影響力,但若用直覺去想"工作外再進修學習" 來證明對某領域真的有興趣,確實可以讓申請者的 Profile 更有說服力!

p.s.1 某些特定科系(e.g. CMU MSIM BIDM) 會要求若非大學念相關科系,需要申請前先修一些具有 “學分數” 的程式課程;2019 UCLA 的 MSBA 線上說明會也有提到希望申請者主動列出修過的MOOC課程,甚至建議要有比較進階(非 intro 類)的課程經驗
p.s.2 在美國,從 MOOC 拿到的 certificate 或 online degree 都算是 post-secondary education (大學/碩士學歷也屬於這種),所以都能主動跟申請學校表明自己有修線上課的經驗,只是在填寫申請資料階段要標明課程到底是有 certificate (只有證明) 或是 degree (有各科目成績的 transcript)

在比較課程階段,我找了各種分享不同課程心得評價的文章/網站去做比較。我有把不錯的資源連結放在文章最後,但建議大家可以在比較課程之前先看過這篇文章想想,到底自己是適合上線上課程或是自己直接做專案。

Why I abandoned online data courses for project-based learning

第一堂 Python 課 UNM — Python for Everybody on Coursera

最後,我選擇投入了 UMN 密西根大學的 Python for Everybody (P4E) Specialization。大致理由可歸類如下:

Python for Everybody Specialization 的第一堂課
  1. P4E 在許多課程評論網站文章中都有超高的評價和分數,除了在 Coursera 本站上平均拿 4.8顆星外,在 MOOC 課程評論網站(e.g. Class Center )也拿超高分數。
    p.s. 上過一些線上課程後,我自己有個挑課程的經驗,就是 Coursera 上拿低於4.5顆星的課程通常會有些課程設計或系統問題,所以建議在挑選課程或 specialization 時,可以把評分門檻標準拉高 (放在課程首頁的評論基本上看不到什麼實質有用的 review,通常要到課程內的論壇才會有些討論,所以有時間還是推薦直接用試用期上上看)
  2. 這個 specialization 是一連串包含5個不同科目的系列課程,含括最基礎的安裝 Python、簡易資料結構、網路爬蟲到使用資料庫 (SQL),比起一般只有5周內容的單一堂課還要完整。雖然感覺範圍超大,但內容非常平易近人,很適合跨領域、完全無經驗者。
    舉例,這系列的其中一個優點是,新手不須要太多先修知識、技術才能開始學習。除了上課工具是 Python 3,安裝容易且不須考慮新舊版本外,課程用的交作業/考試方式也非常直覺簡單,不用花太多時間在版本設定或安裝軟體上。這點也許感覺還好,但當你上過其他需要你先設定不確定之後用不用的到的 Github 或調整 package / Jupiter notebook 版本的課程,就能很明顯感受到這堂課的友善程度。
    p.s. 儘管這些是該具備的能力且實務上會不斷碰到,但一開始太多設定只會讓學生卻步,會有種花了許多心力卻看不到實質成果的無力感。當我在其他進階課程搞系統或 package 的事情可以整天都沒有進度,我會回想、感謝這個 specialization 沒有讓我先體驗這種痛苦…
  3. 此外,這堂課的硬體品質很不錯,不但老師講話收音清楚,教學素材也很齊全,可以很方便的取得課程簡報、製作筆記。課程教授 Chuck 也是難得一見的好老師,說話非常有魅力也很有趣,看得出在製作課程上很有熱忱 (不是每個講師都是這樣哈哈…)且教學資源(助教/系統維護)很夠力。
    p.s. 如果覺得老師講太慢,建議直接用1.5x倍速去聽
  4. 選擇這堂課的另一個好處是除了它的內容本身偏向資料處理,UMN 也有一個緊接著的 data science 相關 specialization 叫 Applied Data Science with Python,內容是運用 Python 去做各種 DS 操作。雖然說是不同老師群,但這兩個系列非常符合我的方向 (e.g. 在申請階段先完成第一個 specialization,之後再抓時間上進階課程)
Chuck 老師這樣介紹 Python

由於這堂課本身非常完整,在學習上應該不會有太大的挫折或問題。不過若同樣是用 Coursera 上課的人可以記得,若對 Cousera 系統或課程有任何一點疑問,都記得要上 Discussion Forum 去查一下,大部分上面的討論都是你可能碰到的問題 (交作業系統問題、作業是否有 bug…),甚至有更多額外補充或資源會分享在上面,這在其他更進階的課程學習上非常有幫助,會比一開始就直接去查 documents 更有效率!

Discussion Forum 依課程區分討論區,非常能幫助學習

總結

總體而言,我非常滿意 Python for Everyone,它的課程編制和低門檻要求,讓這系列上起來壓力不大,也適合每天拿下班時間當作培養興趣或聽新知識的去學。雖然在第五堂 Capstone 的課程不太像前面幾堂按部就班的學習,會有點沒方向感,但整體的學習體驗還是非常不錯,邊處理申請邊上課大概花了我4個月的時間。

MOOC 一直以來都有低完成率的現象 (雖然用 drop out rate 去衡量課程好壞不太準),我自己也有沒上完課的經驗 (JHU 的 R…),所以衡量課程適不適合自己比很多人想像中的重要。

我認為第一堂課應該以追求能有餘力上完並學到知識,而不用把課程的進階/深入程度當作是一個參考指標。等真的有興趣有基礎了,再自己去探索下一堂進階課或是不同的學習管道。

補充

  1. UMN 前陣子又開了一個新的 Python 3 Programming Specialization,內容比 P4E 還要再深入一點,如果有其他程式經驗的人也可以直接試試
  2. Python for Everybody 目前有把全部教學內容都放在 Youtube 上 (看起來跟 Coursera 有點不同),可以先試試看 (https://youtu.be/8DvywoWv6fI)

以下是當初有參考到的評論文章或網站,有時間真的建議慢慢看:

  1. The Best Intro to Programming Courses for Data Science — Class Central Career Guides by David Venturi
  2. The top Machine Learning courses for 2019
  3. Why I abandoned online data courses for project-based learning
  4. The best Data Science courses on the internet, ranked by your reviews

F2P Data 系列下一篇應該會是 Intermediate-level 的 Specialization 介紹,並會包含比較多更細更 specific 的課程心得。若有任何想法或回饋,歡迎留言或直接敲我 Linkedin 囉!

Congrats and Thanks for reading through all of it. Feel free to press clap as many as you want : )

Jeff

--

--