你是一位想要進入數據科學領域的數據分析師嗎?如果是的話,這篇文章就是為你準備的。
許多人開始從事數據分析,因為這個領域的門檻相對較低,但隨著經驗的增長,他們會發現自己想要挑戰更技術性的工作,深入了解機器學習,或者提高自己的收入潛力。從數據分析師轉型為數據科學家可以是一個明智的職業選擇,但這需要正確的策略。
如果你是第一次來這裡,我叫 Marina。我是一名在亞馬遜 (Amazon) 的應用科學家,曾幫助過許多人轉型進入科技領域,包括那些來自非傳統背景的人。
在這篇文章中,我們將涵蓋你需要知道的一切,以成功從數據分析師轉型為數據科學家:
你需要發展的技能
我最喜歡的學習資源
獲得面試和工作機會的策略
讓我們開始吧,首先要決定這個轉型對你來說是否是一個好主意。
角色比較
在我們開始之前,讓我們先確認一下數據分析師和數據科學家之間的區別。
數據分析師專注於使用結構化數據來推動商業決策。他們的工具通常包括 SQL、Excel、Tableau 或 PowerBI,以及基本的 Python 用於數據處理、可視化和簡單的統計分析。這個角色主要是理解歷史數據,以回答發生了什麼和為什麼的問題。
數據科學家在這些基礎上進一步發展,擴展到預測建模和自動決策。他們也使用 SQL 和 Python,但更深入地使用統計建模、機器學習框架和雲平台。他們的重點轉向預測未來的結果和推薦行動。
一個常見的誤解是,數據分析師必須成為數據科學家才能提升職業生涯。這絕對不是事實!
高級分析師可以獲得高薪,並對業務產生強大的影響,而不需要深入的機器學習或統計知識。
說實話,並不是每個人都會喜歡數據科學的工作,許多人會更願意留在數據分析的道路上。
所以在我們繼續之前,請問自己以下問題:
你對機器學習及其運作方式感到好奇嗎?
你對高級數學和統計感到舒適(或至少感興趣)嗎?
你對技術挑戰和軟體工程概念感到舒適嗎?
你能接受一個工作中有很多不確定性的角色嗎,包括日常工作和職業進展?
如果你還在想「是的,我確實想追求數據科學」,那我們就來談談如何實現這個目標。
轉型所需的技能
好吧,既然你已經決定要轉型,讓我們來分解一下你需要發展的關鍵技能。我們將專注於四個核心領域,這些領域構成了數據科學工作的基礎。
數學與統計
如果你來自數據分析背景,你可能對統計有一些了解,但數據科學可能需要更深入的數學知識。你需要對以下內容感到舒適:
多變量微積分和線性代數,特別是矩陣運算和梯度,以理解機器學習算法。但不用擔心——你不需要成為數學專家,只需了解基本概念,以幫助你理解算法如何運作。
你還需要概率論和假設檢驗,用於實驗設計。
以及統計概念,如不同類型的分佈和回歸技術。
理想情況下,還需要一些因果推斷的經驗。
程式設計
如果你已經在你的角色中使用 SQL 和基本的 Python,那麼你在這方面已經有了優勢。現在只是需要提升一下。專注於:
更高級的 Python,例如物件導向程式設計的基本原則、編寫模組化可維護的代碼、單元測試、性能優化等等。
使用機器學習框架,如 scikit-learn、Tensorflow 和 PyTorch。
熟悉基本的數據結構和算法,以便於編碼面試。一般來說,這將只是關於數組和字符串的問題,所以你不需要太過於深入,但這對於面試來說是重要的。
機器學習與人工智慧基礎
這是數據科學的另一個核心支柱,因此你需要對機器學習的基本概念感到舒適,例如:
監督學習(例如回歸和分類)。
非監督學習(例如聚類和降維)。
模型評估和驗證。
深度學習的基礎。
如今,熟悉生成式人工智慧 (GenAI) 也是一個加分項(但這裡我指的是學習如何使用 API,而不是從零開始訓練模型)。
大數據與數據工程概念
最後,許多數據科學角色涉及處理大規模數據集和建立自動化管道。為此,你需要專注於:
使用雲計算平台,特別是 AWS 服務,如 S3 和 SageMaker。
使用工具如 Airflow 開發數據管道。
可能還需要基本的系統設計原則,以擴展你的解決方案(這在你變得更高級或更專注於機器學習時更為重要)。
如何發展這些技能
現在我們已經涵蓋了你需要學習的內容,讓我們談談如何實際建立這些技能。你可以選擇幾條不同的路徑,適合你的路徑取決於你的預算、學習風格和時間安排。
自學
如果你自我驅動且有紀律,自學可以是一個合理且具成本效益的轉型方式。關鍵是持續的練習和選擇正確的資源。
以下是一些我推薦的優秀課程,按順序列出(這些是聯盟連結哦!):
你還需要了解基本的數據結構與算法(DSA)以準備編碼面試。對此,我喜歡 Educative 的《Grokking the Coding Interview Patterns in Python》,它專注於數據結構和算法問題的常見模式。我覺得這非常有幫助,這樣你不會覺得只需要「知道技巧」就能解決 LeetCode 問題。
還有一些值得閱讀的書籍(這些也是聯盟連結,但我真的很喜歡這些書):
還有很多其他的,但這是我的前三名。如果你想進一步探索,這裡有一個鏈接到我最喜歡的技術書籍!
自學路線上最重要的事情是持之以恆。制定一個計劃並堅持下去,即使每天只學一點點。
訓練營
現在,也許你在想你會更喜歡在學習中有更多的結構和外部的責任。如果你不想承諾全日制學位,訓練營可以是另一個選擇。
訓練營的一些優點是:
快速學習——你通常可以在幾個月內完成。
結構化課程,因為一切都為你安排好了,所以你不必自己拼湊學習計劃。
社群支持——你可以和同伴一起學習,並從已在該領域工作的導師那裡獲得指導。
需要注意的一點是,訓練營的質量各不相同,並不是所有的訓練營都受到雇主的高度重視。在報名之前,請做好研究——查看評論、與校友交談,並確保他們提供職業支持。
碩士學位
對於那些希望深入了解數據科學並擁有強大人脈機會的人來說,碩士學位可以是一個不錯的投資。這對於從非技術背景轉型的人特別有用,或者如果你擔心自己的背景無法通過簡歷篩選工具。
缺點顯然是碩士課程可能很昂貴且耗時。但好消息是,現在有許多經濟實惠的兼職在線課程,讓你可以在工作時學習。例如,喬治亞理工學院 (Georgia Tech) 的課程非常實惠,質量也相當不錯。
導師指導
無論你選擇哪條路徑,導師的指導都可以非常有幫助。有一個人來指導你、提供反饋並幫助你規劃職業生涯,可以帶來巨大的改變。
尋找導師的一些方法:
在你的公司——如果你的公司有數據科學家,問問是否可以與他們合作或跟隨他們。
LinkedIn——加入數據科學小組或聯繫專業人士(如果你需要幫助,我有一個關於導師策略的視頻!)。
像 Reddit、Discord 伺服器和 Slack 小組這樣的在線社區也是與其他學習者和專業人士聯繫的另一個途徑。
或者,聘請一位導師——如果你認真想快速提升,投資於導師可能是值得的。
展示經驗
好吧,你已經學會了所有需要的技能。這很好,但你如何向潛在雇主證明你真的能勝任數據科學家的工作呢?
我有一個完整的視頻,講解如何建立作品集並在全職工作之外獲得經驗。簡而言之,你應該盡力做一些自我驅動的項目,讓你能夠模擬工作環境,盡可能接近實際工作。
但如果你正在閱讀這篇文章,那麼你很可能已經在擔任數據分析師,這給你提供了另一組機會,可以在當前角色中利用。
例如,假設你經常在 Excel 或 Tableau 中創建報告。你可以用 Python 腳本自動化這個過程,甚至添加一些預測元素。或者如果你的公司進行 A/B 測試,志願幫助進行統計分析。
如果你有數據科學團隊,試著與他們合作一個項目。如果沒有數據科學團隊,向你的雇主提出一些有影響力的項目,這也能幫助你學習。
最好的情況是,這可以導致內部轉型。最糟的情況是,你現在有了具體的影響示例和真實的數據科學項目,可以放在你的簡歷上。
找工作
如果你能夠內部轉型,那就太好了,你已經完成了!如果不能,這裡有一些策略可以幫助你獲得第一份數據科學工作:
首先,讓我們談談如何在線上定位自己。你的簡歷、LinkedIn 和 GitHub 需要講述一個一致的故事,表明你已經是一位合格的數據科學家(因為如果你具備技能並完成了良好的項目,你就是!)。所以,與其寫「數據分析師尋求數據科學家角色」,不如說「數據專業人士,專注於預測分析和機器學習」。
當談到你的 GitHub 時,確保把你最好的項目放在最上面。這對於分析師來說尤其重要,因為你的編碼技能將受到更多的審查。所以,
將你最好的機器學習項目釘在最上面
寫清晰的 README,解釋你的方法
確保你的代碼結構良好且有文檔,顯示你理解軟體工程原則
並添加可視化和結果來展示影響,這對於你來說應該很簡單!
一旦準備好申請,優先考慮混合角色。這些職位介於傳統分析和數據科學之間,通常是很好的跳板。
例如,許多公司(包括 Meta 和亞馬遜 (Amazon) 等大型科技公司)有稱為「數據科學家」的角色,但實際上更像是高級分析職位。老實說,在許多公司中,這些界限本來就不明確。利用這種模糊性來你的優勢!
當你進行網絡聯繫和準備面試時,利用你的分析背景。使用你對商業背景的深刻理解、清晰的溝通技巧,以及你如何影響業務以實現可衡量的影響的例子。其他可能比你更技術性強的候選人可能在商業和溝通方面會遇到困難。所以不要害怕發揮你的優勢。
記住,這個轉型不會在一夜之間發生,這是可以的。重要的是持續進步。你寫的每一行代碼、每一個學到的概念、每一個完成的項目——這一切都會累積起來。
如果你覺得在數據科學/機器學習職業上需要一些支持,這裡有一些我可以幫助你的方式:
注意:這篇文章包含聯盟連結。如果你購買,我將獲得少量佣金,對你沒有任何費用。謝謝你的支持 ❤
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!