數據科學專業是近幾年新興的專業,目前各個高校的研究生專業中都有涉及到,它是計算機科學下的一個具體的分支專業。
(資料圖)
這兩年數據科學專業可以說是越來越火了,近兩年有更多的院校開設了數據科學專業相關的課程,甚至被納入英國內政部緊缺職業清單,該專業的畢業生無論是選擇在英國求職還是回國發展,都有著非常廣闊的就業前景。
什么是數據科學?
數據科學Data Science是從數據中提取知識的研究,關鍵是科學。起初叫"datalogy"。最初在1966年由Peter Naur提出,用來代替"計算機科學"。
數據科學集成了多種領域的不同元素,包括信號處理,數學,概率模型技術和理論,機器學習,計算機編程,統計學,數據工程,模式識別和學習,可視化,不確定性建模,數據倉庫,以及從數據中析取規律和產品的高性能計算。數據科學并不局限于大數據,但是數據量的擴大誠然使得數據科學的地位越發重要。
數據科學的從業者被稱為數據科學家。數據科學家通過精深的專業知識在某些科學學科解決復雜的數據問題。不遠的將來,數據科學家們需要精通一門、兩門甚至多門學科,同時使用數學,統計學和計算機科學的生產要素展開工作。所以數據科學家就如同一個team。
數據科學使用到數學、統計、信息科學和計算機科學等各個學科的技術和理論,特別是以下分支:機器學習、分類、聚類分析、數據挖掘、數據庫和可視化。大多數院校的Data Science屬于STEM學科。
數據科學主要研究內容有以下三類
Predictive Analytics
分析數據來預測未來可能發生的事情
Descriptive Analytics
分析數據找出過去事件的特征和正在發生事件的趨勢
Prescriptive Analytics
分析數據來找出最佳措施、取得最優化的結果
海外專業分支與課程設置
大數據專業是橫跨數學、計算機、金融還有商科等專業的交叉學科,目前英美等國家開設的大數據專業方向主要是四個方向:
1、數據科學 (Data Science)
將數學和統計學課程作為核心,搭配以SQL和Python等編程技能課程,包括數據架構,到計算機工程,再到編程等;
2、商業分析 (Business Analytics)
商業分析碩士學位專注于數據應用,以研究消費者、市場和世界經濟趨勢;
3、信息系統 (Information Systems)
大多數信息系統是基于現成的計算機架構、語言和系統進行的信息收集、組織和整合的工作,信息系統的碩士學位課程通常面向對商業環境中的技術管理崗位
4、運籌學和相關工程學 (Operations Research)
該專業的學習采用如數學建模,統計分析和數學優化,運算研究來為復雜的決策問題找到最優的解決方案;
商業分析從它的名字就可以看出來,這個專業會包含一些商科類型的課程,比如說管理課,經濟學課等等。數據科學主要針對的就是統計、數據科學這些方向的。機器學習就是我們人學習到東西之后,需要讓機器學習,并幫我們去處理大量的數據等等。
這四個專業的必修課內容都是相似的,主要學data science、統計學、還有一些教數據可視化處理的課程。其他的選修課就大同小異,就算是相同的專業,在不同的院校開設的選修課也是會有區別的,大家可以根據自己的喜好或者職業發展方向去進行選修課的選擇。
上圖很直觀的表達了數據科學作為一門交叉學科的知識結構組成,也符合了大部分項目的課程設置。數據科學是在數據基礎之上,運用計算機和數理統計的知識,在某一個具體領域(商業、IT、醫療等)解決具體問題。
核心課程
數據科學中的計算機系統
Computer Systems for Data Science
數據科學中的機器學習
Machine Learning for Data Science
數據科學中的算法
Algorithms for Data Science
數據科學中的統計與概率論
Probability and Statistics for Data Science
探索性數據分析和可視化
Exploratory Data Analysis and Visualization
統計推理與建模
Statistical Inteference and Modeling
數據科學大作業
Data Science Capstone and Ethics
海外申請
數據科學專業是近幾年才剛剛新興的專業,本科階段少有開設,所以它招生的專業范圍是非常廣,比如計算機、統計學、數學甚至經濟學、工商管理、會計學、市場營銷等等,也都是可以去申請數據科學專業的。
如果本科專業是數學、計算機科學等相關度高的專業,在申請時大家要好好在自己的相關課程、研究經歷上做功課。如果本科專業相關度低,就需要通過非學校經歷,比如網絡課程、編程競賽、科研經歷等來證明你的能力?;虮究齐A段的選課建議需要涉及計算機編程的課程,比如JAVA、Python,還有統計學,數學等,不需精通但建議多少要了解一些。
前期留學準備
主要是分為硬實力和軟實力兩個部分
硬實力一般指的是三維成績以及一些能夠量化的標準:
英語:去學校官網查詢雅思或者托福要求,語言成績是硬性標準,要重視起來提前做好準備。
GPA:是申請中的重點,data science 是math stats和computer science的結合,有涉及這兩個學科的課程且成績比較好,對于申請是非常有幫助的。
軟實力包括推薦信、文書、ps以及科研實習經歷等:
推薦信:大部分的學校都至少需要兩到三封推薦信,你的任課老師,實驗室做科研的教授,你實習的上司,都可以是推薦信的來源。這里有個公式:大牛強推>寫得出彩的強推>其他;可以看出推薦信最重要的是推薦人的地位和可信度;
實習:實習的關鍵不在多在于“精”,申請專業相契合的實習比公司名頭重要的多;
科研:高含金量的科研經歷,一定是錄取的加分項,能夠讓學校清楚的認識到你對這門專業的熱情、以及你所具備的學習這門專業的能力,也是能夠幫助你從眾多同質化申請學生當中脫穎而出的關鍵!
在審核完你的申請材料之后,各種硬件條件都過關的話,有的學校是會有研究生面試的,可能會問到編程知識,如果你答不上來,那大概率是不會被錄取的。
數據科學的就業方向
在領英的就業報告中,數據科學被列為最近三年內最具前景的職業之一。主要的就業方向是在政府數據中心、金融機構、互聯網企業等單位從事大數據分析師、大數據應用開發工程師等工作。
1、Data Scientist 數據科學家
以高級建模為主,需要較深的領域知識,也包含算法到產品的轉化;
2、Data Engineer 數據(庫)工程師
以開發、管理和維護數據庫為主,也包括優化數據獲取流程,搭建數據庫環境等工作;
3、Machine Learning Engineer 機器學習工程師
以開發機器學習系統并解決實際產品問題為主,對編程能力有較高要求;
4、Data Analyst 數據分析師
以數據清理/分析為主,為數據驅動的決策服務。需要掌握金融/運籌/經濟/市場等知識;