2016年9月23日 星期五

第一步:決定計畫的方向

開始一邊工作一邊上課後時間安排緊湊了許多,人生中也遇到些大事,不過我還是希望能至少紀錄些研讀資料科學遇到的問題與心得。


設定計畫的架構
在業界,商場,工場或其他職場,一份報告的嚴謹度可以比學術等級更高或更低。(廢話)比方說,石墨烯的製成,在業界需要足以成為製品的產量跟品質,在學界重視的則可依研究目標而定。業界對於分析的結果檢視有時則可能不如學界謹慎,雖然這並不是好事,但確實可以大幅提升對於市場的反應速度。但是兩者都遵照一定的步驟來確保結果是可信,可以衡量的,以避免資源的浪費。同理,自己的計畫也應該有一個好的研究架構,去構築自己的產品,檢視其表現與價值。至於在那之上是否有商業價值我要看目標如何設定。

設定目標-闡述方法及衡量標準-研究並取得資料-(處理資料-衡量成果)-討論與改進。

其中括弧的部分也許需要重複多次...一個要點是在每個步驟是否有明確地闡述目標,討論可行的執行方式,並提出選擇現行做法的理由。步驟結束後往往可以藉由檢視最初的敘述來確認是否有正確執行並達到目標。沒有達到目標也不需要刪掉報告重來,試誤也可以成為一個經驗。

接下來每個步驟都可以遇到許多問題,我選擇做的計畫目的除了做出成品外也冀望能做為自己得到不同經驗的契機:除了分析美國高等教育機構的花費與表現,我也同時在思考kaggle上TalkingData的競賽,現在公司可能使用得到的履歷閱讀機器人雖然因爲隱私性問題可能無法成行,所以我正在構思一個打桌遊的AI。當我看到許多人使用deep learning與神經網絡在判讀圖像時,我詢問Udacity論壇關於自己的畢業報告題目是否過淺,論壇導師也告訴我:不一定非要本世紀最具突破性的想法才可以。話雖如此,我還是有思考嘗試做一個圖像辨識AI並使用RasberryPi的攝影機去做一個辨識我自己臉孔的機器人。

作為一個半路出家,對於工具掌握還不深不淺的人,我認為設定一個自己覺得追得到但是還摸不到的目標是維持動力的一個方式。對於這門技藝逐漸掌握的時候,同樣的計畫架構可以通用到更寬廣的架構吧。


沒有留言:

張貼留言