主辦單位:三星統計、 國立臺北商業大學國際商務系(所)
適用對象:想學習網路爬蟲技術的入門者
課程日期:2018/6/2(六)-6/3(日) 9:30-16:30
(中午12:30-13:30休息;16:30之後為自由討論時間)
課程地點:國立台北商業大學 五育樓2樓204電腦教室
1.台北市中正區濟南路一段321號 ; 捷運善導寺站出口拐個彎就到,
距離捷運站200公尺,交通最便捷
2.提供一人一機,教室備有電腦同步操作系統,每部電腦螢幕都同步顯示老師操作畫面)
特別贈送:我們將會錄製上課的電腦畫面與講課內容,後製成複習影片,放在課程的FB專屬社團供學員複習,期限為1個月
參考影片:
課程講師:丘祐瑋
大數軟體 CEO,專長於資料庫管理與資料分析,致力於使用R、Python、Java等工具建構方案。
著有:
1.Machine Learning With R Cookbook [PACKT]
2.R for Data Science Cookbook [PACKT]
媒體報導:
課程大綱:
主要綱要 | 課程內容 | 時數 |
---|---|---|
使用爬蟲採集資料 | 1.了解開發人員工具背後的秘密 2.了解如何使用requests 撰寫第一隻爬蟲 3.了解什麼GET v.s. POST 4.如何使用BeautifulSoup4 剖析網頁資料 | 3 |
清洗、整理採集資料 | 1.Pandas 簡介 2.資料清理與轉換基礎 3.時間轉換 4.移除不必要的空白與字元 5.正規表達式 5. | 3 |
使用資料庫儲存與管理資料 | 1.使用Python 連結資料庫 2.將資料儲存至資料庫 | 1 |
Python 爬蟲實戰 | 1.學習如何處理 JSON 資料 - 利用 Facebook API 抓取粉絲頁資訊 2.學習如何處理表格資料 - 利用 Pandas 剖析財報資訊 3.學習如何加入Headers - 突破卡提諾抓取限制 4.學習如何加入Cookies - 突破PTT Gossiping 板抓取限制 5.學習如何切換 IP - 透過Proxies 切換IP 6.學習如何使用Selenium - 模擬網頁登入操作 7.學習如何破解驗證碼 - 讓機器人自動訂台鐵票 8.學習如何破解驗證碼 - 抓取買賣日報表查詢系統 | 5 |
招收名額:滿15位開班,7天前如未開成班則全額退費
報名費:
原價票:新台幣5300元整
早鳥票:新台幣4800元(限額15張,先搶先贏)
兩人同行:新台幣9400元(限額5張)
備註資訊:此活動提供午餐,發票,研習證明
報名請洽(本活動委託活動通Accupass代為售票):