陳景祥-文字探勘R語言

保證開課

主辦單位:三星統計、 國立臺北商業大學國際商務系(所)

適用對象:想了解大數據分析方法與R語言如何實際分析

課程日期:2018/5/5(六)與5/19(六) 兩天 9:30-16:30 (中午12:30-13:30休息)

課程地點: 台北市松山區復興北路99號 犇亞會議中心 15樓會議室 (本活動請自行攜帶筆電,現場會提供插座,wifi)

.犇亞會議中心地圖

特別贈送:我們將會錄製上課的電腦畫面與講課內容,後製成複習影片,放在課程的FB專屬社團供學員複習,期限為1個月

 

課程特色:

1. 大數據顧問中,少數真正統計專業出身的「專」家

2. 大數據顧問中,多家知名企業的業界顧問

3. 不只告訴你為什麼? 還告訴你如何運作?

 

文字探勘 (Text Mining)是資料探勘的一個分支領域,針對文字內容進行分析。文字資料大多屬於半結構化與非結構化資料, 因此在正式挖掘可能的有用資訊前,通常需要先對文字資料內容作事前的萃取、轉換、與整理。

文字探勘的應用範圍包含文件分類、文件分群、文件摘要、主題蒐尋、資訊萃取、機器學習、領域知識萃取、 與知識管理等領域。

本研習將介紹 R 軟體中可用於文字探勘的資料探勘技術,文字探勘基本概念,R 軟體中的文字探勘套件與其應用, 以及實例操作,讓學員能夠擁有使用 R 軟體進行文字探勘的分析能力。

 

課程試聽

 

課程講師:有料直說的大數據教練-陳景祥顧問

淡江大學統計系副教授,美國佛羅里達州立大學統計系博士,研究領域為可靠度分析、統計計算、資料探勘。「R軟體:應用統計方法」作者。目前擔任台灣多家公司大數據顧問,從2012年授課大數據課程至今,已超過500人經過訓練。

 

課程大綱:

1.R 軟體快速入門

2.文字探勘基本概念

3.Rwordseg 與 jiebaR 中文斷詞系統

4.PTT 爬文簡介

5.tm 套件:語料庫、dtm 與 tdm 矩陣

6.wordcloud、topicmodels 等應用套件

7.資料探勘分群與分類簡介

8.文字探勘:分群

9.文字探勘:分類

10.非監督式情感分析

11.監督式情感分析

12.實例演練

 

報名費:

原價票:新台幣5300元整(限額5張)

早鳥票:新台幣4800元(限額10張,先搶先贏)

兩人同行:新台幣9400元(限額5張)

備註資訊:此活動提供午餐,發票,研習證明

報名請洽(本活動委託活動通Accupass代為售票):

按此開啟報名頁