分類:大數據

【謝章升專欄】大數據行銷的架構與自我練功6步

在念書的時候,你可能碰過很多指標,很多專有名詞,但出了社會你會發現,老闆關心的永遠只有一個,營收!

大數據通常指的是變動快速且接近普查的資料,如果你的客戶對象是台灣人,而商品的定位也是大眾商品,那這裡的大數據通常指的就是所有台灣人的資料.但通常不會有幾家企業擁有那麼多資料量,但後來手機與網路的發達,資料的取得變得容易許多.以Google來說掌握了人的行為資料, # !以Facebook來說掌握了每個人看過什麼,點過什麼的 #興趣資料 !

如果以營收為目的:

第一步:懂得去看這些描述性的資料,就可以得到即時的經營知識,例如:該不該進入這個市場?到底是市場是成長還是衰退?這些雖然以前也有方法,但現在我們可以免費且接近立即性的得到情報

第二步:而通常利用這些情報,在經營的過程,最多人在網路廣告卡關的問題是:
1.我什麼時候該加碼或停掉我的廣告?
2.會是素材的問題還是目標群眾設定錯誤的問題?
3.沒有成交是廣告還是銷售頁的錯
4.為什麼大部分建議來到1000次曝光或是1000個點擊,接下來的分析才會穩定

大部分的網路廣告投手,常會經歷上面4個問題,而要掌握這些問題,其實不用回去翻統計學課本,或資料探勘或機器學習課本.從
#母體 ,#樣本,#抽樣,#網路廣告的定義,與 #誤差 這幾點去看.

第三步:來到進階-分類顧客
可以運用收集到的客戶名單,成交資料,cookie資料去分類顧客.這部分我們常用到RFM/NES分析,集群分析,決策樹.
分類出來的客戶又可以拿來跟FB與Google去比對出類似受眾.

第四步:預測顧客-喜好
這部分我們可以用到AB測試,MAB測試,與多選項吃角子老虎機器實驗(MAB),目前FB廣告與Google廣告都是用(MAB)這個方法,而不是真的AB測試,通常AB測試我們會把誤差考量進去,而最近FB有新功能AB測試,可能等測試過一陣子才能判別優缺

第五步:預測顧客-推薦系統
這部分可以去分析出買A的也會買C,進而把A跟C包裝成組合包,或是買A的人推薦他買C,或是買C的人推薦他買A.這是我們常用到的推薦方法

基礎方法是用Association Analysis(關聯分析)這個方法,更進階則是用Sequence Pattern Discovery(序列樣式分析),簡單來說就是發現原來買C之後才會買A,所以應該是針對買C的人推薦A才對

這些推薦方法都可以用來 #提高客單價!

第六步:預測顧客-購買的機率
目前技術上是可以做到,購買機率高的顧客讓他看到廣告,或是提高廣告的標價以確保真的會讓客戶看到.目前大部分是全世界各顧問公司在努力的方向,實際的作法也是列為機密

不過這些方法,大部分就是我們稱為機器學習(以前稱為資料探勘)的方法,基本要求大部分是需要有千筆以上的資料來讓模型分析,通常針對預測的正確率會是我們的方向

而模型大部分是採用下列的方法其中之一或是結合:
1.Regression(迴歸)
2.Logistic Regression(Logistic迴歸)
3.Decision Tree(決策樹)
4.Support Vector Machine;SVM(支援向量機)
5.Random Forest(隨機森林)
6.Boosting(提升方法或翻譯成強化學習)
7.Deep learning(深度學習)

近期活動:GA網站流量分析台北場-4/22(六):http://bit.ly/2mWSiqR

【謝章升專欄】諸葛亮可能是中國最早的成長駭客

大多數的公司沒有燒錢的「本錢」與「能力」
對比三國的諸葛亮所處的環境也是要什麼沒什麼,
所以諸葛亮幹了兩件事情跟矽谷流行的「成長駭客」(Growth Hacker)沒兩樣
1.草船「借」箭
2.「借」東風火燒連環船

老實說,這兩件事情看在對手的眼裡是很OX的行為
但沒辦法,誰叫諸葛亮沒資源呢!

成長駭客最重要的思維在於
1.能夠不用錢就不用錢的心態
2.就算要花到錢也要靠「技術」與「數據分析」來讓每分錢燒的盡忠職守

通常心態對了,你可以搭配學到的技術方法去實踐
對這方面有興趣的你可以去看下面這本書
「成長駭客」作者:范冰 繁體中文版出版社:高寶出版
growthhack-fanbing

裡面的案例特多,但是看完你可能想酸
1.看案例有用嗎?
2.有滿大部分是中國大陸企業的案例,看不太懂?

針對第一個問題,通常看人家成功的例子,你照抄不會成長,
但是為什麼還要看?
關鍵在於模擬經歷過該情境的經驗
曾經有個研究指出籃球選手在休息時
如果在腦海中模擬投籃的情境
也會有助於命中率提升
我不知道是真是假
我如果有一天跟curry變熟了
我再幫你問他
但是我自己的經驗是
“如果你案例看多,而自己又有實戰的機會,那在那關鍵的一剎那,你會有dejavu的現象"
我比較喜歡dejavu翻譯成"似曾相似"
在那需要決策的一剎那,你所有會的方法都用上了,這時候你需要下決定,
但dejavu出現的時候,你會感覺到這次下的決定成功機率比較大
我想這就是看案例學習到的優點(不過前提是你要實戰,否則只是看一堆兵書,但沒殺過半個人)

第二個問題,就好解決了
你自己google一下不就知道那間企業做什麼?賣什麼?
難道你以為全世界寫書的人都舉台灣的案例
而且看看其他環境的案例
有時候會有能不能也在台灣賣的心得?

如果你比較偷懶的話,
有另一本天下出版的「成長駭客行銷」比較薄,觀念寫得很棒,只是案例比上一本少一點

那如果有一天資源很多的話
還需要用成長駭客的方法與技巧嗎?
就像如果諸葛亮是在曹營的話,
那他可能不用一直借東借西
但是還是能用最小資源達成最大的效果
如果只燒1萬塊廣告費就達到目的,你沒事幹嘛燒100萬,
別傻了,你真以為多燒的錢是爭取到知名度

我問過很多老闆或主管一個問題
如果是你自己的錢有100萬,你要花在廣告費還是買一台名車擺在門口
大部分的人都選擇,
我要看得到的車

講了那麼多,希望不會被你發現這是一篇置入性行銷的分享文,
如果你覺得我講得還有些道理,你可以去買本范冰老師寫的成長駭客來看看,
你也可以Google一下"謝章升大數據"來聽聽我的課程
http://goo.gl/0rlumR

謝章升 2016/03/22
fega53@gmail.com

 

【謝章升專欄】營收成長駭客與大數據行銷

正確的成長駭客思維與適合的新技術搭配,
先天就長得有冠軍相
營收成長駭客(Growth Hacker)與大數據(Big Data)是近幾年常曝光的新名詞
但真的是舊酒裝新瓶嗎?其實不然,這篇文章我們聊聊怎麼做?

首先,成長駭客指的是具有行銷思惟,數據科學家,程式工程師的集合體
怎麼聽起來的情境是慣老闆叫員工一人抵三人
但相信我,你多懂一些事是有幫助的
有一天你可能會自己變老闆要一個打十個
這些事當然一個人做不太來
但是都了解你才能知道缺什麼要找什麼

growth-hacker-mix

我們如何學習成為一位成長駭客,或是大數據科學家呢?
首先我們定義目標就是“營業額成長"

 

第0步就是確認"產品與市場適配(Product Market Fit,PMF)"
如果你身兼行銷與產品創造人員,會有權限與能力去發展出顧客想要的產品
以我而言,我負責三星統計的教育訓練部門,常常是從顧客端得到他們想要什麼,
再去發展課程,成功機率較大,有時失敗發現是因為市場還不足量,例如2012年的時候
我們就開大數據課程(那時候叫資料採礦),上的人不多,到這幾年,已經是班班爆滿

怎麼去確認產品與市場適配(Product Market Fit),

以下有一些建議方法:

1.最低可行產品(Minimum viable product):我曾經在軟體公司看到一個現象,上司一直堅持要做到最好的版本,才要推出市場去銷售,但2年過去了,沒有任何營收,而別家公司早已推出產品且不斷根據建議或客訴去改善,所以時機很重要,你可以先求有再求好

“客戶有需求時,不會強求你是不是個型男,只想先有一個可以依靠的肩膀"

2.焦點群體訪談(Focus Group):根據我們定位的目標客戶,去訪問他們的感想,例如你平常會發明新菜色,請朋友吃看看,他們給你回饋,你再改正,如果你的朋友沒有呼嚨你的話,是可以推出不錯的產品來應戰

另一個案例你可以去看電影"危機女王(Our Brand Is Crisis)",裡面的珊卓布拉克是個競選輔選顧問,他就訪問了一堆選民,從他們的想法中找出如何賣"候選人"

3.尋求網路上的聲音:最簡單的作法,你可以參考FB的粉絲洞察報告,知道這些人的特性,與利用FB的關鍵字搜索功能,知道他們喜歡什麼,討厭什麼,例如你把FB貼文中有"義美"這個字的文章都過濾出來,從你的眼睛就可以看到他們喜歡義美什麼,討厭義美什麼,重點是網友不知道會被觀察,所以表現出真實的一面

比較進階的做法,你可以去學"網路爬蟲技術“,簡單來說Google就是網路爬蟲技術,把網路上的文章搜尋到並做索引,網路爬蟲可以把網路上的資料下載下來分析,至於合法或非法就另當別論了,下載下來後,可以運用"文字探勘“的技術,去分類出消費者的想法

當然你也可以用問卷去測試,但通常我建議,找資料庫為第1順位,爬網路資料為第2順位,問卷測試為第3順位,這是為了分析的速度,收集資料本身需要耗費時間,有時局勢並不容許我們慢慢來

如果你確定你的產品已經ok
我們就可以開始用"AARRR"這個架構來思考
我非常鼓勵大家用架構來思考
這樣心理會踏實,遇到危機不會慌
當然自古以來文人相輕
會批評哪個架構有缺點
哪個比較好
但是我覺得"你肯去做“比較重要
不然也不會有一本書專門講"執行力"

Dave-McClures-Pirate-Metrics

以AARRR來說的話

第1步:Acquistiton獲取客戶,通常獲取新用戶的方式就是曝光,也就是廣告,但是我們鼓勵你用可以埋"追蹤碼"的方式去下廣告,這樣可以有報表不斷修正自己的缺失,達成數據化思考,數據化檢討,目前看來數位廣告幾乎都能埋追蹤碼,對於修正錯誤有幫助

而以台灣來說,常見的曝光方式有,FB社群廣告,Google廣告,部落格,SEO(搜尋引擎最佳化),EDM(電子郵件廣告),甚至Line推播等方式,
這些方式我們需要先掌握一個原則,就是能夠不花錢最好不花錢,就算要花錢,也要花的戰戰兢兢,
沒有一個公式跟你說要怎麼搭,都是需要是當下的情境去拆解哪種管道接觸消費者最洽當

第2步:Activation激活會員,當你的客戶來過你的網頁後,你起碼會留有他們來過的痕跡(Cookie技術),這樣你起碼可以朝他們"再行銷(Remarketing)“,再行銷目前在FB廣告跟Google廣告都有這個功能,如果以成本論,Google比較便宜,因為版面較多

再行銷可以掌握三個重點:

a.提醒這些人,忘了下訂單要記得下喔

b.廣告通常需要打三次才有效(三打理論),所以掌握適當的頻率,太少沒感覺,太多會麻痺,有一次我鎖定我們某個族群的客戶,下FB廣告,結果忘了這個細節,讓他們一周內平均看了29次廣告

c.交叉銷售,看了東京華盛頓飯店的人,沒有下單,你一直用再行銷提醒他幾天後如果還沒下,就證明他不喜歡這家飯店,但是你可以推薦他東京的其他飯店,因為正常人不會沒事去找東京的飯店,他一定是有需求,那要推哪間?我建議推最好賣或是你毛利最高的產品

如果會員來過你的網頁,那記得要以留下email為主要目的,以後好處多多,除了可以發EDM第一時間通知活動外,email可以跟FB跟Google交叉比對去這些用戶的行為

例如我們家三星統計是做大數據的教育訓練,但是我的老客戶裡面會不會有哈日族,我就不知道了,
學大數據時老師常會講啤酒的尿布的故事,會買啤酒的也會買尿布,但是這個故事有個限制條件,就是這是顧客發生在超市內的行為,出了超市之外的行為就沒data了,
但是我們可以跟FB或Google比對資料來比出這個消費者的其他行為,
透過email跟FB比對,會發現有一群人很愛日本,那我如果要辦個日本深度旅遊,名單就過濾出來了

 

第3步:Retetion會員回訪,通常你的產品如果不是只做一次生意,那對你滿意的消費者就會不斷"回購"但是我們怎麼知道哪些客人會回購,哪些客人會跟我們分手,這時候你可以利用RFM模型,分類出主要客戶,跟即將分手的客戶,RFM模型很多統計軟體都能做到,Excel也能做到,但由於我出身於SPSS工程師,所以我常用SPSS來展示

第4步:Revennue付費收入:通常快的話在第二階段就會收費有營收了,但有些商品是前面都讓你試用,後面再一舉收費,例如有些網站是免費會員就可以開始用,但是要加值服務就真的要錢包出鞘了

第5步:Referral推薦傳播,推薦這邊我們可以分兩點來看,一個是推薦老客戶其他商品,希望提高客單價,這可以利用到大數據常用的"關聯規則分析“,但這種商業軟體超貴,幾乎可以買一台賓士車,現在的主流是找會R語言的工程師,直接叫他用R語言分析出來,你在網路書店買書,頁面下面的"買這本書也會買什麼書"這種資訊就是這樣來的,當然有些沒有做演算法,就直接呼嚨客戶的也有,但有做真的有差

另外一個推薦,可以從客戶推薦客戶來看,這個可以去學Open Grach開放社交關係圖,簡單說就是可以看到那些朋友也加入這個網站,或是買這樣東西,這樣會促使消費者有從眾行為

 

這邊幫大家整理一下有哪些學習方向與技術:

1.行銷方面建議你需要:

a.搞懂SWOT-STP-4P的正確邏輯

b.病毒行銷要怎麼設計?

c.EDM (相信我,不管怎麼變,短期內大家還是會收發email)

d.SEO搜尋引擎優化

e.FB廣告

f.Google關鍵字廣告

g.網站流量分析Google Analytics

h.廣告文案撰寫

 

2.數據科學家方面(也就是常講的大數據):

a.基礎統計觀念:這樣你才知道怎麼調查人心會準確

b.第二代統計學的反映型指標與形成型指標:可以用來找出高所得的客群

c.A/B Testing 其實就是費雪的隨機對照實驗:可以測出價錢,顏色,功能,廣告標題,廣告圖片,有沒有顏文字,需不需要多連結或單連結,哪個版本比較好,比較嚴謹的作法是除了比較大小外,還加進了統計"檢定“的動作,以免讓誤差造成我們判斷錯誤

d.關聯規則分析:可以幫你了解怎麼設計組合包,或推薦什麼商品會命中客戶的心理

e.羅吉斯(Logistic Regression)迴歸:可以猜出這個客人購買的機率

 

3.程式人員方面:

a.網頁撰寫能力

b.Open Gragh開放社交關係圖

c.機器學習:可以用來歸納出消費者的行為

d.Google Tag Manager(可以用來管理以後只會多不會少的追蹤碼)

 

其他我有想到,再陸續補充這篇,這是一個東西學不完的年代,也是個有趣的年代

對大數據與網路行銷議題有興趣的朋友,歡迎可以追蹤我FB:按此前往

最近的課程-FB廣告實作班-從盲測到優化績效:https://goo.gl/4lk6Al

謝章升fega53@gmail.com

【謝章升專欄】如何藉由Facebook大數據瞭解目標群眾

 

Facebook有最多的使用群眾,尤其在台灣已經接近市佔率寡占的狀況,
所以如果善用FB的大數據資料,可以清楚了解自己的目標群眾的狀況

步驟1:您的FB桌面版下拉選單會有一個【建立廣告】,第一次使用的人會跳【建立第一則FB廣告】

FB-001

步驟2:點選關閉且不儲存(如下圖紅框處)

FB-AD-20160829

步驟3:點選廣告管理員-資產-廣告受眾(如紅框處)

FB-AD-20160829002

步驟4:選擇儲存的廣告受眾
(如果你是第一次用FB廣告後台,畫面會搜有不同,請找一個廣告受眾的選項點選)

FB-004

步驟5:就會跳出FB的廣告受眾選單

FB-005

例如我們想看台灣地區對睫毛膏有興趣的目標群眾有多少,
就可以由此估算有35萬人

FB-006

謝章升 20160829版本

fega53@gmail.com

最新大數據行銷課程請參考:大數據行銷應用專區

【陳景祥專欄】當統計專家遇上機器學習專家

作者:淡江大學統計系 陳景祥老師

今天收到某個合作的公司在上海那邊的人所寄來的一封 email,問到統計專家跟機器學習專家(machine learing) 的差異。我想了一下,回覆了這封 email,順便把我的看法在這裡跟大家分享。

Dear XXXXX,

在您所引述的文章中,Ryan Adams 說: “我认为统计学和机器学习最本质的区别在于根本目标不同。统计学家更关心模型的可解释性,而机器学习专家更关心模型的预测能力。”

身為一個也在研究機器學習的統計學家,我必須說,他的角度是錯的,或者說是偏頗的。因為,統計學家當然也關心預測能力。

統計學家跟機器學習專家的差異,在於機器學習專家很少有懂統計的,但是統計學家跨入學機器學習領域卻是非常容易。

事實上,機器學習源於資訊科學領域 (Computer Science),但資訊科學本身並不像統計領域那麼難入門。舉例來說,我在美國留學的時候,當時就見到不少大陸去唸書的女孩子從中文系、歷史系等文科領域直接跳到資訊電腦相關研究所,而且都很快就能進入狀況。反過來說,要掌握統計相關專業卻不是那麼容易。

我這十幾年指導統計研究生的心得是,他們通常都能在很快的時間內(例如半年)搞定機器學習跟程式語言(programming languages)相關的專業,但我們卻無法期待資訊電腦專家們在兩三年內知道統計領域的專業知識。

不管是統計專家或機器學習專家,甚至是太空物理學家,基本上都是想要建立模型(models)來詮釋這世界的種種現象,但主要的差別在於,統計模型有考慮了隨機誤差,並且對隨機誤差有一整套嚴密的解釋體系,但其他領域的專家所建立的模型未必有考量到隨機誤差。

所以主要的差別在於:
一般科學模型: Y = f(X1,X2,…,Xk)
統計模型: Y = f(X1,X2,…,Xk) + 隨機誤差

如果自然界與人類社會的種種現象沒有這個隨機誤差的存在,整個統計領域可以完全消失也無所謂。但事實當然不是這樣。

此外,過度重視「預測能力」也會有誤導的可能性:所謂的「預測能力好」,到底只是特定時間(某幾個月?)、特定空間(只限於某個國家某個地區中的某個公司?) ?還是這樣的模型在不同時空狀況下表現就很差?

接觸過機器學習、資料探勘、類神經網路(Artificial Neural Network)的人大概都知道,如果沒有整個母體(Population)的模型假設加上隨機誤差模型的搭配,很多號稱「表現很好」的模型,其實過一陣子就都會完蛋,也因此經常需要持續不斷的微調參數。可是,話說回來,一個經常需要不斷調整的模型,能夠認為它表現很好嗎?

我最後做個小結論:

1. 機器學習領域往往是透過過去收集的(大量)資料來當作預測的基礎。如果過去的資料並不完整,無法包含所有可能的狀況,這時候機器學習所得的模型就算短時間內預測很精準,但很快就會完蛋。相反的,有考量母體隨機特性的統計模型,因為模型本身就已經把各種可能性都包含在內,就比較不會受到過去局部資料的太大影響。

2. 機器學習相關技術如果有採納「隨機誤差」的觀念,其實就可以視為是統計模型,所以兩者之間的區分並不是那麼的嚴格。反過來說,除非是像 E = m(C 平方) 這種純物理學模型,不考量隨機誤差現象的任何模型,基本上都是局部的、暫時的,無法長遠表現良好。事實上,很多很厲害的物理學家們在量子力學裡面使用了非常高階的統計模型在分析資料,但這樣的睿智未必能在機器學習領域看到。

教學課程請參考:
1.學習影片-R語言入門
2.學習影片-Big Data大數據採礦分析with R語言
3.學習影片-文字探勘與R語言實作

 

【陳景祥專欄】有了大數據卻不一定要用大數據

作者:淡江大學統計系 陳景祥老師

虛擬情境:

資訊出身的「專家」得意的對統計出身的同仁說,有了大數據,母體的資料都可以算
,不再需要統計了!

統計專家問:算一次要多久?

資訊專家說:四天,因為資料量超過 1 PB!

統計專家問:為什麼不乾脆隨機抽出 100 萬筆資料,1 秒就搞定?

結論:
1. 在現有的電腦硬體限制與成本考量下,計算速度太慢的 Big Data, 就算可以使用母體資料,實用性跟即時性都太差!
2. 不懂統計的人以為他們手上的資料就是「母體」。可是,除非這些資料都不再增加,那也僅僅是比較大的樣本而已(更何況,根本不算隨機樣本),怎麼有資格稱為「母體」呢?

教學課程請參考:
1.學習影片-R語言入門
2.學習影片-Big Data大數據採礦分析with R語言
3.學習影片-文字探勘與R語言實作

【陳景祥專欄】如何預測一篇文章到底是正評、中立、還是負評?

作者:淡江大學統計系 陳景祥老師

文字探勘的情感分析就是取代人力,用電腦預測文章的正評或負評,

進一步就可以收集/偵測網路輿情。

網路上可以抓到的旅館住宿客戶正負評價資料,總共 4000 筆留言。

初步簡單模型分析出來,訓練樣本預測正確率 99.97%,預測樣本的預測正確率 90.75%

接下來的模型還可以再用更複雜的 algorithms 來提升預測正確率

教學課程請參考:
1.學習影片-R語言入門
2.學習影片-Big Data大數據採礦分析with R語言
3.學習影片-文字探勘與R語言實作