【謝章升專欄】以營收為目的,大數據行銷練功6步

在念書的時候,你可能碰過很多指標,很多專有名詞,但出了社會你會發現,老闆關心的永遠只有一個,營收!

大數據通常指的是變動快速且接近普查的資料,如果你的客戶對象是台灣人,而商品的定位也是大眾商品,那這裡的大數據通常指的就是所有台灣人的資料.但通常不會有幾家企業擁有那麼多資料量,但後來手機與網路的發達,資料的取得變得容易許多.以Google來說掌握了人的行為資料, # !以Facebook來說掌握了每個人看過什麼,點過什麼的 #興趣資料 !

如果以營收為主的大數據行銷怎麼練功:

第一步:懂得去看這些描述性的資料,就可以得到即時的經營知識,例如:該不該進入這個市場?到底是市場是成長還是衰退?這些雖然以前也有方法,但現在我們可以免費且接近立即性的得到情報

第二步:而通常利用這些情報,在經營的過程,最多人在網路廣告卡關的問題是:
1.我什麼時候該加碼或停掉我的廣告?
2.會是素材的問題還是目標群眾設定錯誤的問題?
3.沒有成交是廣告還是銷售頁的錯
4.為什麼大部分建議來到1000次曝光或是1000個點擊,接下來的分析才會穩定

大部分的網路廣告投手,常會經歷上面4個問題,而要掌握這些問題,其實不用回去翻統計學課本,或資料探勘或機器學習課本.從
#母體 ,#樣本,#抽樣,#網路廣告的定義,與 #誤差 這幾點去看.

第三步:來到進階-分類顧客
可以運用收集到的客戶名單,成交資料,cookie資料去分類顧客.這部分我們常用到RFM/NES分析,集群分析,決策樹.
分類出來的客戶又可以拿來跟FB與Google去比對出類似受眾.

第四步:預測顧客-喜好
這部分我們可以用到AB測試,MAB測試,與多選項吃角子老虎機器實驗(MAB),目前FB廣告與Google廣告都是用(MAB)這個方法,而不是真的AB測試,通常AB測試我們會把誤差考量進去,而最近FB有新功能AB測試,可能等測試過一陣子才能判別優缺

第五步:預測顧客-推薦系統
這部分可以去分析出買A的也會買C,進而把A跟C包裝成組合包,或是買A的人推薦他買C,或是買C的人推薦他買A.這是我們常用到的推薦方法

基礎方法是用Association Analysis(關聯分析)這個方法,更進階則是用Sequence Pattern Discovery(序列樣式分析),簡單來說就是發現原來買C之後才會買A,所以應該是針對買C的人推薦A才對

這些推薦方法都可以用來 #提高客單價!

第六步:預測顧客-購買的機率
目前技術上是可以做到,購買機率高的顧客讓他看到廣告,或是提高廣告的標價以確保真的會讓客戶看到.目前大部分是全世界各顧問公司在努力的方向,實際的作法也是列為機密

不過這些方法,大部分就是我們稱為機器學習(以前稱為資料探勘)的方法,基本要求大部分是需要有千筆以上的資料來讓模型分析,通常針對預測的正確率會是我們的方向

而模型大部分是採用下列的方法其中之一或是結合:
1.Regression(迴歸)
2.Logistic Regression(Logistic迴歸)
3.Decision Tree(決策樹)
4.Support Vector Machine;SVM(支援向量機)
5.Random Forest(隨機森林)
6.Boosting(提升方法或翻譯成強化學習)
7.Deep learning(深度學習)

*如果你對相關文章有興趣,歡迎追蹤 謝章升FB
*謝章升近期課程

類型講師課程主題
線上謝章升FB廣告入門
線上謝章升FB廣告中階
線上謝章升FB廣告高階
線上謝章升Google廣告入門
線上謝章升Google廣告進階
線上謝章升GA4流量分析入門
線上謝章升GA4流量分析進階

【謝章升專欄】營收成長駭客與大數據行銷

正確的成長駭客思維與適合的新技術搭配,
先天就長得有冠軍相
營收成長駭客(Growth Hacker)與大數據(Big Data)是近幾年常曝光的新名詞
但真的是舊酒裝新瓶嗎?其實不然,這篇文章我們聊聊怎麼做?

首先,成長駭客指的是具有行銷思惟,數據科學家,程式工程師的集合體
怎麼聽起來的情境是慣老闆叫員工一人抵三人
但相信我,你多懂一些事是有幫助的
有一天你可能會自己變老闆要一個打十個
這些事當然一個人做不太來
但是都了解你才能知道缺什麼要找什麼

我們如何學習成為一位成長駭客,或是大數據科學家呢?
首先我們定義目標就是“營業額成長”

第0步就是確認”產品與市場適配(Product Market Fit,PMF)”
如果你身兼行銷與產品創造人員,會有權限與能力去發展出顧客想要的產品
以我而言,我負責三星統計的教育訓練部門,常常是從顧客端得到他們想要什麼,
再去發展課程,成功機率較大,有時失敗發現是因為市場還不足量,例如2012年的時候
我們就開大數據課程(那時候叫資料採礦),上的人不多,到這幾年,已經是班班爆滿

怎麼去確認產品與市場適配(Product Market Fit),

以下有一些建議方法:

1.最低可行產品(Minimum viable product):我曾經在軟體公司看到一個現象,上司一直堅持要做到最好的版本,才要推出市場去銷售,但2年過去了,沒有任何營收,而別家公司早已推出產品且不斷根據建議或客訴去改善,所以時機很重要,你可以先求有再求好

“客戶有需求時,不會強求你是不是個型男,只想先有一個可以依靠的肩膀”

2.焦點群體訪談(Focus Group):根據我們定位的目標客戶,去訪問他們的感想,例如你平常會發明新菜色,請朋友吃看看,他們給你回饋,你再改正,如果你的朋友沒有呼嚨你的話,是可以推出不錯的產品來應戰

另一個案例你可以去看電影”危機女王(Our Brand Is Crisis)”,裡面的珊卓布拉克是個競選輔選顧問,他就訪問了一堆選民,從他們的想法中找出如何賣”候選人”

3.尋求網路上的聲音:最簡單的作法,你可以參考FB的粉絲洞察報告,知道這些人的特性,與利用FB的關鍵字搜索功能,知道他們喜歡什麼,討厭什麼,例如你把FB貼文中有”義美”這個字的文章都過濾出來,從你的眼睛就可以看到他們喜歡義美什麼,討厭義美什麼,重點是網友不知道會被觀察,所以表現出真實的一面

比較進階的做法,你可以去學”網路爬蟲技術“,簡單來說Google就是網路爬蟲技術,把網路上的文章搜尋到並做索引,網路爬蟲可以把網路上的資料下載下來分析,至於合法或非法就另當別論了,下載下來後,可以運用”文字探勘“的技術,去分類出消費者的想法

當然你也可以用問卷去測試,但通常我建議,找資料庫為第1順位,爬網路資料為第2順位,問卷測試為第3順位,這是為了分析的速度,收集資料本身需要耗費時間,有時局勢並不容許我們慢慢來

如果你確定你的產品已經ok
我們就可以開始用”AARRR”這個架構來思考
我非常鼓勵大家用架構來思考
這樣心理會踏實,遇到危機不會慌
當然自古以來文人相輕
會批評哪個架構有缺點
哪個比較好
但是我覺得”你肯去做“比較重要
不然也不會有一本書專門講”執行力”

以AARRR來說的話

第1步:Acquistiton獲取客戶,通常獲取新用戶的方式就是曝光,也就是廣告,但是我們鼓勵你用可以埋”追蹤碼”的方式去下廣告,這樣可以有報表不斷修正自己的缺失,達成數據化思考,數據化檢討,目前看來數位廣告幾乎都能埋追蹤碼,對於修正錯誤有幫助

而以台灣來說,常見的曝光方式有,FB社群廣告,Google廣告,部落格,SEO(搜尋引擎最佳化),EDM(電子郵件廣告),甚至Line推播等方式,
這些方式我們需要先掌握一個原則,就是能夠不花錢最好不花錢,就算要花錢,也要花的戰戰兢兢,
沒有一個公式跟你說要怎麼搭,都是需要是當下的情境去拆解哪種管道接觸消費者最洽當

第2步:Activation激活會員,當你的客戶來過你的網頁後,你起碼會留有他們來過的痕跡(Cookie技術),這樣你起碼可以朝他們”再行銷(Remarketing)“,再行銷目前在FB廣告跟Google廣告都有這個功能,如果以成本論,Google比較便宜,因為版面較多

再行銷可以掌握三個重點:

a.提醒這些人,忘了下訂單要記得下喔

b.廣告通常需要打三次才有效(三打理論),所以掌握適當的頻率,太少沒感覺,太多會麻痺,有一次我鎖定我們某個族群的客戶,下FB廣告,結果忘了這個細節,讓他們一周內平均看了29次廣告

c.交叉銷售,看了東京華盛頓飯店的人,沒有下單,你一直用再行銷提醒他幾天後如果還沒下,就證明他不喜歡這家飯店,但是你可以推薦他東京的其他飯店,因為正常人不會沒事去找東京的飯店,他一定是有需求,那要推哪間?我建議推最好賣或是你毛利最高的產品

如果會員來過你的網頁,那記得要以留下email為主要目的,以後好處多多,除了可以發EDM第一時間通知活動外,email可以跟FB跟Google交叉比對去這些用戶的行為

例如我們家三星統計是做大數據的教育訓練,但是我的老客戶裡面會不會有哈日族,我就不知道了,
學大數據時老師常會講啤酒的尿布的故事,會買啤酒的也會買尿布,但是這個故事有個限制條件,就是這是顧客發生在超市內的行為,出了超市之外的行為就沒data了,
但是我們可以跟FB或Google比對資料來比出這個消費者的其他行為,
透過email跟FB比對,會發現有一群人很愛日本,那我如果要辦個日本深度旅遊,名單就過濾出來了

第3步:Retetion會員回訪,通常你的產品如果不是只做一次生意,那對你滿意的消費者就會不斷”回購”但是我們怎麼知道哪些客人會回購,哪些客人會跟我們分手,這時候你可以利用RFM模型,分類出主要客戶,跟即將分手的客戶,RFM模型很多統計軟體都能做到,Excel也能做到,但由於我出身於SPSS工程師,所以我常用SPSS來展示

第4步:Revennue付費收入:通常快的話在第二階段就會收費有營收了,但有些商品是前面都讓你試用,後面再一舉收費,例如有些網站是免費會員就可以開始用,但是要加值服務就真的要錢包出鞘了

第5步:Referral推薦傳播,推薦這邊我們可以分兩點來看,一個是推薦老客戶其他商品,希望提高客單價,這可以利用到大數據常用的”關聯規則分析“,但這種商業軟體超貴,幾乎可以買一台賓士車,現在的主流是找會R語言的工程師,直接叫他用R語言分析出來,你在網路書店買書,頁面下面的”買這本書也會買什麼書”這種資訊就是這樣來的,當然有些沒有做演算法,就直接呼嚨客戶的也有,但有做真的有差

另外一個推薦,可以從客戶推薦客戶來看,這個可以去學Open Grach開放社交關係圖,簡單說就是可以看到那些朋友也加入這個網站,或是買這樣東西,這樣會促使消費者有從眾行為

這邊幫大家整理一下有哪些學習方向與技術:

1.行銷方面建議你需要:

a.搞懂SWOT-STP-4P的正確邏輯

b.病毒行銷要怎麼設計?

c.EDM (相信我,不管怎麼變,短期內大家還是會收發email)

d.SEO搜尋引擎優化

e.FB廣告

f.Google關鍵字廣告

g.網站流量分析Google Analytics

h.廣告文案撰寫

2.數據科學家方面(也就是常講的大數據):

a.基礎統計觀念:這樣你才知道怎麼調查人心會準確

b.第二代統計學的反映型指標與形成型指標:可以用來找出高所得的客群

c.A/B Testing 其實就是費雪的隨機對照實驗:可以測出價錢,顏色,功能,廣告標題,廣告圖片,有沒有顏文字,需不需要多連結或單連結,哪個版本比較好,比較嚴謹的作法是除了比較大小外,還加進了統計”檢定“的動作,以免讓誤差造成我們判斷錯誤

d.關聯規則分析:可以幫你了解怎麼設計組合包,或推薦什麼商品會命中客戶的心理

e.羅吉斯(Logistic Regression)迴歸:可以猜出這個客人購買的機率

3.程式人員方面:

a.網頁撰寫能力

b.Open Gragh開放社交關係圖

c.機器學習:可以用來歸納出消費者的行為

d.Google Tag Manager(可以用來管理以後只會多不會少的追蹤碼)

其他我有想到,再陸續補充這篇,這是一個東西學不完的年代,也是個有趣的年代

【陳景祥專欄】當統計專家遇上機器學習專家

作者 : 淡江大學統計系 陳景祥老師

今天收到某個合作的公司在上海那邊的人所寄來的一封 email,問到統計專家跟機器學習專家(machine learing) 的差異。我想了一下,回覆了這封 email,順便把我的看法在這裡跟大家分享。

Dear XXXXX,

在您所引述的文章中,Ryan Adams 說: “我认为统计学和机器学习最本质的区别在于根本目标不同。统计学家更关心模型的可解释性,而机器学习专家更关心模型的预测能力。”

身為一個也在研究機器學習的統計學家,我必須說,他的角度是錯的,或者說是偏頗的。因為,統計學家當然也關心預測能力。

統計學家跟機器學習專家的差異,在於機器學習專家很少有懂統計的,但是統計學家跨入學機器學習領域卻是非常容易。

事實上,機器學習源於資訊科學領域 (Computer Science),但資訊科學本身並不像統計領域那麼難入門。舉例來說,我在美國留學的時候,當時就見到不少大陸去唸書的女孩子從中文系、歷史系等文科領域直接跳到資訊電腦相關研究所,而且都很快就能進入狀況。反過來說,要掌握統計相關專業卻不是那麼容易。

我這十幾年指導統計研究生的心得是,他們通常都能在很快的時間內(例如半年)搞定機器學習跟程式語言(programming languages)相關的專業,但我們卻無法期待資訊電腦專家們在兩三年內知道統計領域的專業知識。

不管是統計專家或機器學習專家,甚至是太空物理學家,基本上都是想要建立模型(models)來詮釋這世界的種種現象,但主要的差別在於,統計模型有考慮了隨機誤差,並且對隨機誤差有一整套嚴密的解釋體系,但其他領域的專家所建立的模型未必有考量到隨機誤差。

所以主要的差別在於:
一般科學模型: Y = f(X1,X2,…,Xk)
統計模型: Y = f(X1,X2,…,Xk) + 隨機誤差

如果自然界與人類社會的種種現象沒有這個隨機誤差的存在,整個統計領域可以完全消失也無所謂。但事實當然不是這樣。

此外,過度重視「預測能力」也會有誤導的可能性:所謂的「預測能力好」,到底只是特定時間(某幾個月?)、特定空間(只限於某個國家某個地區中的某個公司?) ?還是這樣的模型在不同時空狀況下表現就很差?

接觸過機器學習、資料探勘、類神經網路(Artificial Neural Network)的人大概都知道,如果沒有整個母體(Population)的模型假設加上隨機誤差模型的搭配,很多號稱「表現很好」的模型,其實過一陣子就都會完蛋,也因此經常需要持續不斷的微調參數。可是,話說回來,一個經常需要不斷調整的模型,能夠認為它表現很好嗎?

我最後做個小結論:

1. 機器學習領域往往是透過過去收集的(大量)資料來當作預測的基礎。如果過去的資料並不完整,無法包含所有可能的狀況,這時候機器學習所得的模型就算短時間內預測很精準,但很快就會完蛋。相反的,有考量母體隨機特性的統計模型,因為模型本身就已經把各種可能性都包含在內,就比較不會受到過去局部資料的太大影響。

2. 機器學習相關技術如果有採納「隨機誤差」的觀念,其實就可以視為是統計模型,所以兩者之間的區分並不是那麼的嚴格。反過來說,除非是像 E = m(C 平方) 這種純物理學模型,不考量隨機誤差現象的任何模型,基本上都是局部的、暫時的,無法長遠表現良好。事實上,很多很厲害的物理學家們在量子力學裡面使用了非常高階的統計模型在分析資料,但這樣的睿智未必能在機器學習領域看到。

【陳景祥專欄】有了大數據卻不一定要用大數據

作者:淡江大學統計系 陳景祥老師

虛擬情境:

資訊出身的「專家」得意的對統計出身的同仁說,有了大數據,母體的資料都可以算
,不再需要統計了!

統計專家問:算一次要多久?

資訊專家說:四天,因為資料量超過 1 PB!

統計專家問:為什麼不乾脆隨機抽出 100 萬筆資料,1 秒就搞定?

結論:
1. 在現有的電腦硬體限制與成本考量下,計算速度太慢的 Big Data, 就算可以使用母體資料,實用性跟即時性都太差!
2. 不懂統計的人以為他們手上的資料就是「母體」。可是,除非這些資料都不再增加,那也僅僅是比較大的樣本而已(更何況,根本不算隨機樣本),怎麼有資格稱為「母體」呢?

【陳景祥專欄】如何預測一篇文章到底是正評、中立、還是負評?

作者:淡江大學統計系 陳景祥老師

文字探勘的情感分析就是取代人力,用電腦預測文章的正評或負評,

進一步就可以收集/偵測網路輿情。

網路上可以抓到的旅館住宿客戶正負評價資料,總共 4000 筆留言。

初步簡單模型分析出來,訓練樣本預測正確率 99.97%,預測樣本的預測正確率 90.75%

接下來的模型還可以再用更複雜的 algorithms 來提升預測正確率