愛伊米

資料分析|標籤體系都有哪些?

標籤體系是整個使用者畫像建設的地基,不打好地基,摩天大樓就不可能平地而起。草帽小子在做調研及規劃過程中,就深深認識到標籤體系的重要性,接下來重點介紹標籤體系。

01

標籤分類

不同公司的標籤分類有所不同,目前市面上有三種常用的標籤分類方式:按用途分類,可分為基礎資訊、使用者行為、業務偏好、場景標籤;按統計方式分類,可分為事實類標籤、規則類標籤、預測類標籤;按時效分類,可分為靜態標籤、動態標籤。

1.1

按用途分類

按用途分類的標籤,可分為基礎資訊、使用者行為、業務偏好、場景標籤。通常面向產品/業務人員,分類時需要根據實際的業務需要進行類別劃分,以便適配業務人員在通用場景和定製場景下標籤的使用。

資料分析|標籤體系都有哪些?

1) 基礎資訊標籤

基礎資訊標籤,是用於描述使用者的基礎屬性,包含自然屬性、社會屬性、業務屬性等,如性別、年齡、常駐城市、RFM、會員等級等標籤。

年齡

人們在一生中購買不同的商品和服務,在幼年時吃嬰兒食品,在發育時期和成年時期吃各類食物,在晚年吃特殊的低熱量食品。人們對衣服、家居和娛樂等的喜好也跟年齡有關,這也就是為什麼年齡是畫像中常用的標籤。

職業和收入水平

職業影響一個人的消費模式,如藍領工人通常會買工作服,公司的董事長則會買名牌服裝及高階產品。不同職業的人群收入水平不同,針對高收入水平的消費者,可向其推薦更優質的商品,促進商品轉化率。

2) 使用者行為標籤

心理學家馬斯洛認為,在某一特定時間,人們會受到特定需求的趨勢。他的理論是,人類的需求是按層次排列的,從最迫切的需求到最不迫切的需求。按重要程度排列,這五種需求分別是:生理需求、安全需求、社會需求、尊重需求和自我實現需求。消費者總是先尋求滿足最重要的需求,當最重要的需求得到滿足之後,他就會尋求滿足下一個最迫切的需求。

使用者行為類標籤,主要透過洞察使用者在最近一段時間內的各類行為,如瀏覽、搜尋、收藏、加購等,進一步提煉出使用者的需求。使用者搜尋或加購某一型別的商品頻率越高,其消費需求就表現得愈加強烈。提煉出的常見標籤包括近7天上網時段、近30天收藏品類、近30天消費頻度等。運營者可透過組合圈選擇有多種行為的使用者,為其定向推送相關商品。

3) 業務偏好標籤

業務偏好標籤,用於描述使用者的偏好業務內容,根據公司業務不同,劃分不同的分類,通常電商行業業務偏好類標籤包含運動戶外、數碼家電、食品保健等,其他行業的業務偏好標籤根據實際業務而定。

一般情況下,以上這3類標籤即可滿足常用的標籤使用需求,因為其已描述who(基礎資訊)do(使用者行為)what(業務偏好)的整個過程,該使用者的行為合集構成了整個使用者畫像。

但隨著標籤的使用,業務人員發現,經常會有些同類似的活動,使用到了類似的標籤組合,類似的人群包。於是這類標籤組合便可沉澱下來,針對特定場景使用。

4) 場景應用標籤

場景應用標籤,用於特定場景下使用,由業務使用經驗積澱而來,例如618/雙十一活動標籤,雙十一預付定金人群、雙十一下單人群等。標籤建設初期可不設定此分類。

1.2

按統計方式分類

按統計方式分類的標籤可分為事實類標籤、規則類標籤、預測類標籤。與按用途分類不同的是,按統計方式分類的3類標籤通常面向研發人員,意指標籤是按何種方式計算而來,其複雜程度、產研成本由低至高。

1) 事實類標籤

事實類標籤是使用者畫像最基礎、最常見的標籤,通常是基於原始資料清理後的歸類,用於描述客觀事實。例如,姓名、會員等級、終端型別、購買次數、購買金額等。

2) 規則類標籤

規則類標籤,顧名思義,是基於確定的規則而產生。與事實類標籤不同的是,規則類標籤擁有更多的業務屬性,其業務規則需與業務人員共同制定。例如,將“活躍使用者”標籤可定義為,“過去30天發生a行為x次”&“過去30天發生b行為x次”,進行綜合評定。

使用者活躍度標籤

實際業務場景中會涉及根據使用者的活躍情況,給使用者貼上高活躍、中活躍、低活躍、流失等標籤。那這個過程中高中低活躍度對應的時間範圍是如何劃分的呢?

在這裡,靠拍腦門可行不通,標籤講究定義有依據、建設有方法。

首先劃分使用者的流失週期,運用拐點理論:X軸上數值的增加會帶來Y軸數值大幅增益(減益),直到超過某個點之後,當X增加時Y的資料增益(減益)大幅下降,即經濟學裡面的邊際收益的大幅減少,那個點就是圖表中的“拐點”。

資料分析|標籤體系都有哪些?

比如圖中流失週期增加到5周的時候,使用者回訪率的縮減速度明顯下降,所以這裡的5周就是拐點。我們可以用5周作為定義使用者流失的期限,即一個之前訪問/登入過的使用者,如果之後連續5周都沒有訪問/登入,則定義該使用者流失。

劃分完流失週期之後,初期可根據根據四分位數,將使用者的活躍情況劃分為高中低,後期根據資料情況更新規則。

四分位數

也稱為四分位點,是指在統計學中把所有數值從小到大排列並分為四等分,處於三個分割點位置的數值。

如歷史資料,選擇近1個月訪問APP次數在0-8之間,則取3/4分位點為6、1/4分位點為2。

高活躍使用者:近1個月訪問APP次數在[6,8]區間的使用者

中活躍使用者:近1個月訪問APP次數在[2,6]區間的使用者

低活躍使用者:近1個月訪問APP次數在[0,2]區間的使用者

RFM標籤

根據美國資料庫營銷研究所Arthur Hughes的研究,客戶資料庫中有3個神奇的要素,這3個要素構成了資料分析最好的指標:最近一次消費時間、消費頻率、消費金額。

最近一次消費(Recency):指使用者上一次購買的的時間,一般上一次消費時間越近的顧客是質量更佳的顧客。最近一次消費是維繫顧客關係的一個重要指標。

消費頻率(Frequency):顧客在限定時間週期內消費的次數。消費頻率高的顧客,也是滿意度最高的顧客。根據這個指標,可以把客戶分成幾等份,相當於劃分了一個忠誠度的階梯。

消費金額(Monetary):消費金額時產能最直接的衡量指標,也可以驗證“二八定律”,公司80%的收入來自於20%的顧客。

我們在設計RFM標籤時,可根據二八定律來進行標籤分級。

二八定律

二八定律又名80/20定律、帕累托法則,它是在19世紀末由義大利經濟學家帕累託發現的。帕累託認為,在任何一組東西中,最重要的只佔其中一小部分,約20%,其餘80%儘管是多數,卻是次要的。給一個公司帶來80%利潤的是20%的客戶,按照這個原則,如果能把這20%的客戶找出來,提供更好的服務,這對於公司的發展和業績增長起到至關重要的作用。

R:如歷史資料中80%的使用者最近訪問=90日為“遠”。

F:如歷史交易訂單量80%的使用者訂單量=10單為“高頻”。

M:如歷史交易訂單金額80%的使用者交易金額=2000元的為“高額”。

資料分析|標籤體系都有哪些?

客戶型別可劃分為:

① 重要價值客戶:R↑ F↑ M↑,消費金額、消費頻次大且最近有消費的使用者,則為優質客戶;可傾斜更多資源、提供VIP服務、專屬客服通道、個性化服務

②重要保持客戶:R↓ F↑ M↑,消費金額和消費頻次大,但最近無消費,需要喚回;可提供有用資源,透過續訂或更新產品贏回他們

③ 重要發展客戶:R↑ F↓ M↑,消費金額大,且最近有交易,但消費頻次不高,需要重點識別;可交叉銷售,提供會員/忠誠計劃,推薦其他產品

④ 重要挽留客戶:R↓ F↓ M↑,消費金額大,但消費頻次不高且最近無消費,此為最潛在有價值的客戶,需要挽留;可採取push訊息觸達,回訪等措施,來提高留存率

⑤ 一般價值客戶:R↑ F↑ M↓,消費頻次高且最近有消費,但消費金額較小;需要進一步挖掘,向上銷售更高價值的產品

⑥ 一般保持客戶:R↓ F↑ M↓,消費頻次高,但最近無消費且消費金額較小;可向上銷售更高價值的產品

⑦ 一般發展客戶:R↑ F↓ M↓,最近有消費,但消費頻次及金額較小;可按消費型別推薦其感興趣的產品

⑧ 一般挽留客戶:R↓ F↓ M↓,無消費的新使用者;可開展活動,免費試用,提高客戶興趣,建立品牌認知度

3) 預測類標籤

預測類標籤,基於現有事實及規則無法得出,需要運用決策樹演算法、貝葉斯演算法等進行資料探勘與訓練,得出標籤預測結果。

預測類標籤複雜度高、開發週期長、開發成本高,且需要演算法工程師參與,通常此類標籤的佔比較少。

1.3

按時效分類

按時效分類,可分為靜態標籤、動態標籤,方便業務人員在需求提出時做好時間維度的限制,同時方便開發人員在標籤更新時,設定靜態標籤的更新時間更長,提升資料產出效率。

1)靜態標籤

靜態標籤通常用於描述固有屬性,不隨時間的變化而改變,如性別、身高、體重等。

2)動態標籤

動態標籤需要動態更新,來保持標籤的有效性,如近7天購買次數、近30天加購次數等。

02

標籤分級

隨著標籤的增多,當標籤數量發展到成百上千量級時,業務方要從中找一個標籤就會十分困難。所以標籤在建設初期就需要進行分級分類的管理,就像整理電腦資料夾一般,分類清晰的標籤更便於查詢使用。標籤常用的分級結構為:一級標籤、二級標籤、三級標籤、四級…逐級往下分。

資料分析|標籤體系都有哪些?

注意:建設初期要注意的是層級不必生搬硬套、劃分過細,根據標籤建設實際情況劃分即可。如果公司只有幾十個標籤,則劃分至二級足矣,過細反而累贅。

本文摘編自《大資料實踐之路:資料中臺+資料分析+產品應用》,經出版方授權釋出。

草帽小子

資料產品經理一枚;

使用者畫像、埋點、指標體系、BI、廣告投放等系列作者;

《大資料實踐之路:資料中臺+資料分析+產品應用》作者;

“資料人創作組聯盟”成員。

////////////

END

////////////