業(yè)務數(shù)據(jù)復雜且多,如何通過海量數(shù)據(jù)定義出核心關(guān)注的指標,用以指導用戶增長和轉(zhuǎn)化? 如何通過數(shù)據(jù)知道用戶體驗產(chǎn)品的核心路徑?如何設計產(chǎn)品的新手引導來提升用戶的體驗?引導更多用戶體驗到產(chǎn)品核心,成為“高轉(zhuǎn)化可能”的用戶? 用戶運營時候,如何通過數(shù)據(jù)清晰現(xiàn)有用戶的畫像,找到各個行業(yè)用戶的核心關(guān)注點,來進行精細化的運營以提升用戶的復購? 這些可能是很多運營在面對海量數(shù)據(jù)的時候都想知道的。我們都知道數(shù)據(jù)有強大的能力,清洗后的數(shù)據(jù)更加能夠指出一條清晰的前進道路。俗話說,一個不會看數(shù)據(jù)的運營不是一個好產(chǎn)品經(jīng)理,作為一個主要通過看數(shù)據(jù)和用戶訪談定性定量分析,然后產(chǎn)出相應策略指導增長的用戶增長產(chǎn)品運營,今天要講幾個硬核的能力,幫助通過數(shù)據(jù)提升運營能力,制定運營策略 運營在數(shù)據(jù)分析的路上,有幾道關(guān),埋點,拿數(shù)據(jù),分析,產(chǎn)出可行運營策略,每一關(guān)都困難重重 以下可能是運營去提取數(shù)據(jù)的真實場景:
這是很普遍的情況,也是可以理解的情況,因為運營的角度,是業(yè)務的角度,但開發(fā)的角度,是數(shù)據(jù)的角度,這個字段里沒有你說的是不是活躍用戶。這時候肯定就會想,好像要一套數(shù)據(jù),能夠清晰告訴我,這個用戶是什么行業(yè),使用了什么功能,是什么商業(yè)模式,處在什么狀態(tài)?。?! 這就引出了一個問題,如何將數(shù)據(jù)清晰梳理,整理出這些可以實際指導業(yè)務的指標呢? 如何通過數(shù)據(jù)定義用戶畫像?
指標定義——場景化定義便于明確需要提取的指標 在和數(shù)據(jù)或者開發(fā)溝通提取數(shù)據(jù)之前,首先需要思考希望得出一個什么樣的畫像結(jié)果,這里可以大膽使用假設,例如
這樣就很明確,一般我會分出兩類型數(shù)據(jù),然后再根據(jù)兩個類型數(shù)據(jù)細化相關(guān)指標。 這里每一類數(shù)據(jù)都可以再細分出細化的數(shù)據(jù)指標,比如說用戶基礎數(shù)據(jù)可以如此細化,其他指標類型也可以如此,根據(jù)產(chǎn)品屬性和需要了解的內(nèi)容選取指標。 數(shù)據(jù)提取——多維數(shù)據(jù)的降維處理 清晰了指標定義,會發(fā)現(xiàn),有一些指標,可能會涉及多維,沒有辦法進行比較和分析。 例如,用戶使用成功創(chuàng)建了某種類型的商品,每個商品的售賣量和銷量都不相同,在考慮該商品功能的使用時候如何進行綜合處理?這里需要降維處理一下數(shù)據(jù),可以加權(quán)平均,或者取眾數(shù),中位數(shù)進行代表,從而降低對比評價出現(xiàn)多維對比的情況。 數(shù)據(jù)分析——發(fā)現(xiàn)到底什么才是“最重要的指標” 一條用戶記錄,關(guān)聯(lián)的數(shù)據(jù)字段是非常多的,一個用戶,付費和不付費的核心差別點是什么?到底什么是讓用戶付費的關(guān)鍵?用戶到底關(guān)注什么? 這可能需要借助分析來看清楚,這里的因變量(用戶的付費)和哪些自變量是相關(guān)聯(lián)的。在這里推薦一個算法,CHAID決策樹,這類決策樹專門用來找出這里面核心影響最終結(jié)果的變量是什么,也就是說,這么多功能,用戶這么多行為,這么多屬性,到底哪種屬性類型的用戶,哪種行為類型的用戶,更容易轉(zhuǎn)化! 決策樹算法是如何計算的? 假定我們需要了解的是用戶如何能夠付費,那付費與否就是要考察的因變量,也是需要決策樹根據(jù)變量情況預測的值 我們把整個數(shù)據(jù)集按照20%,80%分成訓練集和驗證集,即為一部分拿來訓練模型,讓模型從數(shù)據(jù)里找出特征因素,一部分用來印證和預測,判斷模型和挑選的特征變量是不是有效的,擬合度如何 從自變量里抽取2個既定值,與因變量進行卡方檢驗;如卡方檢驗顯示2者關(guān)系不顯著,正面2個既定值可以合并。不斷減少自變量的取值數(shù)量,知道該自變量所有取值均呈現(xiàn)顯著性。 例如,我們的數(shù)據(jù)里有130個自變量,其中很多我們都不知道是否和用戶是否付費相關(guān),不知道用戶每周活躍次數(shù)和用戶付費是否相關(guān),不知道用戶嘗試了某個功能是否和用戶付費相關(guān),這時就通過決策樹的卡方檢驗通過距離來判斷自變量和因變量之間是否相關(guān) 通過比較找出最顯著的自變量,并按照自變量的最終取值對樣本進行分割,也就是形成多個不同的樹(一般CHAID生成兩個樹節(jié)點) 最終展示出所有和用戶付費與否相關(guān)的決策點,其中可能是,直播功能創(chuàng)建超過3個,付費的概率高達80%,決策樹就幫助我們剔除了不相關(guān)或關(guān)聯(lián)性不顯著的自變量,告訴了我們,到底什么才會導致用戶的轉(zhuǎn)化付費。 |
|
來自: 南伯1 > 《制度創(chuàng)新》