全部產品
Search
文件中心

Platform For AI:使用者流失預警風控

更新時間:Jul 13, 2024

本文為您介紹如何通過PAI提供的使用者特徵演算法,快速構建使用者流失模型。

背景資訊

業務發展過程中的重要環節包括開拓新使用者和保留老使用者。通過建立使用者流失預警風控模型,可以預測潛在流失使用者,從而提前通過營運手段防範使用者流失。

對於使用者流失預警監控,主流預警方案均是基於規則實現的,缺少智能化的預測手段和機制,不能準確挖掘潛在流失使用者。

解決方案

PAI提供了一套基於標籤資料的特徵編碼、分類模型訓練及模型評估的完整方案,具體要求如下:

  • 人力要求:需要具備基礎建模的背景知識。

  • 開發週期:1~2天。

  • 資料要求:上千條的標籤資料,該資料標記了歷史客戶在哪種特徵情況下流失。

資料集

本工作流程資料來源於真實的電信領域客戶行為脫敏資料,包含使用者基本資料及使用者流失屬性,共7043條樣本資料。工作流程的樣本資料如下。使用者流失預警實驗資料特徵資料包括如下欄位。

參數

描述

customerid

使用者ID。

gender

性別。

SeniorCitizen

是否為市民,其中:

  • 1:是市民。

  • 0:非市民。

Partner

是否有Partner。

Dependents

是否存在從屬關係。

tenure

客戶在該公司的使用時間長度。

PhoneService

是否提供手機服務。

MultipleLine

是否存在多條線路。

InternetService

互連網服務商。例如DSLFiber optic

OnlineSecurity

是否存在互連網線上安全問題。

OnlineBackup

是否提供線上支援。

DeviceProtection

是否提供裝置保護。

TechSupport

是否申請過支援人員。

StreamingTV

是否提供流TV。

StreamingMovies

是否提供流電影。

Contract

合約時限。例如Month-to-monthTwo year

PaperlessBilling

是否有電子賬單。

PaymentMethod

付款條件。

MonthlyCharges

月消費。

TotalCharges

總消費。

目標資料包括如下欄位。

參數

描述

churn

使用者是否流失。

使用者流失預警風控

  1. 進入Designer頁面。

    1. 登入PAI控制台

    2. 在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應的工作空間。

    3. 在工作空間頁面的左側導覽列選擇模型開發與訓練 > 可視化建模(Designer),進入Designer頁面。

  2. 構建工作流程。

    1. Designer頁面,單擊預置模板頁簽。

    2. 在模板列表的流失使用者監控地區,單擊建立

    3. 建立工作流程對話方塊,配置參數(可以全部使用預設參數)。

      其中:工作流程資料存放區配置為OSS Bucket路徑,用於儲存工作流程運行中產出的臨時資料和模型。

    4. 單擊確定

      您需要等待大約十秒鐘,工作流程可以建立成功。

    5. 在工作流程列表,雙擊流失使用者監控工作流程,進入工作流程。

    6. 系統根據預置的模板,自動構建工作流程,如下圖所示。

      使用者流失工作流程

      地區

      描述

      工作流程的資料集。

      通過one-hot編碼組件和SQL指令碼實現特徵工程建模,將原始字元型特徵轉化為數值型。以目標欄位churn為例,未經處理資料為YesNo,可以通過SQL語句將Yes轉化為1,將No轉化為0,樣本如下。

      select (case churn  when 'Yes' then 1 else 0 end) as churn from  ${t1};

      將資料分為訓練資料集和預測資料集。因為某使用者只有流失與不流失兩種可能性,所以使用者流失預警屬於二分類問題,可以使用二分類演算法進行處理。

      使用二分類評估組件進行模型驗證,可以通過AUC、KS及F1Score等指標評估模型效果。

  3. 運行工作流程並查看模型效果。

    1. 單擊畫布上方的運行

    2. 工作流程運行結束後,按右鍵畫布中的二分類評估,在捷徑功能表,單擊可視化分析

    3. 二分類評估對話方塊,單擊指標資料頁簽,即可查看模型評估指標資料。

      模型效果AUC取值越接近1,表示模型的預測準確率越高。本文中的AUC取值達到0.8以上,即模型的預測準確率較高。