全部產品
Search
文件中心

Platform For AI:基於圖演算法實現金融風控

更新時間:Jul 13, 2024

本文為您介紹如何基於圖演算法,實現金融風控。

背景資訊

圖演算法通常適用於關係網狀的業務情境。與常規結構化資料不同,圖演算法將資料整理為首尾相連的關係圖譜,需要考慮邊和點。PAI提供了豐富的圖演算法組件,包括K-Core、最大聯通子圖及標籤傳播聚類等。

本實驗以人物通聯關係圖(如下圖所示)為例,基於圖演算法實現金融風控。兩人之間的連線表示兩人具有一定關係,可以是同事或親人等。已知Enoch為信用使用者,Evan為欺詐使用者,通過圖演算法可以計算其它人的信用指數,獲得每個人為欺詐使用者的機率,從而指導相關機構進行金融風控。任務關係圖

資料集

本工作流程資料集的具體欄位如下。

欄位名

含義

類型

描述

start_point

邊的起始節點

STRING

人物。

end_point

邊的結束節點

STRING

人物。

count

關係緊密度

DOUBLE

數值越大,兩人的關係越緊密。

資料的樣本如下。樣本資料

基於圖演算法實現金融風控

  1. 進入Designer頁面。

    1. 登入PAI控制台

    2. 在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應的工作空間。

    3. 在工作空間頁面的左側導覽列選擇模型開發與訓練 > 可視化建模(Designer),進入Designer頁面。

  2. 構建工作流程。

    1. Designer頁面,單擊預置模板頁簽。

    2. 在模板列表,單擊圖演算法-金融風控實驗下的建立

    3. 建立工作流程對話方塊,配置參數(可以全部使用預設參數)。

      其中:工作流程資料存放區配置為OSS Bucket路徑,用於儲存工作流程運行中產出的臨時資料和模型。

    4. 單擊確定

      您需要等待大約十秒鐘,工作流程可以建立成功。

    5. 在工作流程列表,雙擊圖演算法-金融風控實驗,進入工作流程。

    6. 系統根據預置的模板,自動構建工作流程,如下圖所示。

      image.png

      地區

      描述

      首先通過最大聯通子圖組件將資料中的群體分為兩部分,並賦予group_id。然後通過SQL指令碼組件和JOIN組件去除圖中的無關聯人員。

      最大聯通子圖組件可以尋找具有通聯關係的最大集合,從而排除團隊中與風控無關的人,如下圖所示。最大連通集合

      探查每個人的一度人脈及二度人脈等關係。單源最短路徑組件的輸出結果中,distance表示Enoch通過幾個人可以聯絡到目標人,如下圖所示。單元最短路徑結果

      首先通過讀資料表組件匯入標籤資料(weight表示目標屬於欺詐使用者的機率,如下圖所示)。然後通過標籤傳播分類組件預測未標記節點的標籤資訊。最後通過SQL指令碼篩選結果,從而展示每個人的涉嫌欺詐機率。打標資料樣本

      標籤傳播分類演算法為半監督的分類演算法,其輸入包括人物通聯圖和標籤資料,通過已標記節點的標籤資訊預測未標記節點的標籤資訊。演算法執行過程中,每個節點的標籤根據相似性傳播給相鄰節點。

  3. 運行工作流程並查看輸出結果。

    1. 單擊畫布上方的image

    2. 工作流程運行結束後,按右鍵地區③中的SQL指令碼,在捷徑功能表,單擊查看資料,即可查看每個人的欺詐機率。封控結果