本文為您介紹如何基於外賣評論實現輿情風控。
背景資訊
許多商家都有線上留言或評論反饋平台,消費者可以留言以表達自己對消費商品的反饋。消費者的反饋包括表揚性的正向反饋和批評性的負向反饋,商家需要掌握消費者對於商品的整體輿論取向,進而判斷自己的商品品質是否符合消費者需求。同時,瞭解評論內容可以方便商家分析輿論導向,指導產品研發。
商家的評論反饋平台每天都會產生大量留言,傳統的方式是通過人工統計進行輿論情緒收集。該方式不僅效率低,而且很難針對大規模輿論進行精確統計,因此需要自動化方式收集並判斷留言的輿論導向。PAI平台提供了一套基於文本向量化及分類的演算法,可以基於歷史標記的正負留言內容產生分類模型,從而自動預測新增留言的導向。該服務的整體架構已預置在Designer中,基於真實標記的11987條外賣平台評論資料,實現了自動化的正反向輿論風控,準確性達到75%左右。
您可以使用Designer預置的工作流程範本,在1~2天內快速實現輿情風控方案,從而對留言進行批量智能化分析。隨著評論資料的累計,該模型的準確性會逐漸提高。該方案適用於各種文本分析情境,例如垃圾郵件分類及新聞正反情緒分類。
資料集
本工作流程的資料集為真實脫敏的外賣平台標記資料,具體的欄位如下。
欄位名 | 欄位類型 | 描述 |
label | DOUBLE | 標籤,含義如下:
|
review | STRING | 實際的評論資料。 |
資料的樣本如下。
基於外賣評論實現輿情風控
進入Designer頁面。
登入PAI控制台。
在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應的工作空間。
在工作空間頁面的左側導覽列選擇 ,進入Designer頁面。
構建工作流程。
在Designer頁面,單擊預置模板頁簽。
在模板列表的基於外賣評論的輿情風控地區,單擊建立。
在建立工作流程對話方塊,配置參數(可以全部使用預設參數)。
其中:工作流程資料存放區配置為OSS Bucket路徑,用於儲存工作流程運行中產出的臨時資料和模型。
單擊確定。
您需要等待大約十秒鐘,工作流程可以建立成功。
在工作流程列表,雙擊基於外賣評論的輿情風控工作流程,進入工作流程。
系統根據預置的模板,自動構建工作流程,如下圖所示。
地區
描述
①
資料來源,即評論資料。
②
停用詞。可以過濾助動詞及標點符號,需要手動上傳停用詞表,樣本如下。
③
文本向量化。使用Doc2Vec演算法將每個評論轉換為語義向量,每行表示一個向量,每個向量表示一個評論的含義。工作流程運行結束後,您可以按右鍵畫布中的Doc2Vec,在捷徑功能表中選擇
,即可查看文本向量表。④
產生分類模型。首先將向量化的文本通過拆分演算法,拆分為訓練集和測試集。然後將訓練集通過羅吉斯迴歸演算法,訓練產生二分類模型,該模型可以判斷評論的正反導向。
⑤
通過混淆矩陣演算法,驗證模型的實際效果。
運行工作流程並查看輸出結果。
單擊畫布上方的。
工作流程運行結束後,按右鍵畫布中的混淆矩陣,在捷徑功能表,單擊可視化分析。
在混淆矩陣地區,單擊統計資訊頁簽,即可查看模型評估的統計資訊。