すべてのプロダクト
Search
ドキュメントセンター

OpenSearch:データ収集 V2.0

最終更新日:Dec 28, 2024

行動データのOpenSearchへのアップロードによるメリット

  • 行動データを使用することで、閲覧、クリック、滞在時間、いいね、共有、お気に入り追加、購入など、検索結果に対するユーザーの反応を理解できます。これは、検索効果を最適化するためのガイダンスとなります。

  • OpenSearchのレポート統計機能を使用すると、ページビュー(PV)、商品ページビュー(IPV)、クリックスルー率(CTR)など、アプリケーションのさまざまな検索レポートを表示できます。レポートに基づいてビジネスオペレーションを改善できます。

  • OpenSearchはアルゴリズムプラットフォームを提供しており、検索行動のフィードバックデータを使用して検索およびソートアルゴリズムモデルをトレーニングできます。これは、検索効果の向上に役立ちます。

使用上の注意

  • データ収集機能は、アプリケーションの作成後に自動的に有効になります。

  • データとは、検索結果に対するユーザーの反応のフィードバックデータを指します。

  • 収集とは、OpenSearch SDKを使用して検索行動データをOpenSearchにアップロードするプロセスを指します。最新バージョンでは、OpenSearchではサーバーSDKを使用してのみ検索行動データを収集できます。モバイルSDKまたはWeb SDKを使用して検索行動データを収集する機能は開発中です。

  • 以前のデータ収集機能と比較して、データ収集V2.0機能では、パラメーターの受け渡しとSDKの使用が容易になっています。OpenSearchを初めて使用する場合は、このトピックで説明されているフィールドを使用して、OpenSearch SDKを使用して行動データをアップロードできます。 Java 3.4.0用SDKPHP 3.2.0用SDKは、データ収集V2.0をサポートしています。

行動データをアップロードする

:OpenSearchコンソールで行動データ収集機能を有効にした後、SDKを使用して行動データをアップロードすることをお勧めします。次のセクションでは、行動データのアップロードに使用されるフィールドについて説明します。 説明

  1. SDKを使用して行動データをアップロードするには、次のフィールドを指定する必要があります:imeiまたはuser_id、biz_id、trace_id、rn、bhv_type、bhv_time、item_id、item_type。

  2. API操作を呼び出して行動データをアップロードするには、上記のフィールドに加えてreach_timeフィールドも指定する必要があります。

  3. SDKの使用またはAPI操作の呼び出しによる行動データのアップロードのデモの詳細については、データ収集V2.0用SDKを参照してください。

行動データフィールドの説明

ID

フィールド

タイプ

説明

必須

1

app_version

STRING

行動データを収集するWebサイトまたはモバイルアプリのバージョン番号。

いいえ

2

sdk_type

STRING

行動データのアップロードに使用されるSDKのタイプ。OpenSearchはこのフィールドを使用して、行動データがサーバーSDKまたはモバイルSDKを使用してアップロードまたは収集されたかどうかを区別します。

いいえ。OpenSearch SDKを使用して行動データをアップロードする場合、このフィールドはデフォルトでopensearch_sdkに設定されます。

3

sdk_version

STRING

行動データのアップロードに使用されるSDKのバージョン番号。

いいえ。OpenSearch SDKを使用して行動データをアップロードする場合、このフィールドはデフォルトで指定されます。

4

login

STRING

ユーザーが行動データを収集するWebサイトまたはモバイルアプリにログオンしているかどうかを指定します。

有効な値:0と1。0:ユーザーがログオンしていないことを示します。1:ユーザーがログオンしていることを示します。

いいえ

5

user_id

STRING

ユーザーを一意に識別するために使用されるID。

いいえ。ただし、imeiフィールドまたはuser_idフィールドのいずれかを指定する必要があります。

6

imei

STRING

ユーザーデバイスのID。有効な値:imei、device_id、idfa。

いいえ。ただし、imeiフィールドまたはuser_idフィールドのいずれかを指定する必要があります。

7

biz_id

STRING

異なる検索サービスを区別するために使用される数値ID。一般に、biz_idフィールドはOpenSearchアプリケーションを表します。複数のbiz_idフィールドを指定して、Web、iOS、Androidアプリケーションを表すことができます。これらのフィールドを使用して、後続の手順でトラフィックを分割し、テストを実行できます。

検索サービスを区別しない場合は、このフィールドをdefaultに設定することをお勧めします。検索サービスを区別する場合は、ビジネス要件に基づいてこのフィールドをpc、ios、またはandroidに設定できます。

はい

8

trace_id

STRING

ドキュメントが検索および収集される検索サービスのプロバイダー。

ドキュメントがOpenSearchから検索および収集される場合は、このフィールドをAlibabaに設定します。ドキュメントが別のサービスプロバイダーから検索および収集される場合は、ビジネス要件に基づいてこのフィールドを指定します。

はい

9

trace_info

STRING

このフィールドの値は、OpenSearchが検索結果で返すops_request_miscパラメーターの値です。ops_request_miscパラメーターの値をそのまま渡します。

いいえ

注:trace_idフィールドがAlibabaに設定されている場合は、このフィールドを渡す必要があります。このフィールドは、検索結果がOpenSearchから提供されているかどうかを確認するために使用されます。

10

rn

STRING

このフィールドは、PVを識別するために使用されます。このフィールドの値は、OpenSearchが検索結果で返すrequest_idパラメーターの値です。request_idパラメーターの値をそのまま渡します。

はい

11

item_id

STRING

ドキュメントのプライマリキー値。このフィールドの値は、OpenSearchアプリケーションのプライマリテーブルのプライマリキー値です。

はい

12

item_type

STRING

ドキュメントのビジネスタイプ。

このフィールドの有効な値の詳細については、このトピックのitem_typeフィールドの説明セクションを参照してください。

はい

13

bhv_type

STRING

行動のタイプ。例:表示、滞在、閲覧、お気に入り追加、ダウンロード。

このフィールドの有効な値の詳細については、このトピックの一般的な行動タイプセクションを参照してください。

はい

14

bhv_value

STRING

行動を測定するために使用される値。例:滞在時間、購入された商品の数。

このフィールドの有効な値の詳細については、このトピックの一般的な行動タイプセクションを参照してください。

いいえ

15

bhv_time

STRING

行動が発生した時刻。値は秒単位の精度のUNIXタイムスタンプです。

はい

16

bhv_detail

STRING

行動の詳細な説明。

このフィールドの形式はkey=value{,key=value}です。値には1つ以上のkey=valueペアを含めることができます。

いいえ

17

ip

STRING

行動が発生した携帯電話または端末デバイスのIPアドレス。

いいえ。ただし、このフィールドを指定することをお勧めします。

18

longitude

STRING

行動が発生した場所の経度。

いいえ。ただし、このフィールドを指定することをお勧めします。

19

latitude

STRING

行動が発生した場所の緯度。

いいえ。ただし、このフィールドを指定することをお勧めします。

20

session_id

STRING

ユーザーセッションのID。

いいえ。ただし、このフィールドを指定することをお勧めします。

21

spm

STRING

このフィールドは、行動が発生したページモジュールを追跡するために使用されます。

このフィールドのエンコード形式はa.b.c.dで、サイトID、ページID、モジュールID、場所IDを示します。

いいえ

22

report_src

STRING

このフィールドは、行動データのアップロードに使用される方法を識別するために使用されます。

有効な値:1、2、3、patch_data。

  • 1:OpenSearch SDKを呼び出して行動データがアップロードされたことを示します。

  • 2:モバイルSDKを呼び出して行動データが収集されたことを示します。

  • 3:OpenSearch API操作を呼び出して行動データがアップロードされたことを示します。

  • patch_data:履歴データまたは他のソースのデータとともに行動データがアップロードされたことを示します。

いいえ

23

mac

STRING

行動データを収集する携帯電話または端末デバイスのメディアアクセス制御(MAC)アドレス。

いいえ

24

brand

STRING

行動データを収集する携帯電話または端末デバイスのブランド。

いいえ。ただし、このフィールドを指定することをお勧めします。

25

device_model

STRING

行動データを収集する携帯電話または端末デバイスのモデル。

いいえ

26

resolution

STRING

行動データを収集する携帯電話または端末デバイスの画面解像度。

いいえ

27

carrier

STRING

行動データを収集する携帯電話または端末デバイスのキャリア。

いいえ

28

access

STRING

行動データを収集する携帯電話または端末デバイスに接続されているネットワーク。

いいえ

29

access_subtype

STRING

行動データを収集する携帯電話または端末デバイスに接続されているネットワークのタイプ。

いいえ

30

os

STRING

行動データを収集する携帯電話または端末デバイスのオペレーティングシステム。

いいえ

31

os_version

STRING

行動データを収集する携帯電話または端末デバイスのオペレーティングシステムのバージョン。

いいえ

32

language

STRING

行動データを収集する携帯電話または端末デバイスに設定されている言語。

いいえ

33

phone_md5

STRING

携帯電話番号のMD5ハッシュ値。

いいえ

34

reserve1

STRING

予約フィールド。

いいえ

35

reserve2

STRING

予約フィールド。report_srcフィールドがpatch_dataに設定されている場合は、reserve2フィールドをraw_queryフィールドの値に設定する必要があります。

いいえ

36

reach_time

BIGINT

サーバーがデータを受信した時刻。値は秒単位の精度のUNIXタイムスタンプです。

はい。OpenSearch SDKを使用して行動データをアップロードする場合、このフィールドはSDKによって自動的に設定されます。OpenSearchのAPI操作を呼び出して行動データをアップロードする場合、このフィールドを指定する必要があります。

item_typeフィールドの説明

ID

item_type

説明

1

goods

商品

2

article

記事、ブログ、小説

3

ask

Q&A

4

bbs

フォーラムの投稿

5

download

アイテムのダウンロード

6

image

画像

7

media

映画、テレビ番組、音楽などのマルチメディア

8

recipe

食品とレシピ

9

news

ニュースと情報

10

institution

組織

11

other

その他

一般的な行動タイプ

ID

bhv_type

説明

bhv_value

bhv_detail

1

expose

アイテムを表示する行動。

空。

2

stay

ページに滞在する行動。

滞在時間。単位:秒。

3

click

アイテムをクリックする行動。

クリック数。デフォルト値:1。

4

cart

アイテムをショッピングカート、本棚、またはプレイリストに追加する行動。

空。

5

buy

アイテムを購入する行動。

購入されたアイテムの数。デフォルト値:1。

例:buy_price=12,price_unit=CNY

  • buy_priceフィールドの値は、注文が行われたときのアイテムの価格を示します。

  • デフォルトでは、price_unitフィールドはCNYに設定されています。

6

collect

アイテムをお気に入りに追加する行動。

空。

7

like

アイテムに「いいね」をする行動。

「いいね」の数。デフォルト値:1。

8

dislike

アイテムに「よくないね」をする行動。

「よくないね」の数。デフォルト値:1。

9

comment

アイテムにコメントする行動。

コメント数。デフォルト値:1。

10

share

アイテムを共有または転送する行動。

共有または転送の数。デフォルト値:1。

11

subscribe

アイテムをフォローまたは購読する行動。

空。

12

gift

ギフトを送信する行動。

空。

13

download

アイテムをダウンロードする行動。

空。

14

read

アイテムを読む行動。

空。

15

tip

アイテムに報酬を与える行動。

空。

16

complain

アイテムについて苦情を申し立てる行動。

空。

データレポートを表示する

データ収集機能を有効にして、特定量の行動データをアップロードした後、データ収集ページでデータの状態と品質を表示できます。

验证报告

データの状態

データの状態は、正常(利用可能)または異常(利用不可)です。正常(利用可能)は、行動データに品質の問題がなく、行動データが検証されていることを示します。異常(利用不可)は、行動データに品質の問題が発生していることを示します。

データの状態が異常(利用不可)の場合、人気モデルとカテゴリ予測の作成とトレーニングに影響を与える可能性があります

異常データ

5

正常データ

6

データ品質

行動データの品質チェックが失敗した場合、OpenSearchコンソールのデータ検証ページにエラーメッセージが表示されます。品質チェックに合格した場合、データ検証ページにエラーメッセージは表示されません。7:上記の図でチェックされたサンプルデータは、毎時初めにサンプル品質チェックが実行される1時間前にOpenSearchに同期された行動データです。