Simple Log ServiceからMaxComputeにログを送信できます。 このトピックでは、新しいバージョンのデータ転送機能の安定性と制限について説明します。
安定性
Simple Log Serviceから読み取られたデータ
項目 | 説明 |
Availability | 高可用性が提供されます。 Simple Log Serviceのエラーにより、MaxComputeデータシッピングジョブがSimple Log Serviceからのデータの読み取りに失敗した場合、ジョブは少なくとも10回再試行されます。 それでもジョブが失敗すると、エラーが報告され、ジョブが再起動されます。 |
MaxComputeへのデータ書き込み
項目 | 説明 |
同時実行 | データ配布インスタンスはシャードに基づいて作成でき、データ配布に使用されるリソースはスケールアウトできます。 データシッピングインスタンスのソースログストア内のシャードが分割されている場合、必要なリソースを数秒以内にスケールアウトして、データエクスポートプロセスを高速化できます。 |
データの整合性 | 必要なリソースは、データの一貫性を確保するためにコンシューマグループに基づいてスケールアウトされます。 詳細については、「コンシューマーグループ」をご参照ください。 オフセットは、データがMaxComputeに出荷された後にのみ送信されます。 これにより、すべてのデータがMaxComputeに確実に送信されます。 |
テーブルのスキーマの変更 | データの配布中にテーブルのスキーマを変更した場合、変更は新しいパーティションにのみ適用されます。 |
ダーティデータの処理
項目 | 失敗したログのカウント | 説明 |
パーティションエラー | 課金されます | パーティションが無効であるか、指定されたパーティションキー列が存在しません。 関連ログはMaxComputeに書き込まれません。 |
無効な列 | 課金されません | Simple Log Serviceの列のデータ型がMaxComputeの対応する列のデータ型と一致しないか、データ型の変換が失敗します。 この場合、列のデータはMaxComputeに書き込まれません。 有効な列のデータのみがMaxComputeに書き込まれます。 |
データ列の長さの超過 | 課金されません | string型またはvarchar型の列のデータの長さが制限を超えています。 この場合、列のデータは切り捨てられ、MaxComputeに書き込まれます。 有効な列のデータがMaxComputeに書き込まれます。 |
モニタリングとアラート
項目 | 説明 |
モニタリングとアラート | データシッピングジョブのレイテンシやトラフィックなどのメトリックに基づいて、データシッピングジョブをリアルタイムで監視できます。 ビジネス要件に基づいてカスタムアラートルールを設定し、データの配布中に発生する例外をできるだけ早く特定できます。 たとえば、データのエクスポートに使用されるデータ配布インスタンスが不十分な場合や、ネットワークのクォータ制限を超えた場合、アラートがトリガーされます。 詳細については、「MaxComputeデータ配布ジョブのアラートの設定 (新バージョン) 」をご参照ください。 |
ジョブの再起動
項目 | 説明 |
過剰なパーティション数 | ジョブの再起動時にパーティションの数が予想よりも多い場合、MaxComputeへのデータ書き込みが5分以内に完了しないことがあります。 その結果、重複データがMaxComputeに書き込まれる可能性があります。 |
データ書き込み失敗 | ジョブの再起動時に認証エラーまたはネットワークエラーが発生した場合、MaxComputeへのデータの書き込みに失敗することがあります。 この場合、重複データがMaxComputeに書き込まれる可能性があります。 |
制限事項
ネットワーク
項目 | 説明 |
リージョン内のデータ送信のためのネットワーク | リージョン内でデータを出荷する場合、データはAlibaba Cloud内部ネットワークを介して送信されます。 ネットワークの安定性と速度を確保できます。 |
読取りトラフィック
項目 | 説明 |
読取りトラフィック | Simple Log Serviceは、単一のプロジェクトと単一のシャードの読み取りトラフィックの上限を設定します。 詳細については、「データの読み取りと書き込み」をご参照ください。 制限を超えた場合は、シャードを分割するか、プロジェクトの制限を増やすために申請する必要があります。 制限を超えてジョブがデータの読み込みに失敗した場合、ジョブは少なくとも10回再試行されます。 それでもジョブが失敗すると、エラーが報告され、ジョブが再起動されます。 |
MaxComputeへのデータ書き込み
項目 | 説明 |
同時インスタンス数 | 最大64のデータ配布インスタンスを同時に実行して、データをエクスポートできます。 Simple Log Serviceのシャード数が64を超える場合、複数のシャードが1つのインスタンスにグループ化されてデータがエクスポートされます。 各インスタンスのシャードの数が同じであることを確認してください。 |
書き込み速度 |
重要 制限を超えると、MaxComputeへのデータ書き込みが不安定になり、MaxCompute側でスロットリングがトリガーされ、FlowExceededまたはSlotExceedエラーが報告されます。 この場合、連絡先 問題を解決するためのMaxComputeテクニカルサポート。 |
データ変更の禁止 | MaxComputeの新しいバージョンのデータ配布機能では、ストリーミングモードでMaxComputeにデータを書き込むことができます。 データがストリーミングモードでMaxComputeに書き込まれると、MaxCompute streaming Tunnelサービスは、MaxComputeテーブルでのデータの更新、削除、および挿入操作を禁止します。 したがって、MaxComputeの新バージョンと旧バージョンのデータ配布機能を同時に使用して、MaxComputeテーブルにデータを書き込むことはできません。 |
特殊テーブルへのデータ書き込み | MaxComputeの外部テーブル、トランザクションテーブル、またはクラスタテーブルにデータを書き込むことはできません。 |
テーブルのスキーマの変更 | MaxComputeテーブルのスキーマが変更された場合、データ配布ジョブを20分間一時停止し、ジョブを再開して変更を有効にする必要があります。 |
権限管理
項目 | 説明 |
書き込み権限 | MaxComputeの書き込み権限をResource Access Management (RAM) ユーザーとRAMロールに付与できます。 MaxComputeコンソールで承認を完了する必要があります。 |
データ型
共通列
データ型
例
説明
String
"こんにちは"
最大長は8 MBです。
datetime
「2021-12-22 05:00:00」
Simple Log Serviceのデータは、MaxComputeのデータ形式要件を満たす必要があります。
date
"2021-12-22"
Simple Log Serviceのデータは、MaxComputeのデータ形式要件を満たす必要があります。
timestamp
1648544867
時間はミリ秒または秒まで正確です。
decimal
1.2
Simple Log Serviceのデータは、MaxComputeのデータ形式要件を満たす必要があります。
char
"こんにちは"
最大長は255バイトです。
varchar
"こんにちは"
最大長は65,535バイトです。
binary
"こんにちは"
最大長は8 MBです。
bigint
123
64ビット符号付き整数がサポートされています。
Boolean
1
1、t、T、true、TRUE、およびTrueは、Trueに構文解析されます。
0、f、F、false、FALSE、およびFalseは、Falseに構文解析されます。
double
1.2
64ビット浮動小数点数がサポートされています。
float
1.2
32ビット浮動小数点数がサポートされています。
integer
123
32ビット符号付き整数がサポートされています。
smallint
12
16ビット符号付き整数がサポートされています。
tinyint
12
8ビットの符号付き整数がサポートされています。
パーティションキー列
項目
説明
パーティションキー列
データは文字列として処理され、MaxComputeのデータ形式要件を満たす必要があります。
データ出荷管理
項目 | 説明 |
データ配布ジョブの一時停止 | データ配布ジョブを一時停止すると、そのジョブは最後に配布されたログのカーソルを記録します。 ジョブを再開した後、ジョブは記録されたカーソルからログを送信し続けます。 Simple Log Serviceは、データ配布ジョブを一時停止するときに次のメカニズムを実装します。
|
MaxCompute IPアドレスホワイトリスト
項目 | 説明 |
クラシックネットワークのMaxCompute IPアドレスホワイトリスト | MaxComputeプロジェクトでクラシックネットワークのIPアドレスホワイトリストを有効にすると、データがMaxComputeプロジェクトに送信されない可能性があります。 この問題を解決するには、MaxCompute側で次のコマンドを実行します。
|