ApsaraMQ for Kafka は、Apache Kafka をベースに構築されたフルマネージドの分散メッセージングサービスです。独自の Kafka クラスターを運用するオーバーヘッドなしで、リアルタイムデータパイプラインに高スループットと伸縮自在なスケーラビリティを提供します。ApsaraMQ for Kafka は、ビッグデータエコシステムに不可欠な要素です。
一般的なワークロードには、ログ収集、モニタリングデータの集約、ストリーミングデータ処理、大規模なオンラインおよびオフライン分析などがあります。
%E8%8B%B1%E6%96%87%E7%89%88Kafka-%E4%BF%AE%E6%94%B9%E7%AC%AC%E4%B8%89%E7%89%88.mp4
マネージド Kafka サービスの利点
本番環境で Apache Kafka を実行するには、多大な運用投資が必要です。ApsaraMQ for Kafka は以下のタスクを処理するため、お客様はアプリケーションの構築に集中できます:
クラスターのプロビジョニングと構成 -- 手動設定なしで、すぐに使用できる Kafka クラスターをデプロイします。
パッチ適用とバージョンアップグレード -- 最小限の中断で、セキュリティパッチと Kafka のバージョンアップデートを適用します。
モニタリングとアラート -- 統合ツールを通じて、クラスターの状態とスループットを追跡します。
伸縮自在なスケーリング -- 変化するワークロードに合わせて、ブローカーのキャパシティとストレージをスケーリングします。
セルフマネージドの Apache Kafka と比較して、ApsaraMQ for Kafka はインフラコストを削減し、信頼性を向上させ、より少ない労力でスケーリングできます。
ネットワークアクセス
ApsaraMQ for Kafka では、インターネット経由または Virtual Private Cloud (VPC) 内でインスタンスにアクセスできます。お客様は VPC を完全に管理できます:CIDR ブロックの定義、ルートテーブルとゲートウェイの構成、および Kafka クラスターと並行して Elastic Compute Service (ECS) インスタンス、ApsaraDB RDS インスタンス、Server Load Balancer (SLB) インスタンスなどの他の Alibaba Cloud サービスをデプロイできます。
ユースケース
ApsaraMQ for Kafka は、さまざまなビッグデータおよびリアルタイム処理シナリオをサポートします:
ユーザー行動分析 -- Web サイトのユーザーアクションとクリックストリームデータを分析して、利用パターンを理解します。
ログ集約 -- 分散アプリケーションとインフラストラクチャからログを収集し、検索、アラート、分析のための中央パイプラインに集約します。
モニタリングと可観測性 -- 複数のソースからモニタリングデータを集約し、ダッシュボードやアラートシステムにストリーミングして、リアルタイムの運用可視性を実現します。
ストリーム処理 -- リアルタイムでデータに反応するイベント駆動型アーキテクチャを構築します。
オフラインデータ分析 -- 大量のイベントストリームをバッファリングし、データウェアハウスにロードして、履歴分析とレポート作成を行います。
エコシステム連携
ApsaraMQ for Kafka は、データの移動と処理のために、Alibaba Cloud サービスおよびオープンソースフレームワークと連携します。
データ統合
Kafka トピックから下流のストレージおよび分析システムにメッセージを移動します:
| ターゲットサービス | ユースケース |
|---|---|
| MaxCompute | 大規模データウェアハウジングとバッチ分析 |
| Object Storage Service (OSS) | 長期保存とアーカイブ |
| ApsaraDB RDS | リレーショナルデータベースの同期 |
| Hadoop / HBase | ビッグデータワークロード向けの分散ストレージ |
ストリーム処理エンジン
継続的なデータ処理のために、Kafka をリアルタイムコンピュートエンジンに接続します:
| エンジン | ユースケース |
|---|---|
| Realtime Compute for Apache Flink | マネージドストリーム処理 |
| E-MapReduce (EMR) | バッチおよびストリーミング用のマネージド Hadoop および Spark クラスター |
| Spark | インメモリ分析とストリーミング |
| Storm | 低レイテンシーのイベントごとのストリーム処理 |

はじめに
目的に応じて開始点を選択してください:
最初のインスタンスの作成 -- クイックスタートガイドに従って Kafka インスタンスをプロビジョニングし、最初のメッセージを生成します。
基本概念の理解 -- トピック、パーティション、コンシューマーグループ、および ApsaraMQ for Kafka がデータをどのように構成するかについて学びます。
アプリケーションの接続 -- SDK を使用して、Kafka プロデューサーとコンシューマーをアプリケーションに統合します。
データパイプラインの設定 -- コネクタを構成して、Kafka と他の Alibaba Cloud サービス間でデータを移動します。