Spark作业的多集群调度与分发

0.0.201

Apache Spark是一种专门用于大规模数据处理的计算引擎，广泛应用于数据分析和机器学习等场景。本文介绍如何通过ACK One舰队将Spark作业在多集群中进行调度和分发运行，帮助您提升多集群中空闲资源利用率。

工作原理

为关联集群安装ack-spark-operator组件。
为舰队创建SparkApplication和PropagationPolicy。
舰队的多集群调度组件（Global Scheduler）会根据每个关联子集群的剩余资源，来匹配Spark作业资源请求完成调度。
对集群版本为1.28及以上的子集群，舰队支持通过资源预占来提高Spark作业调度的成功率。
舰队调度完作业后，通过多集群应用分发SparkApplication至调度选中的关联集群中。
在关联集群中，ACK Spark Operator负责运行Spark作业的driver和executor。同时舰队会监视子集群中Spark作业运行状态，若driver由于资源不足而无法运行，舰队会在一定时间后回收该SparkApplication，并重调度到其他资源充足的关联集群中。

前提条件

舰队实例已添加多个关联集群，且关联集群版本为1.18及以上。具体操作，请参见管理关联集群。
已授予RAM用户AliyunAdcpFullAccess权限。具体操作，请参见为RAM用户授权。
已安装AMC命令行工具。具体操作，请参见AMC命令行帮助。

步骤一：为关联集群安装ack-spark-operator组件

请先在期望运行Spark作业的子集群上安装ack-spark-operator组件。

登录容器服务管理控制台，在左侧导航栏选择市场 > 应用市场。
在应用市场页面单击应用目录页签，然后搜索并选中ack-spark-operator。
在ack-spark-operator页面，单击一键部署。
在创建面板中，选择集群和命名空间，然后单击下一步。

在参数配置页面，设置相应参数，然后单击确定。

下表列出了部分配置参数的说明。完整的参数配置详情，您可以在ack-spark-operator页面中的配置项查看。

参数	描述	示例值

参数	描述	示例值
`controller.replicas`	控制器副本数量。	1（默认值）
`webhook.replicas`	Webhook副本数量。	1（默认值）
`spark.jobNamespaces`	可运行Spark任务的命名空间列表。包含空字符串表示允许所有命名空间。多个命名空间使用英文半角逗号 `,` 隔开。	`["default"]`（默认值） `[""]`（所有命名空间） `["ns1","ns2","ns3"]`（多个命名空间）
`spark.serviceAccount.name`	Spark作业会在`spark.jobNamespaces`指定的每个命名空间中自动创建名为`spark-operator-spark`的ServiceAccount和RBAC资源并进行相关授权。您可以自定义ServiceAccount名称，后续提交Spark作业时请指定自定义创建的ServiceAccount名称。	`spark-operator-spark`（默认值）

步骤二：在舰队上创建PriorityClass，并分发到子集群

为了保证提交的Spark作业不会抢占在线服务资源、影响在线服务产品的正常运行，建议对要提交的Spark作业设置低优先级。

使用舰队的KubeConfig，创建一个低优先级的PriorityClass，其value设置为负数。

apiVersion: scheduling.k8s.io/v1
kind: PriorityClass
metadata:
  name: low-priority
value: -1000
globalDefault: false
description: "Low priority for Spark applications"

在舰队中创建ClusterPropagationPolicy，将PriorityClass分发到指定集群中。若您希望将PriorityClass分发到所有关联集群，可以将clusterAffinity部分删除。

apiVersion: policy.one.alibabacloud.com/v1alpha1
kind: ClusterPropagationPolicy
metadata:
  name: priority-policy
spec:
  preserveResourcesOnDeletion: false
  resourceSelectors:
  - apiVersion: scheduling.k8s.io/v1
    kind: PriorityClass
  placement:
    clusterAffinity:
      clusterNames:
      - ${cluster1-id} # 您的集群ID。
      - ${cluster2-id} # 您的集群ID。
#      labelSelector:
#        matchLabels:
#          key: value
    replicaScheduling:
      replicaSchedulingType: Duplicated

步骤三：在舰队上提交Spark作业，并调度到子集群

（可选）在舰队中创建Namespace，并下发到子集群。
1. 如果待分发应用所在的命名空间在舰队中不存在，则需要先在舰队实例中创建该命名空间，并确保步骤一中安装组件的spark.jobNamespaces中包含该命名空间。如果命名空间已存在，则可以跳过此步骤。
  使用舰队的KubeConfig，执行以下命令，创建相应命名空间。
```
kubectl create ns xxx
```
2. 子集群也需要相应的命名空间。如果尚未创建，可以使用ClusterPropagationPolicy将舰队中的命名空间下发至各个子集群。
```
apiVersion: policy.one.alibabacloud.com/v1alpha1
kind: ClusterPropagationPolicy
metadata:
  name: ns-policy
spec:
  resourceSelectors:
  - apiVersion: v1
    kind: Namespace
    name: xxx
  placement:
    clusterAffinity:
      clusterNames:
      - ${cluster1-id} # 您的集群ID。
      - ${cluster2-id} # 您的集群ID。
    replicaScheduling:
      replicaSchedulingType: Duplicated
```

在舰队中创建如下的PropagationPolicy，即可将所有sparkoperator.k8s.io/v1beta2的SparkApplication资源下发至相应的集群中。

apiVersion: policy.one.alibabacloud.com/v1alpha1
kind: PropagationPolicy
metadata:
  name: sparkapp-policy 
  namespace: default
spec:
  preserveResourcesOnDeletion: false
  propagateDeps: true
  placement:
    clusterAffinity:
      clusterNames:
      - ${cluster1-id} # 您的集群ID。
      - ${cluster2-id} # 您的集群ID。
#      labelSelector:
#        matchLabels:
#          key: value
    replicaScheduling:
      replicaSchedulingType: Divided
      customSchedulingType: Gang
  resourceSelectors:
    - apiVersion: sparkoperator.k8s.io/v1beta2
      kind: SparkApplication

在舰队中创建SparkApplication，并在driver和executor中指定priorityClassName。创建完成后，该应用将由第2步中的PropagationPolicy分发到调度选中的集群中。

apiVersion: sparkoperator.k8s.io/v1beta2
kind: SparkApplication
metadata:
  name: spark-pi
  namespace: default     # 需要确保命名空间在spark.jobNamespaces指定的命名空间列表中。
spec:
  type: Scala
  mode: cluster
  image: registry-cn-hangzhou.ack.aliyuncs.com/ack-demo/spark:3.5.4
  imagePullPolicy: IfNotPresent
  mainClass: org.apache.spark.examples.SparkPi
  mainApplicationFile: local:///opt/spark/examples/jars/spark-examples_2.12-3.5.4.jar
  arguments:
  - "1000"
  sparkVersion: 3.5.4
  driver:
    cores: 1
    memory: 512m
    priorityClassName: low-priority
    serviceAccount: spark-operator-spark   # 如果您自定义了ServiceAccount名称，则需要进行相应修改。
  executor:
    instances: 1
    cores: 1
    memory: 512m
    priorityClassName: low-priority
  restartPolicy:
    type: Never

步骤四：查看Spark作业

在舰队中执行以下命令，查看舰队中Spark作业的状态。

kubectl get sparkapp

预期输出：

NAME       STATUS    ATTEMPTS   START                  FINISH       AGE
spark-pi   RUNNING   1          2025-02-24T12:10:34Z   <no value>   11s

在舰队中执行以下命令，在事件中查看Spark作业调度至哪个关联集群。

kubectl describe sparkapp spark-pi

预期输出：

 Normal   ScheduleBindingSucceed  2m29s                  default-scheduler                   Binding has been scheduled successfully. Result: {c6xxxxx:0,[{driver 1} {executor 1}]}

在舰队中执行以下命令，查看关联集群中Spark作业的状态。

kubectl amc get sparkapp -M

预期输出：

NAME       CLUSTER     STATUS      ATTEMPTS   START                  FINISH                 AGE   ADOPTION
spark-pi   c6xxxxxxx   COMPLETED   1          2025-02-24T12:10:34Z   2025-02-24T12:11:20Z   61s   Y

在舰队中执行以下命令，查看Pod状态。

kubectl amc get pod -M

预期输出：

NAME              CLUSTER     READY   STATUS      RESTARTS   AGE
spark-pi-driver   c6xxxxxxx   0/1     Completed   0          68s

在舰队中执行以下命令，查看关联集群中Spark作业的详情。
```
kubectl amc get sparkapp spark-pi -m ${member clusterid} -oyaml
```

反馈

上一篇：如何在舰队集群中使用KubeQueue并通过Gang调度PyTorchJob下一篇：基于实际剩余资源的多集群Spark作业调度与分发

本页导读（1）

工作原理

前提条件

步骤一：为关联集群安装ack-spark-operator组件

步骤二：在舰队上创建PriorityClass，并分发到子集群

步骤三：在舰队上提交Spark作业，并调度到子集群

步骤四：查看Spark作业

联系我们

立即和Alibaba Cloud在线服务人员进行交谈，获取您想了解的产品信息以及最新折扣。

工作原理

前提条件

步骤一：为关联集群安装ack-spark-operator组件

步骤二：在舰队上创建PriorityClass，并分发到子集群

步骤三：在舰队上提交Spark作业，并调度到子集群

步骤四：查看Spark作业

销售支持

客户支持

聆听 & 举报违规

关于阿里云

阿里云全球基础设施

快速入门

全球办事处

2024年巴黎奥运会 New

罗兰加洛斯球场 - 岁月沉淀的辉煌 New

协和广场 - “打破”障碍 New

马恩河畔韦尔水上运动体育场 - 可持续的体育运动 New

国际广播中心 - 优质图像、声音和数据触达数十亿观众 New

客户成功案例 New

阿里云信任中心

合规计划

云合规资源

合规常见问题

云产品快报 New

Cloud Forward

新闻报道

阿里云电子期刊 New

阿里云调研分析报告

公告

阿里云出海业务 New

“橙”云出海服务联盟

Asia Accelerator Hot

信息合规

China Gateway - MLPS 2.0 合规 New

China Gateway - 网络

China Gateway - 全球应用加速 New

China Gateway - 安全

China Gateway - 数据安全 New

ICP支持服务 Hot

China Gateway - 全域数据中台 New

China Gateway - 一方数据中台 New

China Gateway - 业务中台 New

China Gateway - 智能客服解决方案 New

China Gateway - 在线教育

China Gateway - 域名注册

在阿里云工作

经验丰富的专业人士

学生和毕业生

免费试用

定价

优惠中心

降价

花钱更少，部署更多

FinOps

云服务器 ECS

轻量应用服务器 SAS

GPU 云服务器

无影云电脑 EDS

对象存储 OSS

云企业网 CEN

Web 应用防火墙 WAF

域名

容器计算服务 ACS

办公安全平台 SASE

智能媒体服务 IMS

边缘安全加速 ESA（原DCDN）

智能媒体管理 IMM

专属钉钉

宜搭

大模型服务平台（百炼）

Apsara Prime - 轻松选择云产品

阿里云 ECS-满足您所有云主机需求

1TB CDN — 立即获取免费的 1 TB 出站流量套餐

安全 — 受到攻击？ 获取免费安全支持

短信服务 - 现已免费开放测试

云服务器 ECS Hot

云盒

计算巢服务

专有宿主机 Hot

弹性裸金属服务器（神龙）

GPU 云服务器 Featured

轻量应用服务器 SAS Hot

弹性伸缩

无影云手机 Beta

无影云电脑 EDS Featured

批量计算

弹性高性能计算 E-HPC

超级计算集群 SCC

函数计算 FC

安全 — 受到攻击？获取免费安全支持