成功创建实验后,您可以实时查看实验详情,包括实验的基本信息、Trial列表、各个Trial的运行详情以及日志。本文为您介绍实验中支持查看的详细内容。
查看实验的基本信息
进入自动机器学习(AutoML)页面。
登录PAI控制台。
在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。
在左侧导航栏,选择
。
在实验列表页面中,单击实验名称,进入实验详情页面。
在实验详情页面的基本信息页签,您可以查看该实验的基本配置、Trial配置、执行配置、搜索配置和Trial的执行进度。
在基本配置区域,您可以查看该实验的ID、状态等。实验可能的状态如下:
CREATED:在实验的创建初期,系统正在执行创建管理进程、解析各个配置模块的内容,以及向DLC或MaxCompute等后台提交任务等操作。此时,Trial还没有开始运行。
FINISHED:当实验下的所有Trial都执行完成,且Trial的状态至少有一个为FINISHED时,实验状态会变为FINISHED。
FAILED:当实验下的所有Trial都执行完成,且Trial的状态均为FAILED时,实验状态会变为FAILED。当手动停止实验下的所有Trial时,实验状态会变为FAILED。
RUNNING:当实验下的Trail状态为RUNNING时,实验状态为RUNNING。
TERMINATING:当手动停止实验后,实验状态会变为TERMINATING。
USER_CANCELED:当手动停止实验且实验完全停止后,实验状态会变为USER_CANCELED。
NO_MORE_TRIAL:当实验已经运行的Trial数量达到了实验设置的最大Trial数量时,不会再生成新的Trial。在最后一个Trial运行结束后,实验会自动从NO_MORE_TRIAL状态转换为Finished状态。
TUNER_NO_MORE_TRIAL nuner:当实验缺乏足够的信息来确定下一组需要测试的超参数时,Tuner会停止生成新的Trial。此时的实验状态为TUNER_NO_MORE_TRIAL nuner。
在Trial配置、执行配置和搜索配置区域,您可以查看该实验的参数配置详情。
在Trial执行进度区域,您可以查看Trial的执行进度和状态统计信息。
查看Trial列表
进入实验详情页面。具体操作,请参见查看实验的基本信息。
在Trial列表页签中,展示该实验下自动生成的所有Trial列表。
根据配置的算法,每次实验都会生成超参数组合,并为每组超参数组合创建一个Trial。同时,每个Trial可能会对应一个DLC任务,也可能对应1个或多个MaxCompute任务。任务的类型取决于实验的执行配置。后续将通过配置的任务来执行Trial。
查看Trial的运行详情
在Trial列表页签,您可以查看实验下的Trial详情,包括执行状态、最终指标和超参数组合等。
状态:Trial可能的状态如下:
RUNNING:正在执行中。
FINISHED:已执行成功。
FAILED:执行失败。
USER_CANCELED:手动停止。
EARLY_STOPPED:Trial被提前终止。
最终指标:根据实验中的指标权重配置,系统将使用加权求和值作为最终的评估指标。
超参数组合:根据实验配置的算法自动生成的超参数组合。每个Trial对应一组超参数组合。
通过对比每个Trial的最终指标,并根据在搜索配置中配置的优化方向,您可以判断哪个Trial使用的超参数组合是最优的。
查看日志
当实验或Trial执行失败时,您可以通过操作日志来有效定位实验和Trial的异常情况。
查看实验的日志
进入实验详情页面。具体操作,请参见查看实验的基本信息。
您可以单击页面右侧的日志按钮,或在基本信息页签的基本配置区域中,单击状态后的日志按钮。
在实验日志配置面板中,查看日志详情。包括以下两种日志:
nnimanager.log
该日志记录了与实验管理相关的信息,包括实验的启动、停止和错误信息等。
dispatcher.log
该日志记录与任务调度和资源管理相关的信息,包括Trial的分配、资源的分配等。
查看Trial的日志
进入实验详情页面。具体操作,请参见查看实验的基本信息。
在Trial列表页签,单击目标Trial操作列下的日志。
在Trial日志配置面板中,查看Trial的日志详情。
Trial日志包括以下三种日志:
trial.log
该日志记录了Trail的详细执行过程。
stdout
该日志中记录了Trial的标准输出,包括打印语句和输出内容等,有助于您了解代码的调试信息和执行结果。
stderr
该日志记录了Trial的标准错误,包括一些异常、错误信息和警告等。当Trial任务出现问题时,stderr日志提供了有关错误的详细描述,帮助您进行故障排查和错误处理。