
登陆成功后,可以启动机器学习训练任务流程,简要的流程如下:
(1)数据上传
ORION公有云版本支持结构化数据上传(CSV文件),在数据模块,点击“上传新数据” ,出现如下页面:
· 需要用户命名数据集
· 生成ID列:若数据集内无Index,则可滑动确认,平台将自动生成索引列
· 将数据文件拖拽至平台选框内
数据上传中,进度条显示数据上传进度,完成后,点击上传按钮,进入数据预览页面。

(2)数据预览及下载
数据预览可预览数据集前十行,并可在所有数据中下载已上传的数据集。

(3)创建任务
在训练模块中,点击“创建任务”,弹出创建任务的窗口,包含如下内容:
· 任务名称:用户需要为新任务命名;
· 数据名称:点击窗口,出现下拉框,可选择已上传的数据集;
· 模型类型:可选择非网络模型,网络模型(包含DNN,CNN,RNN,TCN)
· 问题类型:支持分类,回归,聚类,时间序列问题
· 任务类型:包含手动训练(single train),自动训练(hyper train),集成训练(ensemble train)
用户可根据任务目标选择配置,点击创建任务进入下一步。

(4)任务配置
任务配置包含四个步骤:配置预处理,配置数据,选择算法,配置输出
· 配置预处理
配置预处理中是对数据集的预处理操作,包含如下可配置内容:
o ID列名:即指定数据集中的索引列,可通过下拉框选择;
o Target列名:为需要预测的列名;
o Shuffle:是否需要随机打乱数据(非时间序列数据可选);
o Do\_re\_fit:是否合并训练与测试数据再次训练,若是则置为True,默认不选择;
o 数据切割形式:将数据集分为训练集和测试集的方式与比例;

· 配置数据
配置数据中,用户可对每一列数据进行预处理,包括数据变换和空值处理,用户无需编程,可对数据进行快速预处理,同时可对数据进行理解,包含数据最大最小值,缺失值比例等。

· 选择算法
在算法选择模块中,用户可对算法进行选择与配置,以全连接神经网络为例,用户可视化选择全连接层数,每层单元数,及网络参数等,用户可以选择默认配置进行下一项目。

· 评估方法
在模型指标的选择中,用户可自定义选择指标,可多选。

用户完成四个步骤后,用户可在所有任务的列表内查看待训练的任务,并可查看训练进度:


训练任务成功完成后,后台将保存任务,并可在预测任务内调用。
