腾讯云TI-ONE训练平台使用任务式建模构建模型_AI解决方案_同尘科技
任务式建模简介
任务式建模提供通过向导式的训练任务提交方式进行模型构建,支持基于多种算法来源进行训练任务提交,可直接通过代码包绑定主流训练框架启动训练任务,快速使用主流高性能及分布式训练框架提交训练任务。下面将由一个简单的 PyTorch MPIJob 演示如何使用任务式建模快速创建任务
数据准备
数据集
本案例使用 mnist 数据集,下载地址为 数据集。
代码包
本案例的训练脚本是使用 PyTorch 框架撰写的,代码包下载地址为 代码包。
上传数据到COS对象存储中
您可以进入 COS 控制台,在存储桶列表页面创建存储桶,详情请参考 创建存储桶。
创建好的存储桶将用于平台任务数据的存放,包括数据集、代码包等,文件上传操作详情请参考 上传对象。注意创建 COS 存储桶时,所属地域需跟训练任务所在的地域一致,如训练任务的地域处于广州,创建存储桶时所属地域应选择广州。
操作步骤
新建任务第一步
1. 进入训练工坊 > 任务式建模,单击新建,开始进入向导式训练任务创建。2. 在基本信息页,填写如下信息:任务名称:mnist_train训练镜像选择:内置镜像 / PyTorch / torch1.9-py3.8-cuda11.1-gpu训练模式:MPI计费模式:按量计费算力规格:8C40G V100*1节点数量:1个标签和描述:无需填写
新建任务第二步
在任务配置页,填写如下信息:1. 数据配置:选择 COS 数据 本地存储路径:填写 train数据所在路径:单击选择文件,在弹出的COS对话框中,选择需要使用的存储桶,单击左下方上传文件夹,将数据集解压后的文件夹ti-images上传,上传完成后选中文件夹路径,如下图所示:
2. 代码包:单击选择文件,在弹出的 COS 对话框中,选择需要使用的存储桶,单击左下方上传文件夹将准备好的代码包(需要先解压)文件夹mnist.pytorch上传至COS存储桶中,并选定代码包所在路径 3. 启动命令:填写 sh start.sh4. 训练输出:单击选择文件,在弹出的COS对话框中,选择需要使用的存储桶,选择训练输出数据需要保存的路径,如下图所示:
5. 调优参数:无6. 私有化网络:无7. CLS 日志:选择不投递
配置完成后,可在页面底部查看本次训练任务的每小时收费价格,单击确定,即完成任务提交。
查看和监控任务
1. 提交成功后,可在任务列表页面看到任务记录。2. 点击任务名称,可进入任务详情页查看日志和监控信息,例如下图所示:
对解决方案有疑惑?想了解解决方案收费? 联系解决方案专家
腾讯云限时活动1折起,即将结束: 马上收藏
同尘科技为腾讯云授权服务中心,购买腾讯云享受折上折,更有现金返利:同意关联,立享优惠
阿里云解决方案也看看?: 点击对比阿里云的解决方案
暂无评论,你要说点什么吗?