腾讯云TI-ONE训练平台标签格式示例说明_AI解决方案_同尘科技

TI-ONE 训练平台 3年前 (2022-09-30) 浏览 78

概述

当您需要在 TI 平台的 数据中心 > 数据集管理 模块上传一份“已标注”的“图片/文本”类型的数据集时,标注文件内容的格式需要遵循平台规范,只有符合规范的标注文件才可被后台正确解析,成功解析后您可在数据集详情页面查看该数据集的标注信息可视化分布展示。
且我们建议您单张图片的标注内容大小不超过100k,若需扩容,可通过工单联系我们哦。在导入已标注的数据集时,请确认满足以下两点规范:您需要按照“文件存放示意图”准备您的文件目录;您需要参考“下载标注文件示例”链接中的内容格式准备您的标注文件。
以下详细介绍不同标注场景下的标注格式规范。注意:每张图片对应的标注内容的文件大小上限为1M。

图片分类

1)TI 平台格式

文件目录要求:
标注文件格式要求:

{    "info": { // 可选字段,表示图片的相关信息        "md5": "图片md5值", // 可选字段,表示图片的md5值        "path": "图片相对路径",    },    "tags": {        "classification_tags": [{            "first_class": "一级标签值",            "confidence_level": 置信度 // 可选字段,表示标签置信度        }]    }}

2)文件目录结构

文件目录要求:
标注文件格式要求:无需额外上传标注文件

目标检测

1)TI 平台格式

文件目录要求:
标注文件格式要求:

{    "tags": {        "detection_tags": {            "shapes": [{                "frame_type": "框形状", // 表示框形状,支持多边形:polygon, 矩形:rect, 和折线:polyline                "pts": [x1, y1, x2, y2...],                "bbox": [左上角横坐标, 左上角纵坐标, 长, 高],                "tag": [{                    "label_key_name": "标签字段",                    "label_value_name": ["标签值"],                    "confidence_level": [置信度] // 可选字段, 表示标签置信度                }]            }]        }    },    "info": { // 可选字段,表示图片的相关信息        "md5": "图片md5值", // 可选字段,表示图片的md5值        "path": "图片相对路径"    }}

2)Pascal Voc

文件目录要求:
标注文件格式要求:(xml 文件格式)

    VOC2012    2007_000033.jpg            The VOC2007 Database        PASCAL VOC2007        flickr                500        366        3        0            aeroplane        Unspecified        0        0                    9            107            499            263            

3)COCO

文件目录要求:
标注文件格式要求:请严格参考 COCO 官网中的【Object Detection】格式。

图片分割

1)TI 平台格式

文件目录要求:
标注文件格式要求:

{
    "tags": {
        "segmentation_tags": { //【注意】导入到标注平台,shapes 和 mask 应该是二选一提供,如果同时提供则以shapes为准;从标注平台导出,shapes 和 mask 都会给出;
            "shapes": [{
                "frame_type": "框形状", // 表示框形状,公有云支持多边形:polygon,必选
                "pts": [
                    [x1, y1, x2, y2...]
                ],
                "bbox": [左上角横坐标, 左上角纵坐标, 长, 高], //非必选,pts表示分割区域外接矩形框
                "tag": {
                    "label_value_name": "标签值",
                    "confidence_level": 置信度 // 可选字段,表示标签置信度
                }
            }],
            "mask": {
                "path": "mask图相对路径",
                "notes": {
                    "灰度值": "标签值"
                }
            }
        }
    },
    "info": { // 可选字段,表示图片的相关信息
        "md5": "1e81a232952f32af71b70848556e0ecd", // 可选字段,表示图片的md5值
        "path": "图片相对路径"
    }
}



2)Pascal Voc

文件目录要求:

标注文件格式要求:(xml文件格式要求)

      VOC2012      2007_000039.jpg                The VOC2007 Database          PASCAL VOC2007          flickr                      500          375          3            1  

3)COCO

文件目录要求:
标注文件格式要求:请严格参考 COCO 官网中的【Object Detection】格式。

目标跟踪

TI 平台格式

文件目录要求:
标注文件格式要求:

{  "tags": {      "detection_tags": {          "shapes": [{              "frame_type": "框形状", // 表示框形状,支持多边形:polygon, 矩形:rect, 和折线:polyline              "pts": [x1, y1, x2, y2...],              "bbox": [左上角横坐标, 左上角纵坐标, 长, 高],              "tag": [{                  "label_key_name": "标签字段",                  "label_value_name": ["标签值"],                  "confidence_level": [置信度] // 可选字段, 表示标签置信度              }]          }]      }  },  "info": { // 可选字段,表示图片的相关信息      "md5": "图片md5值", // 可选字段,表示图片的md5值      "path": "图片相对路径"  }}

文本分类

文本分类场景下的“文本数据”和“标注信息”的组织形式请参考数据集导入前端页面的提示卡片,如:
此外,再补充说明在 “TI 平台格式”和 “JSON” 格式中,还能灵活扩展支持的标签格式(按行和按文件同理):

- 一级单选的格式"情感": "负"  "情感": "正"
- 一级多选的格式"领域": ["政治","经济"] "领域": ["娱乐","社会"] 
- 多级单选的格式(最深支持5个层级)"来源": [["新闻", "国际事务", "亚欧板块"]] 
- 多级多选的格式(最深支持5个层级)"来源": [["新闻", "国际事务", "亚欧板块"],["2022全年","第一季度","3月1日","中午"]] 



对解决方案有疑惑?想了解解决方案收费? 联系解决方案专家

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心,购买腾讯云享受折上折,更有现金返利:同意关联,立享优惠

阿里云解决方案也看看?: 点击对比阿里云的解决方案

- 0人点赞 -

发表点评 (0条)

not found

暂无评论,你要说点什么吗?