ai数据标注应该如何学习
数据标注最基本的就是画框,比如检测目标是车,标注员就需要把一张图上的所有车都标出来,画框要完全卡住车的外接矩形,框得不准确机器就可能“学坏”。再比如人的姿态识别,就包括18个关键点,经过训练的标注员才能掌握这些关键点的标注,标注完成的数据也才能符合机器学习的标准。
无人零售、无人驾驶等都需要大量的人力,基于用工成本的问题,除了隐私数据之外,他们会把标注工作放在第三世界国家完成,马来西亚、泰国、印度等国家都有数据标注分公司。
常见的报道中,数据标注总被描述为“血汗工厂”,这项工作和从业者被描述得廉价低质,人被重复性机械式的劳动异化。在王金桥的解释下,这一刻板印象也被逐渐打破。
目前这种大量的人工标注是有价值的,因为理论上解决问题很难,但有了大量数据,设计深度学习网络,可以在特定场景特定应用中用数据训练神经网络,从而在很多场景中可以让AI快速落地占领市场、驱动行业应用、促进行业升级和迭代。
ai数据标注是什么
数据标注有许多类型,如分类、画框、注释、标记等等,例如我们学习认识苹果,那么就需要有人拿着一个苹果到你面前告诉你,这是一个苹果。然后以后你遇到了苹果,你就知道这叫做“苹果”。类比机器学习,我们要教他认识一个苹果,我们得先有苹果的图片,上面标注着“苹果”两个字,然后机器通过学习了大量的图片中的特征,这时候再给机器任意一张苹果的图片,它就能认出来了。
常见的几种数据标注类型
分类标注:分类标注,就是我们常见的标签;一般是从既定的标签中选择数据对应的标签,是封闭集合。常见标签:成人、女、黄种人、长发等。
标框标注:机器视觉中的标框标注,就是框选要检测的对象;如人脸识别,首先要先把人脸的位置确定下来,然后进行识别。
区域标注:相比于标框标注,区域标注要求更加精确,边缘可以是柔性的,比如道路识别。
描点标注:一些对于特征要求细致的应用中常常需要描点标注,人脸识别、骨骼识别等。
其他标注:根据不同的需求则需要不同的标注,如自动摘要,就需要标注文章的主要观点。
|ai数据标注应该如何学习
ai数据标注 ai数据标注应该如何学习