人工智能吧吧 关注:610贴子:1,477
  • 0回复贴,共1

2020年数据标注公司情况分析

只看楼主收藏回复

文章开始要做两个感谢:
1.感谢很多标注公司的小伙伴在数据标注公司及平台排名一文中,通过填写信息的方式,提供了非常真实的数据信息资料,以便为本文提供部分数据基础。
2.要感谢在看过2020年第一季度数据标注行业需求分析一文之后,下单获取数据的伙伴,希望可以帮助拿到数据的小伙伴。
言归正传,本文想跟大家聊聊目前标注行业的主力军标注公司或者团队。可以让大家对目前标注公司有一个概况的了解。目前的标注项目大部分都还是标注公司或者团队来完成,不管是平台类型的公司,还是AI公司自己发项目,但有一个特点,由于每次的项目需求不同,通用型的工具大部分没有平台化,或者工具平台化但对人的管理缺乏监控,往往导致项目总是在“黑盒”的情况下完成,“黑盒”的结果就是风险的逐层转嫁,最底层的那部分人终将会承担由于这部分风险带来的损失。本文无法从非常细节的层面剖析“黑盒”的原因和解决办法,但想在现有数据的基础上,呈现一个宏观角度的面貌,供大家参考。
本次想分析的主要呈现:
1.数据公司的分布情况。
2.数据公司的人员情况。
注:
1.数据样本总量400家,部分分析维度或低于400家,由于部分维度部分公司没有相关信息。
2.数据来源采集和网络。
一.数据公司的主要分布

注:圈的越大表明当地的标注公司家数越多。
二.数据公司分布占比

三.成立年分布


四.地区全职人数及兼职人数分布


五.全职人数区间分布

通过上面数据可以初步得出以下结果:
1.低成本且人口密度高的省份依旧是数据标注的主力军。
2.目前数据标注公司的人员情况基本都以中小型公司或者团队为主。
3.“甲方爸爸”标注项目的不确定性和变化性依然非常高,依然无法持续保证标注团队的长期规模化发展。
4.不管是平台方还是甲方来说,中大型项目很难有单一团队完全解决。对于中大型项目众包或许是必需方案。
5.平台的发展是必然需求。
6.标注公司或者团队抗风险能力比较弱,如果提高存活能力成为了很关键的问题。
数据本身可能存在的问题:
1.样本不够且不全。
2.数据提供的存在虚高成分。
以上是数据公司情况的分析,作为一个行业相关从业者真心希望可以良好发展,但项目“黑盒”实施是目前的普遍现象,其结果就是更多资源的消耗和浪费,至于最终谁承担了这部分消耗呢?我们不得而知。希望可以通过对行业内的公司的剖析,可以给小伙伴提供一些更据参考性的思路。也欢迎小伙伴们留言交流。
从事相关工作的小伙伴可以继续报名,如果有相关合适的甲方留言需求可以推送给各位。数据标注公司调研


IP属地:辽宁1楼2020-04-20 11:56回复