10月19日上午,记者走进百度山西数据标注基地,百度智能云数据标注基地业务合作负责人尉赤正在整理方案,准备与部门工作人员就后续业务发展进行商讨。
2018年9月,百度智能云与山西综改示范区达成合作,在太原共建百度(山西)人工智能基础数据产业基地(以下简称“百度山西数据标注基地”),位于山西智创城No.1,是首批入驻企业之一,而今这里已引进各类企业150余家。作为百度在全国建立的第一个人工智能基础数据产业基地,百度山西数据标注基地已发展成国内标注人员数量领先、产值规模领先的单体数据标注基地。
尉赤家在北京,与太原双城的奔波贯穿于2019年至2020年间。当时社会对这一行业的陌生让业务的开拓举步维艰:“标注师是一个新兴职业,刚开始招不到员工、引不来企业,我们对于未来的发展也没有足够把握。”为了开展业务,尉赤带领团队积极寻求对外合作,走访众多高校和企业,一遍遍进行普及,不断加深人们对于行业和基地的认知。
“在这期间,山西综改示范区管委会给予了大力支持。”尉赤告诉记者,筹建之初,综改示范区实施了三年免费场地使用、前期资金支持、完善周边配套、对接高校等帮扶举措,基地慢慢站稳了脚跟,并逐步壮大,场地从最初的2000平方米扩展到如今的近2万平方米。
截至今年9月,百度山西数据标注基地已拥有5000余名数据标注师,吸引和培育优质数据标注企业超50家,其中16家被评为国家级科技型中小企业,11家被评为国家级高新技术企业,2家被评为省级“专精特新”企业,累计产值超6亿元,具备了覆盖无人驾驶、语音识别、图像识别、内容审核等多种数据标注场景的标注能力。
早上9时,基地的一间间办公室里便坐满了人,每台电脑前都有一名神色专注的数据标注师。他们将根据各自领到的任务对图像、语音、视频、文本进行标注,鼠标点击声和键盘敲击声不绝于耳。
“职业数据标注师的工作内容就是将海量的数据进行精准分类,再打上标签,将它们转化成机器认识的语言,供人工智能反复学习,让人工智能认识的事物越来越多,越来越‘聪明’。”项目三期现场管理人员郭梅介绍道。
来这之前,郭梅是老家长治一家煤矿的监控员。2019年,33岁的郭梅举家搬到省城,并入职基地成为一名数据标注师。平均一天要在屏幕前标注二三百万个点,看似枯燥的“重复工作”,在郭梅看来却有着别样的意义。跟随郭梅来到基地的展览室,其中一面墙上展示着AI人工智能这些年在社会公益层面实践的成果,比如百度AI寻人、百度大数据助力疫情防控等等。
2021年3月,百度在港交所二次挂牌上市,郭梅作为来自AI时代新职业的代表之一,与小度机器人及百度高管共同敲响了上市锣声。从标注员到审核员,再到现场管理人员,郭梅不断提升自己,朝着职业理想一步步迈进。
新行业带来新机遇。百度山西数据标注基地不仅培养了大批标注师,还引进了一批数据服务商。针对这些入驻企业,基地采用统一标准的管理模式,并建立了完备的企业培育政策,帮助企业快速实现规模扩展、业务能力提升、管理效率优化等。
34岁的贺超超是吕梁临县人,2019年合伙成立山西集智数据服务有限公司,并入驻百度山西数据标注基地。
“首先是业务稳定,百度会定向把优势数据投向基地企业,我们不会没活儿干;其次在新就职人员培训方面,基地有一套很好的培训流程,从小白到熟手,一周就能上手。”对于基地的帮扶,贺超超十分感激。如今,公司员工由创立之初的10人发展到120人,一批数据标注师成长为培训讲师。