随着社会的发展,人工智能已经渗透到了各行各业,并与人们的日常生活紧密结合。人工智能产业也愈加细分、完善,无论是上游的芯片供应商、设备供应商、数据服务提供商,还是下游的算法开发团队、集成商等,产业生态已经被建立并且仍在不断发展。
需要注意的一点是,随着人工智能产业的发展以及物联网、大数据技术的普及,以文本、图形、图像、音频、视频等非结构化数据为主的信息急剧增加,面对如此巨大的信息海洋,特别是非结构化数据信息,如何存储、查询、分析、挖掘和利用这些海量信息资源就显得尤为关键。
对于智能系统/应用的开发者来说,其面临的数据环境越来越庞杂,也越来越无法利用传统手段来对数据进行管理和使用。
“我本身就是做技术出身,深刻体会到了在目前的AI数据环境下开发者所面临的问题。”格物钛创始人崔运凯对创业邦说道。崔运凯先后毕业于上海交通大学和美国宾夕法尼亚大学,曾任宾夕法尼亚大学助理研究员。2015年,崔运凯作为早期员工加入Uber自动驾驶部门,成为该部门最年轻的技术经理,并在2018年回国后加入维智科技(Wayz.ai)担任合伙人。
2019年,崔运凯与来自Snapchat、依图等知名企业的合伙人创建了格物钛,并致力于将其打造为一家优秀的AI数据服务平台提供商,目前格物钛可以向开发者提供针对非结构化数据存储、标注、模型训练和管理预测的一站式AI服务平台产品,能够有效降低AI开发过程中因处理非结构化数据带来的不断增长的数据获取、存储和处理成本,加速AI开发流程和产品创新。
面对指数级增长的AI数据,开发者的处理手段并没有得到及时的更新。目前,一家人工智能企业的大量非结构化数据仍在以文件的方式储存在文件管理系统中,开发者在对数据进行操作或使用时,通常要建立文件夹,然后找到所需要的数据进行手动复制并重新命名,这是一项耗时耗力但几乎毫无价值的工作流程。
此外,开发者也无法快速而准确地找到对本次开发有价值的数据片段,尤其在面对视频数据时,开发者甚至要通过企业的兼职人员来协助查看视频文件并找到相应的视频片段。可以说在人工智能产业如火如荼的今天,开发者手中的工具软件却仍然非常原始。
“我们做产品的本质,就是希望帮助AI开发者更高效地迭代模型,而不是将精力耗费在管理数据的工作上。”崔运凯告诉创业邦。
基于这样的市场需求,格物钛打造了TensorBay数据管理SaaS平台,专为算法工程师提供非结构化数据集管理服务。TensorBay平台集数据托管、数据集版本管理、数据可视化和开发者工具等多种功能于一体,可为算法训练提供快速的效率提升解决方案,帮助开发者高效地获取、加工和管理数据,并通过协同功能开展模型训练,助力企业快速、低成本地实现AI技术导入和算法模型迭代。
具体来说,TensorBay平台的云端数据托管功能支持多种格式、多样场景与多种行业的数据托管,以及原始数据、标注数据与meta信息在线管理;可追溯的数据版本管理功能让开发者能够可视化地查看数据版本迭代的情况,同时还可以查看历史版本数据,让数据的每次变更都可追溯;数据协同功能可基于角色的权限管理,使开发者更加安全地同步与分享数据,避免数据的反复复制与迁移,提升团队的协作效率。
崔运凯告诉创业邦:“我们的数据工具平台有着非常好的适用性,几乎任何一个领域的AI开发者都可以利用我们的工具来提高开发效率,进而迭代产品。”
除此之外,格物钛也重视AI开发者生态社区的建立。通过收集全球范围内的高质量公开数据集,格物钛可以为开发者提供自动驾驶、新零售、视频直播、医疗、智能制造等场景下的多样标注类型的数据资源,以赋能AI开发者更好地应对人工智能领域全新商业形态所带来的数据挑战。
如今,互联网发展已经开始了数据定义软件的阶段,在这样的趋势下,格物钛的数据平台及相应产品不仅在帮助开发者更好地管理和使用数据,更实在推动整个AI产业朝着数据定义的方向发展。
目前格物钛拥有员工60余人,由于数据集的使用趋向于免费,格物钛主要业务增长点将由即将上线的TensorBay数据管理SaaS平台产生,届时客户可以通过支付年费的方式进行使用,同时根据管理的数据量大小和用户使用情况的区别,客户的具体使用成本也会有一定的差异。
融资方面,格物钛在成立之初就获得了千万美元级Pre-A轮融资,投资方为红杉中国种子基金、云启资本、真格基金以及风和资本。
本文文章图片来源于格物钛,经授权使用。本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系editor@cyzone.cn。