以企业使用Azure OpenAI接口服务为例,经常有用户问:
是不是涉及数据出境? 该怎样保证数据出境的安全? 数据出境会不会涉及信息泄露? 微软Azure OpenAI算法是否已经备案? 企业自己需不需要做算法备案?
为方便大家交流算法备案流程、经验,全云在线搭建了一个企业算法备案交流裙,在裙内还可以get算法备案填报指南。
也提供微软AzureOpenAI的SLA
目前Azure OpenAI 位于 Global Azure(服务器位于中国大陆境外),境内客户向部署于境外的服务(如Azure OpenAI)输入数据的行为,属于“数据出境”,无论该服务由客户的境内公司直接采购、还是由境外公司采购后供境内公司使用。
鉴于境内客户向Azure OpenAI输入数据的行为属于数据出境,客户需自行判断其是否属于以下需要进行网信办主导的数据出境安全评估的任一情形:
客户公司向Azure OpenAI输入重要数据的;
客户本身已被认定为“关键信息基础设施运营者”,且向Azure OpenAI输入其持有的个人信息的;
客户本身属于“处理100万人以上个人信息的数据处理者”,且向Azure OpenAI输入其持有的个人信息的;
客户自上年1月1日起累计向境外提供10万人以上个人信息或者1万人以上敏感个人信息的,其中包括了通过Azure OpenAI出境个人信息的。
1、企业自身如何确保数据出境合规?
①作为决定数据处理目的和方式的处理者,客户在使用海外云服务时,应当自行梳理其向境外传输的数据类型。
②根据向境外传输的数据类型等因素,客户需向法律和技术专家寻求专家意见,自行评估以确定其是否受到中国法律下数据本地化和跨境传输要求的约束以及是否满足该等要求。
③同时我们也对几种跨境机制做如下介绍,为数据出境提供了3种路径,供参考:
数据出境路径一:数据出境安全评估
首先,企业需要自己评估出境数据类型和数量。
如果出境数据属于以下类型,则必须适用路径一:
①重要数据
②个人信息
-CIIO/处理个人信息≥ 100万人
-上年1月1日起累计向境外提供:个人信息≥10万人;敏感个人信息≥1万人。
数据出境路径二:签订出境标准合同
判断出境的个人信息类型和数量,符合以下全部要求的出境个人信息可适用路径二:
①非CIIO
②个人信息
-处理数量<100万人
-自上年1月1日起累计向境外提供<10万人个人信息;<1万人敏感个人信息。
数据出境路径三:专业机构认证
2、Microsoft如何提供安全制度和技术保障
Microsoft Cloud会通过完善的制度和先进的技术确保数据处理过程中数据的安全性。
而且微软OPEN AI数据出海是合规的,微软一直遵守各国的数据保护法律和隐私政策,并且采取了一系列严格的安全措施来保护客户的数据。微软确保客户的数据不会被未经授权的访问、使用或泄露的。
微软产品条款中“针对核心在线服务的安全实践和策略”部分也列明了除了DPA中针对在线服务的安全实践和策略外,每项核心在线服务所符合的控制标准和框架。
一、哪些主体需要备案?
1、深度合成服务提供者、技术支持者
深度合成服务提供者,是指提供深度合成服务的组织、个人。
深度合成服务技术支持者,是指为深度合成服务提供技术支持的组织、个人。
如在国家网信办发布的深度合成服务算法备案公告中,阿里达摩院的开放域自然对话合成算法、图像合成算法、交互式多能型合成算法,奇虎的360智脑文本生成服务算法等都是以“服务技术支持者”的角色申请备案。
而一些小企业,接别人大模型的API,在这个API之上做自己的AI应用,这也就是“服务提供者”。
2、具有舆论属性或者社会动员能力的深度合成服务提供者、深度合成服务技术支持者应当规定履行备案和变更、注销备案手续(注意变更、注销也需要备案)。
完成备案的深度合成服务提供者和技术支持者应当在其对外提供服务的网站应用程序等的显著位置标明其备案编号并提供公示信息链接。
二、哪些情形(场景)需要备案?
1、《互联网信息服务算法推荐管理规定》中对需要进行备案的算法做了具体的说明,指的是“利用生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息”。
2、AIGC产品同时满足向中华人民共和国境内公众提供和具有舆论属性或者社会动员能力两个要求时,应当进行算法备案:
①向中华人民共和国境内公众提供
直接2C模式:产品的直接使用人群即用户为在中国境内的C端自然人时,属于向公众提供服务。
间接2C(B2B2C)模式:即产品向B端企业客户提供,当企业客户最终将产品用于C端用户时,虽法律没有明确,但有较大可能性被认定为向公众提供服务。如A公司研发AI客服工具卖给电商公司B,B公司使用该客服功能为平台上的用户提供售后服务;再如D公司研发皮肤测试产品卖给美容机构E,E使用该产品为用户进行皮肤检测。
公司内测或公开测试:产品内部测试未向不特定的自然人提供服务,不视为向公众服务;但如果通过公开方式允许不特定的公众进行测试,使用数量到达一定规模,则有可能被认定为向公众提供服务。如百度的“文心一言”曾公开发出测试邀请,个人用户可以申请体验。
公司内部使用:公司内部为管理等需求使用AIGC,而不对外部开放的情况,一般不属于向公众提供服务。
正负面清单如下:
②具有舆论属性或社会动员能力
目前法规对于“具有舆论属性或社会动员能力”还没有明确的定义,《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》以举例的方式给出了两种情形:
-开办论坛、博客、微博客、聊天室、通讯群组、公众账号、短视频、网络直播、信息分享、小程序等信息服务或者附设相应功能;
-开办提供公众舆论表达渠道或者具有发动社会公众从事特定活动能力的其他互联网信息服务。
也即是说,如果你只是自建自玩,那不需要备案,但如果你想向公众发布,需要更多人的来使用,就需要备案了。
三、在哪备案?
互联网信息服务算法备案系统(以下简称备案系统)。
网址为 https://beian.cac.gov.cn。
四、备案流程、所需材料
1、备案流程:
深度合成备案填报包括三个步骤:
一是填报主体信息;
二是填报算法信息;
三是关联产品及功能信息或填报技术服务方式。
主体信息审核通过后才能进行算法备案。
算法备案包括算法基础信息填报、关联产品及功能信息或技术服务方式填报,具体流程如下图:
2、所需材料:
《互联网信息服务算法推荐管理规定》第二十四条要求,具有舆论属性或者社会动员能力的算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息,履行备案手续。
①主体信息
备案主体基本信息、证件信息、法定代表人信息、算法安全责任人信息等内容。
②算法信息
包括:算法数据、算法模型、算法策略和算法风险与防范机制等,包括算法基本原理、算法运行机制、算法应用场景以及算法目的意图等内容。
③关联产品及功能信息(或填报技术服务方式)
在关联产品及功能信息或填报技术服务方式时,“服务提供者”角色的填报人员需关联产品及功能信息,“服务技术支持者”角色的填报人员需填报技术服务方式。
④《自评估报告》:
在算法信息填报(第二步)中,企业需要提交算法安全自评估报告,其主要包括算法情况(算法流程、数据、模型和干预策略)、服务情况、风险研判、风险防控情况、安全评估结论等内容。对比服务提供者与技术支持者的算法安全自评估报告模板,服务提供者需提供更多关于内容生态治理、结果标识、辟谣机制,以及用户权益保障方面的说明。
⑤《拟公示内容》:
根据《算法推荐管理规定》第十六条,算法推荐服务提供者应当以适当方式公示算法推荐服务的基本原理、目的意图和主要运行机制等。在算法信息填报(第二步)中,企业即需要提交算法拟公示内容,主要包括算法基本原理、算法运行机制、算法应用场景、算法目的意图,以供监管机构审核。
⑥附件:
《算法备案承诺书》《落实算法安全主体责任基本情况》。
除此之外,提供者应当建立健全投诉、举报机制,设置便捷的投诉、举报入口,公布处理流程和反馈时限,及时受理、处理公众投诉举报并反馈处理结果。
这一条很容易被忽略。一定要记得在产品上做一个投诉举报的功能。
3、审查时限:
根据《互联网信息服务算法推荐管理规定》,材料齐全的,网信部门应在30个工作日内予以备案。网信办公布的第一批和第二批深度合成服务算法备案清单相隔3个月,由此推测生成式人工智能算法备案的时限平均在3个月左右。
4、备案公示:
①备案号公示
根据《互联网信息服务深度合成管理规定》完成备案的服务提供者和技术支持者应当在其对外提供服务的网站、应用程序等的显著位置标明其备案编号并提供公示信息链接。
②运行机制公示
根据备案系统,企业需要公示算法的机制机理,包括算法基本原理、