算法+共享=大数据比你更了解自己?【惟胜会·数字安全】

惟胜道律师事务所     2021 年 10 月 22 日

+ 更多信息  后退

黄雅竹.jpg  

黄雅竹 

  数字安全研究小组  成员


自2021年8月起,惟胜道数字安全研究小组推出了《数字安全合规月刊》电子版,电子月刊聚焦网络安全与数据保护,呈现前沿动态、新规速递、热点案例、专业解读等内容,帮助读者掌握最新前沿趋势。若您对此感兴趣,请在惟胜会公众号后台留下您的【邮箱+姓名】,并特别注明数字安全合规月刊。




近年来,得益于互联网的快速发展与信息普及,数据的智能收集也越来越快捷,且种类繁多,覆盖了生活的方方面面。如今,依赖于信息便利的我们很难想象离开这样的便捷模式,生活将会多么“寸步难行”。但当一件事物迅速发展到一定程度的时候,总会有许多难以掌控的力量。近年来,随着信息数据保护的开展,我们也逐渐意识到大数据的力量已经远超我们的认知,在享受大数据带来的便利的今天也值得我们深思:我们真的需要大数据来了解自己吗?


近期,针对大数据“杀熟”、“饭圈”乱象、信息过度推送、算法干扰社会舆论、算法影响用户选择、算法打压不正当竞争等现象,国家互联网信息办公室于8月27日发布关于《互联网信息服务算法推荐管理规定(征求意见稿)》(下称 意见稿),并向社会公开征求意见。随即,9月17日,国家互联网信息办公室联合九部门发布《关于加强互联网信息服务算法综合治理的指导意见》,强调未来发展应管理好使用好发展好算法应用,完善算法在应用中的合规体系


一、什么是算法推荐与数据共享呢?


推荐算法本是计算机专业中的一种,基于内容的推荐算法(Content-Based Recommendations 也称 CB),即系统从海量数据中获取到用户数据,根据用户过去喜欢或搜索、浏览过的历史,为用户推荐与之相类似的内容,而内容相似性的衡量,是算法运用过程中的核心。意见稿也明确了这个概念,应用算法推荐技术,是指应用生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息内容。举个简单的例子,我们打开一个APP了解某个热点信息,随之我们就会收到该热点的各类知识、广告推送,有不少用户还反映,通过A软件搜索的信息,在B软件中会进行自动推送、广告弹窗,仿佛生活被人安装了监控,实则不然,早在2020年1月,挪威消费者委员会就发布了一份分析报告,分析了流行应用程序如何与广告行业共享用户数据。该报告发现,测试的大多数APP都向“意想不到的第三方”传输数据,而用户并不清楚谁在获取他们的信息以及利用这些信息做什么。


二、平台算法自动化决策如何保证合规?


算法推荐本是为了满足用户多元化、个性化的信息需求衍生的机制,通过定制化和智能化的信息传播实现用户和所需信息的高度且精准匹配,降低用户获取所需信息的成本。但在另一方面,算法也充当了一种信息收集、整合、分发的角色,通过这些信息如何推送、推送哪些内容、推送的内容是否合法、是否影响用户价值导向则都是用户无法自行选择的。在算法推荐使用不当影响下,“流量至上”也成为各类企业、信息收集者所推崇的目标,给许多不合法内容提供了传播渠道。意见稿即对上述诸多乱象如何完善算法模型和推荐规则、如何保障用户权利等提出了相应管理规定:


【完善算法模型和推荐规则】


【数字安全】算法+共享=大数据比自己更了解自己?_02.jpg


从以上规定可知,意见稿明确算法推荐服务者从信息收集至信息分发的各项义务,不仅落实了安全算法的主体责任,在信息整合过程中配备与算法也要求有与服务规模相适应的专业人员和技术支持。在监管上,意见稿提出,对算法推荐服务开展算法安全评估和监督检查工作,对发现的问题及时提出整改意见并限期整改。在处罚上,对违反本规定的,相关部门先依据职责给予警告、通报批评,责令限期改正;拒不改正或者情节严重的,责令暂停信息更新,并处五千元以上三万元以下罚款。构成违反治安管理行为的,依法给予治安管理处罚;构成犯罪的,依法追究刑事责任。其中,对发现不良信息的,也明确按照《网络信息内容生态治理》中对网络信息内容生产者的处理有关规定如采取警示整改、限制功能、暂停更新、关闭账号等处置措施,及时消除违法信息内容,保存记录并向有关主管部门报告,对造成严重后果者实施限制从事网络信息服务、网上行为限制、行业禁入甚至追究刑事责任等惩戒、刑罚措施等,各项处罚也体现国家对算法推荐的整治力度。


近期杭州一起算法规则服务纠纷案例就给许多违规推广的推荐服务者敲响警钟:推广者原告张某为获取收益,在被告某公司运营的网站注册账户并开展推广活动。经大数据排查,某公司认定张某账户流量异常,冻结其账户内佣金17万余元。张某认为某公司没有出具任何判断其流量异常的证据,故诉至法院,要求某公司立即解除对其账户内佣金的冻结。某公司称其有权对推广数据进行抓取、排查,对推广行为负有监管责任。张某“引流”的绝大多数被推广商品信息买方并未实际浏览,推广数据存在流量异常现象,且无法给出合理解释,已经违反相关推广规定。法院审理后认为,平台借助大数据分析维护正常交易秩序、制裁违规推广行为,在平台规则事先明示的情况下,某公司有权判定用户存在违约行为并开展治理活动。在平台自治过程中,用户有权对自动化决策提出质疑和申诉,进一步知晓算法逻辑构造,因此平台的程序具有正当性。


【保障用户权利】


【数字安全】算法+共享=大数据比自己更了解自己?_04.jpg


算法推荐作为11月1日即将出台的《个人信息保护法》中“自动化决策”的主要应用场景之一,与之相呼应的即是《个人信息保护法》第二十四条中个人信息处理者利用个人信息进行自动化决策的规定,规定明确,个人信息处理者在利用个人信息进行自动决策时应当保证决策的透明度和结果公平、公正,不得对个人在交易价格等交易条件上实行不合理的差别待遇。但算法推荐作为计算机程序衍生的产物,其透明度与公开存在一定难度,一是算法推荐数据均是由源代码形成,二是如果企业向所有人提供了自己的算法和业务流程,那么可能会泄露商业秘密或专有信息,因此,算法推荐中的公正公平与公开透明更多应是体现在算法安全主体严控与审查责任上。


同时,保障用户知情权和自主选择权也是维护网络治理的重要前提,《个人信息保护法》第二十四条还规定:通过自动化决策方式进行推送或营销,应同时提供不针对其个人特征的选项,或向个人提供便捷的拒绝方式。意见稿也指出,算法推荐服务者应当向用户提供选择、修改或者删除用于算法推荐服务的用户标签的功能,且用户认为算法推荐服务提供者应用算法对其权益造成重大影响的,有权要求算法推荐服务提供者予以说明并采取相应改进或者补救措施。以此条为鉴,但在许多常用APP应用中,通过其设置功能用户通常很难找到关闭方式,甚至在关闭后推送、广告依然活跃在屏前。在新闻报道中,就有用户反映,微信设置功能至少需经过十几个步骤,才能关闭其个性化定制广告。相信在本草案生效后,被赋予了更多自主选择权的用户,可督促相关平台设置更为便捷的算法推荐服务关闭方式。


三、破“茧”之战 填补算法漏洞


在10月5日的美国国会参议院的听证会上,前Facebook脸书产品经理豪根作为脸书算法漏洞的吹哨人,以一人之力向脸书算法发起挑战。豪根在会上公开指出脸书产品现存在的算法漏洞:危害儿童、放大偏见、鼓励两极化等,她称“这个平台旨在利用消极情绪将人们留住。”“他们意识到将人们所做选择进行放大后的副作用。他们知道基于算法,或者基于参与度的内容排名,可以让你在网站上停留更长的时间。你花时间更长,点击的次数更多,这会让他们赚更多的钱。”之后,豪根以在脸书的从业经历加以说明:2019年豪根加入脸书的“公民诚信团队”。该团队的主要任务为识别处理政客误导性和有害发帖,以减少平台上虚假信息。但根据外媒报道,2020年12月,该团队遭遇拆分,汇入更大的团队中。


就目前来看,我国算法推荐存在的各类问题也应引起重视,自动化决策的本质是为人民服务,算法推荐的出现是让我们的生活更加便捷,而不是让我们在舒适的“信息茧房”中减少思考,更不是让我们牺牲隐私去换取便捷生活,作为用户的我们,应行使好社会监督职能,算法推荐服务提供者也应积极履行好自身义务,针对不同用户人群制定合适、合法的推荐、管理机制,也即只有合理利用算法推荐,才能不断为我们的生活创造新的可能,只有在信息推荐服务不再以自身利益为主导,才能真正向用户让渡其自主权利