据说节后上班的第一天,IT 销售 Q4 要完成的 KPI,可以从他们的表情猜到。
在特殊的 2020 年,拼业绩显得格外激动人心。因为在困难的环境下,实现营收的正增长,是 IT 人在长期的工作拼搏中练就的必备技能。
那么,作为 IT 人的一员,数据管理者除了拼业绩,还在拼什么呢?
自然是更精准安全的数据资源。
作为数据时代新生产要素,大数据正在影响我们的饮食住行,也无时无刻不为我们带来便利,如随时可约的网约车、感兴趣的电影优惠推送、出行地的游玩攻略等。
在这些日常场景中,数据管理者通过对用户姓名、手机号、银行账号等隐私信息进行脱敏,实现了个人数据的安全应用,为更智能、便捷的用户服务加上一个安全防护罩,也为数字经济的腾飞插上翅膀。
这一切都离不开数据脱敏技术。
敏感信息保护是数据经济生命线
数据作为各类企业的重要生产资料,企业的不同部门通过各类新兴技术,对海量数据进行挖掘、分析、再利用,开发出大数据蕴含的巨大潜在价值,从而获取有益于市场策略制定的信息。
然而,部分企业在将大量用户敏感信息拷贝到开发、测试、数据分析等环境中时,并未对这些数据进行任何的数据脱敏的措施。这将面临重大的监管及数据泄露风险,如:
2019年3月,Security Discovery 安全研究人员 Bob Diachenko 披露一个可公开访问的 MongoDB 数据库,包含 982864972 条记录。据悉,这些记录包含 7.98 亿的电子邮件记录、超过 400 万备注了电话号码的 E-mail 地址、以及超过 600 万条被识别为‘商业线索’的信息。
2019年1月,HackenProof 安全研究员 Bob Diachenko 发现,MongoDB 数据库中有超过 2.02 亿中国求职者的详细简历信息已在网上被公布,疑似第三方应用泄露。据悉,这份数据库存储的 2.02 亿简历中包含 202730434 条记录,信息非常详细,包括求职者姓名、工作经历、工资预期、职业期望等数据,总计 854GB。
2018 年3 月,Facebook 承认泄露超过 5000 万名用户资料,遭“剑桥分析”公司非法用来发送政治广告;9 月,黑客又利用控制的 40 万个账户获得了 3000 万个 Facebook 用户账号的信息。持续不断的数据泄露事件,不仅让自身的业务以及信誉大受打击,扎克伯格也被公司股东会联名要求他辞去 CEO 之位。
在各类大数据频繁互联、交互的数字化时代,数据所蕴含的价值和意义,早已超出数字本身,所有人的行为、设备的操作、事物的发展等,均能通过一连串数字表示。所以,每年屡见不鲜的数据泄漏事件,无论对企业,还是个人来说,都是灾难性的损失。保障敏感数据的安全,就是保障数据经济的生命线。
数据脱敏是应用合规的战略武器
敏感信息的保护成为贯彻大数据挖掘技术的巨大挑战。在大数据价值挖掘的基础上如何保护敏感信息,不仅是数据脱敏必须解决的难题,更是取得市场竞争胜利的战略武器。
数据脱敏,具体指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样可以使数据本身的安全等级降级,在保证合规性与安全性的基础上,在开发、测试和其它非生产环境以及外包或云计算环境等应用场景中,安全地使用脱敏后的真实数据集。
数据脱敏主要包括静态脱敏、动态脱敏两大类,两者主要针对的应用场景不同,所以关键技术有所差异。
静态脱敏
静态脱敏是将数据抽取进行脱敏处理后,再下发至非生产环节,以保障开发、测试、培训、分析人员可以随意取用测试数据,并进行读写操作。脱敏后的数据与生产环境相互隔离,在满足测试环节所需的情况下,还能保障生产数据安全。
静态脱敏直接通过屏蔽、变形、替换、随机、格式保留加密(FPE)和强加密算法(如AES)等多种脱敏算法,针对不同数据类型进行数据掩码扰乱,并可将脱敏后的数据按用户需求,装载至不同环境中。
动态脱敏
动态脱敏能够对生产库返回的数据进行实时脱敏处理,并确保返回数据可用而安全。如应用只希望对外呈现部分的数据;或者数据库需要运维人员进行表结构维护,但是又不希望运维人员可以获取真实数据等场景。动态脱敏可以概括为“边脱敏,边使用”。
动态脱敏通过精确的解析 SQL 语句匹配脱敏条件,例如:访问 IP、MAC、数据库账户名、客户端工具、操作系统用户、主机名、时间、影响行数等,在匹配成功后改写查询 SQL 或者拦截防护返回脱敏后的数据到应用端,从而实现敏感数据的脱敏。实际上存储于生产库的数据未发生任何变化。
数据脱敏的三大应用场景
运维脱敏,是一种在线脱敏,是针对运维人员在访问数据库时的实时的脱敏。一般是防范运维人员在数据库中窃取敏感数据,也可能是一种工具的需要,需要运维人员对外提供脱敏的敏感数据。
业务脱敏,也是在线脱敏,针对窗口人员,即通过应用系统访问数据库时,针对不同身份权限实施的敏感信息脱敏处理。在没有脱敏产品形态时,多采用实时的应用软件定制开发来完成。
交互脱敏,是动态脱敏的一种,譬如一个系统去另一个系统取数据,在中间串联进去在线脱敏系统,对敏感数据进行处理。典型的应用场景就是现在不同政府部门互通数据时,是进行了有限制的数据交互,包括大数据交易。
面对复杂的数据脱敏应用场景,如何在实现数据高效共享、分析挖掘的同时,保护敏感及隐私信息不被泄露对脱敏作业提出了更高的要求。传统的脱敏方法需要大量的人工干预,配置成本高,对用户的专业素养要求高。
为了解决用户数据脱敏的难题,英方基于多年的数据管理技术研发实力和产品实践,自主研发了一款作用于各类关系型数据库的数据脱敏软件——i2Masking。通过脱敏规则帮助用户对敏感数据进行变形,实现数据敏感隐私保护。全图形化监控配置、高性能、非侵入、低影响的特点,更智能、个性化地帮助用户实现敏感数据保护。
根据预先配置好的敏感算法和脱敏规则,i2Masking 首先对敏感数据的相关对象进行提取,之后分析敏感类型进行脱敏,并传送到目标端进行自动装载。数据抽取、数据脱敏、数据传送、数据装载四大脱敏环节可全自动实现,并在数据落地前完成脱敏,符合 GDRP 欧盟标准的脱敏要求。
除去替换、屏蔽、截断、加密、区间加密、区间替换、保留关键信息、自动生成等常规算法外,i2Masking 可自定义脱敏算法,同时包含敏感字段发现功能,从扫描发现至脱敏,再到结果展示,一次性满足数据安全各个环节的不同需要。
此外,i2Masking 不仅能实现库与库之间的静态脱敏,还可实现关系型数据库数据的动态脱敏,以及 Oracle Datapump、MySQL Dump 等数据库原生工具导出文件脱敏,可支持数据库类型覆盖了市场主流的 Oracle、MySQL、SQL Server、DB2、PostgresSQL、DB2、GaussDB 等,总体实现了一款软件,全脱敏场景的覆盖。
数据脱敏技术将成为智能化数字时代的重点发展方向之一,i2Masking已经实现敏感数据的自动化感知、脱敏规则自动匹配、脱敏处理自动完成等功能,帮助数据管理者实现敏感数据到商业数据的安全转换,既当好战场一线的侦察兵,又能稳坐钓鱼台,运筹帷幄决胜千里,帮助前线的销售们更好地服务客户。