CSS 指纹

更新日期: 2022-02-21阅读: 1.1k标签: 技术

什么是css指纹?

CSS 指纹是一种跟踪和收集用户信息的技术,这种方法主要是利用了 CSS 的一些特性来跟踪用户的浏览器和设备的各种特征,这些特征以后可以用来识别或跟踪用户

CSS指纹如何生成

原理比较简单,主要就是通过无数的媒体查询来给页面返回一套适用的CSS样式代码,这套CSS代码中会有很多的背景图片,背景图片的地址是一个特定的URL,这个URL上携带了一些我们需要收集的参数,比如:

@media screen and (width: 300px) {
body {
background: url(https://zero2one/collect/info/width=300);
}
}

这个媒体查询代码只会在用户设备宽度为 300px 时生效,所以我们上报的地址也可以带上 width=300 的信息,其它信息也类似这种方案去实现,这里就不一一列举了

为了避免信息的重复上报,服务端在接收到该信息上报后,最好将 HTTP 的状态码返回 410(Gone),这样该请求就会缓存下来,之后重复的请求都不会走到服务端,而是走的缓存。最终的效果就类似这样:


同样的,用户本地安装了哪些字体也可以追踪到,不过实现起来有些麻烦,我们可以列举几百甚至几千种字体样式代码,让页面去本地加载对应字体,若本地没有该字体则发起网络请求到我们的服务端,最后对比一下哪几个字体没上报,就说明用户本地有哪些字体了~

举个例子:

@font-face{
font-family: abeezee;
font-display: block;
src: local(Abeezee), /* 加载本地字体 Abeezee */
url(/collect/info/font-name=Abeezee) /* 若加载失败,则上报信息 font-name=Abeezee */
}
@font-face{
font-family: abel;
font-display: block;
src: local(Abel), /* 加载本地字体 Abel */
url(/some/url/font-name=Abel) /* 若加载失败,则上报信息 font-name=Abel */
}
/* ...此处省略成百上千个类似字体样式代码 */

若最后我们服务端所有字体的信息上报都收到了,唯独没有收到 /collect/info/font-name=Abeezee 这条请求,说明该用户本地只安装了 Abeezee 这个字体

再多举几个例子,判断用户当前是哪个浏览器:

@media screen and (-ms-high-contrast: active), (-ms-high-contrast: none){
body {
background: url(https://zero2one/collect/info/browser=IE10+)
}
}

@media all and (min-width:0) {
body {
background: url(https://zero2one/collect/info/browser=IE9+)
}
}

@-moz-document url-prefix() {
body {
background: url(https://zero2one/collect/info/browser=firefox)
}
}

@media screen and (-webkit-min-device-pixel-ratio:0) {
body {
background: url(https://zero2one/collect/info/browser=chrome)
}
}

更多的用户信息可以见媒体查询支持的功能


为何要有CSS指纹

因为大多数的用户隐私追踪都是依赖于 JavaScript 、Cookies 的,尤其是 Cookies,你在大多数的网站都能见到一个弹窗向你请求 Cookies的访问权限,例如 stack overflow 网站一进去就会出弹框:


但无论是 JavaScript 还是 Cookies,都很容易反追踪,比如禁用页面的 JS脚本、连接VPN或者是使用了某些反追踪的浏览器插件等等,而CSS指纹就可以不受这些的限制而收集到用户相关数据

CSS指纹缺点

上述所说的方案有一个最大的缺点就是:CSS文件会特别大,如果带上所有字体的请求,甚至浏览器并发的请求都会达到数百个,这一定是会影响用户体验的

优化请求次数

要知道用户本地有哪些字体的代价比较高,或许可以通过本地有哪些字体来判断用户当前的操作系统,因为市面上大部分的操作系统自带的那些默认本地字体就只有那些,直接去请求这些字体就足够了~

我们现在每收集一条信息都要上报一次,如果不算字体请求上报,估计并发的上报请求也有几十条了,有一种思路就是请求合并,看看能否把所有要收集的参数拼接到一个URL上去,但目前为止仅在CSS里好像是不行的,因为 url() 是不能使用自定义CSS变量的,来看个例子:

::root {
--request-url: 'https://zero2one/collect/info/width=300'
}


body {
background: url(var(--request-url)); /* error */
}

这样用是不行的,为什么?大家都知道 url() 里的内容既可以加引号,也可以不加:

body {
background: url(https://zero2one/collect/info/width=300); /* right */
}

.root {
background: url("https://zero2one/collect/info/width=300"); /* right */
}

这是历史遗留问题导致的,所以如果我们想在 url() 里使用自定义变量就会报错,CSS在解析时会把 url() 中的所有内容当做 URL,而现在值中有非转义 ( 会导致一个分析的错误,所以整个声明被作为无效抛出,那么想用自定义变量该怎么使用呢?

::root {
--request-url: url('https://zero2one/collect/info/width=300')
}


body {
background: var(--request-url); /* right */
}

这样就没有问题了!

好了言归正传,正是因为这样的问题,我们似乎没法对用户数据做一个拼接合并上报,所以 CSS Values and Units Module Level 4 提出了这样一个草案

图片url草案

简单来说的话,就是 url() 里面可以填入字符串 + 0或多个修饰符,去看了一下修饰符的含义,似乎修饰符可以写CSS函数(类似calc()、var()、attr() ...),这样不就满足我们的需求了吗?来模拟写一下:

::root {
--screen-width: 'width=300';
--screen-height: '&height=500';
}

body {
background: url('https://zero2one/collect/info?' var(--screen-width) var(--screen-height));
}

这样就模拟了我们 JS 中的字符串拼接~ 岂不是美哉,然后再加上其它媒体查询的变量修改,就实现了一次请求上报所有信息的需求

::root {
--screen-width: '';
--screen-height: '';
}

@media screen and (width: 300px) {
::root {
--screen-width: 'width=300';
}
}

@media screen and (height: 500px) {
::root {
--screen-height: '&height=500';
}
}

body {
background: url('https://zero2one/collect/info?' var(--screen-width) var(--screen-height));
}

希望这个草案能顺利通过~ 这样CSS指纹的方案就又更加完善了!

来自:https://mp.weixin.qq.com/s/gFCGM7ANOxHqYxGItyA_CA

链接: https://fly63.com/article/detial/11207

技术开发,如何与领导谈涨薪

归根结底,涨薪其实是达到自己价值与薪资的最佳匹配. 好比你就是一只股票,公司当然会选择那些估值远高于股指的股票. 所以唯有不断增长自己的价值,才会成为你在涨薪谈判中的重要筹码.

bt种子简介与magnet磁力介绍

BT下载相信老司机们都接触过,为什么BT种子会慢慢被磁链取而代之?它们都可以用于BT下载,除了文件和字符串这表面上的区别,背后的技术上又有何不同?

WebService的两种方式SOAP和REST,之间的区别与优缺点

SOAP用于在Web Service中把远程调用和返回封装成机器可读的格式化数据。REST形式上应该表述为客户端通过申请资源来实现状态的转换,在这个角度系统可以看成一台虚拟的状态机。

工作了四五年,感觉技术上依旧长进不大

技术精进是一个持续增长的过程,而非一朝一夕,即便你在最短时间的掌握了大量的技术点,如何不及时应用到实际问题中,也很容易被遗忘。有朋友会说,我平时也挺努力的,一直不间断的学习

在阿里做了五年技术主管,我有话想说

今天的文章,他将继续深入探讨这一话题,从管理的角度分享技术TL的核心职责,主要包括团队建设、团队管理、团队文化、沟通与辅导、招聘与解雇等,希望与大家共同探讨、交流。

你和阿里员工的技术水平到底差几个等级

根据近年数据,中国现有程序员500万左右,其中P1、P2数量占据了近100万,P8及以下程序员约有490万,P9及以上仅有10万。80后是企业的技术支柱,90后已开始逐步成为企业的中坚力量

程序员常逛的技术社区

技术的成长路上,少不了跟一些志同道合的人交流,阅读一些技术前辈们的经验分享。这一路走来,还是要感谢有技术社区的陪伴,让码字之余,在技术、以及技术以外,都有不少收获。

未来,哪些技术在前端开发的地位会越来越高?

过去的这段时间里,不论是互联网巨头还是初创企业,都纷纷进行了一波优化。渐趋理智的资本淘汰了一批不能适应市场的业务,而业务的紧缩也淘汰了一批不能适应市场的程序员。

合格PHP程序员应该掌握哪些技术?

除了能够完成基本的PHP业务开发,还能够解决大部分深入复杂的技术问题,并且可以独立设计完成中大型的系统设计和开发工作;自己能够独立hold深入某个技术方向,在这块比较专业

技术追求的误区[观点与思考]

认识的一个 10 人左右的团队,本来是用 PHP 的,这些年看到网上很多用 / 转 Go 的消息,于是团队里有不少人就焦虑了,希望找一个合适的切入时间,能够试一把 Go

点击更多...

内容以共享、参考、研究为目的,不存在任何商业目的。其版权属原作者所有,如有侵权或违规,请与小编联系!情况属实本人将予以删除!