小心指纹泄密 科学家总结三种“数字指纹”

2018-06-11    来源:

容器云强势上线!快速搭建集群,上万Linux镜像随意使用
第二次世界大战期间,英国情报官员曾经窃听德国的无线电通讯。英国人注意到,德国人发电报时的节奏都有各自的特色,盟军间谍很快就认出每个德国发报员的风格。

  他们设法追踪德国发报员的活动,这就相当于追踪发报员所属部队的活动。

  如今的互联网作为电子通讯手段,已经基本代替了电报。然而人们在使用互联网时仍然保留了各自的风格特征。目前,科学家总结出“打字指纹”、“点击指纹”和“写作指纹”这三种“数字指纹”。

  “打字指纹”从敲击键盘开始

  1980年,美国兰德公司的研究者寻找加强电脑登陆口令安全性的方法。经二战英国情报人员的故事启发,他们想到一个主意:打字员也许像电报发报员一样,可以根据打字节奏识别出来。

  现在的研究者正开发这项技术在口令认证之外的应用。意大利都灵大学的丹尼尔?古内蒂和克劳迪娅?皮卡迪开发一个检验打字节奏的系统,这个系统不仅仅用于登陆电脑的时候。皮卡迪说:“我们对用它追踪网络非法活动特别有兴趣。”

  这个系统首先扫描一个人打字的正常过程,了解他所有不同的打字节奏,不单是在输入密码的时候。系统接下来会连续不断地监测这些节奏。

  如果黑客想设法进入别人的电脑帐户,“打字指纹”系统便会注意到不一样的打字类型,然后发出警报。2005年,意大利研究者报告说,该系统在每200次打字过程中大概产生1次错误警报。

  “打字指纹”也可以用于识别网站的用户,要求他们输入一定量的文字。皮卡迪说,网上电子邮件服务商,如Gmail和雅虎都希望使用这种保护邮件帐户的技术。皮卡迪还注意到网上论坛。“打字指纹”程序可以识别非法活动的发帖人。

  分析“打字指纹”引起不少对隐私的担心。皮卡迪说,警方可以收集很多人的打字习惯,然后从公共电脑上把他们识别出来。甚至在不知道人们打字习惯的条件下,警方也可以从公共电脑或者网上论坛上通过打字节奏获取他们的信息。比如警方可以知道一个人的母语,因为最快速打字时用到的常见击键组合会随着母语的不同而变化。

  古内蒂和皮卡迪的程序不会记录人们打字的内容和击键的次序,只记录每两次击键之间的平均时间。不过如果打字内容不多的话,可能足以让他人猜测出文章中的内容。

  移动鼠标形成“点击指纹”

  键盘不是惟一的电脑输入手段。在网络兴起后,电脑鼠标已经成为日益重要的输入手段。

  皮卡迪和古内蒂正在测试根据鼠标移动发现电脑系统入侵者的方法。他们怀疑,人们平时在移动鼠标的时候,形状和速度可以被识别出。

  来自英国伦敦大学的彼得?麦克欧文说,鼠标的移动可以用来签名。当实验的参与者用鼠标画自己的签名时,他在一边记录。参加实验的人可以用鼠标画他们用笔和纸写的正常签名,或者他们自己选的图形。麦克欧文用这些数字签名作为一种密码的附加手段,加强对电脑使用者的身份认证。

  为检验这种方法的有效性,麦克欧文向实验参与者提供第三人的密码。他还先把第三人用鼠标画密码的方式记录下来。密码和数字签名结合以后,95%以上的实验参与者在作为入侵者时都被拒绝登陆电脑,而99%以上的实验参与者作为电脑的主人能够登陆。

  “点击流”分析上网习惯

  另外一些研究者研究人们点击鼠标和浏览网页时滚动鼠标的方式。有两位美国研究人员提出一个“点击流数据”的概念。所谓点击流数据,就是人们在什么时候点击什么。他们现在正寻找途径应用这个概念,希望能用来验证网站使用者的身份,防止网络诈骗。

  假设一个人通常只会在周六下午访问某一个网上书店,花15分钟左右浏览网站,阅读园艺类书籍的评论,而且总是只用一张注册过的信用卡买一本书。如果在一个周一早晨,有人自称是前面那个人,在8分钟以后要买5本科学类小说,网上书店可能就要怀疑这是诈骗行为。网上书店可以要求对访问者进行额外的身份认证,比如向那个人的电子邮件地址发一封信。

  身份认证的要点在于从多方面收集人们行为的数据。在研究者目前的实验程序中,只记录时间差长度、时间、星期几和网站页面浏览量等数据。他们发现,网站上的“点击流数据”程序需要至少30个方面的数据才能识别出某一个使用者的习惯。即使那样,程序的准确率也仅仅只有80%左右。而且如果一个网站的浏览量比较大,需要分析的使用者习惯也更多。

  研究者还说,如果有人不愿意被“点击指纹”识别出来,他们可以轻易地改变自己的习惯躲避探测。在另一方面,如果坏蛋想要成功地模仿你,也没那么容易。“他们不得不完全像想要模仿的人那样去改变自己的行为方式,”一名研究者说。

  网上发贴会留“写作指纹”

  早在1804年,当时的科学家已经运用统计学分析人们的写作风格。科学家在那时已经知道超过1千种有关写作风格的特征。

  美国亚利桑那大学的信息系统研究员陈青春(音译)最近想到,对写作风格的这种分析可以应用到一个不同的问题上面。他说:“这种技术可以追踪任何想在网络上隐藏自己身份的人。他们会留下痕迹。”

  网民们一般在网上论坛里面匿名发帖,或者用不同的用户名。陈青春的研究可以使执法部门探测,不同的帖子是不是同一个人发表的。

  陈青春和他的同事已经研究了来自美国“三K党”、巴勒斯坦武装组织阿克萨烈士旅和网上销售盗版软件及音乐的论坛的消息。

  研究者们考虑了消息发布者的写作习惯,其中包括词汇的选择、标点符号、使用被动式的频率、大写字母和小写字母的比例、文章长度以及位于每段文字第一行之前的空格。陈青春的研究团队还分析了文章的内容,比如文章中有没有表示仇恨的语句,或者诸如“有售”这样的词汇。

  和分析书面文章相比,网上消息使研究者遇到了一些不一样的困难。网上的消息往往都要更短,更随意,所以拼写错误和标点符号错误也多一些。而且在网络论坛上发帖的人数以百计甚至更多,要从中分清楚每一个发帖者也不容易。

  在另一方面,网民在网上论坛里发帖可以用多种字体、颜色、链接和不同引用其他网民帖子的方式,这些可以提供给研究者研究的特征在书面文章里面是很少见的。

  ■相关链接

  “写作指纹”准确率最高

  陈青春和同事们鉴别出英语用法中的270个特征,然后用电脑程序从中挑出134个网民发帖时最不同的特征,再用这134个特征分析网上论坛里的帖子。他们还研究了中文和阿拉伯文的帖子。

  研究人员最后制成一张图形,他们称之为“写作指纹”。它能够显示每一个发帖人的写作特征。电脑程序把每一篇帖子分成各含50或60个词汇的小节,单独分析每一个小节,然后总结出最能表示帖子作者风格的方方面面。

  研究者们去年报告说,在分析过某一个帖子作者的30到40篇帖子以后,不论他是谁,电脑程序都可以比较准确地识别出他以后发布的帖子。电脑程序对中文帖子的准确率是93%,对阿拉伯语帖子的准率能达到95%,而对英语帖子的准确率有99%。

标签: 安全 电子邮件 服务商 互联网 美国 网络 网站 问题 选择 隐私 用户

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:受害网友悬赏10万美金通缉熊猫烧香作者

下一篇:恶意软件权威判定机构可界定恶意软件