购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

推特会泄露用户经济状况

撰文 |雷切尔·努维尔(Rachel Nuwer)
翻译 |李玲玲

一项针对超过1,000万条推特消息的分析表明,用户会在不知不觉中暴露自己的社会经济地位,这是机器学习模型带给现代人的挑战之一。

和性一样,金钱也是大多数人避免在公众场合谈论的话题。但我们却经常留下会暴露我们经济地位的数字痕迹——即使是在字符数限制在140以内的推特消息中。

一项针对5,000多位推特用户发表的大约1,080万条推文的分析显示,这些简练的信息足以揭示用户所处的收入阶层。美国宾夕法尼亚大学研究自然语言处理的博士后研究员丹尼尔·普雷奥蒂乌克-彼得罗(Daniel Preoţiuc-Pietro)和同事,根据用户自定义的职业,将90%的上述样本归类到相应的收入组里。

接着,他们用一个能从数据中学习并能基于数据进行预测的机器学习模型识别出每个收入组的独有特征。然后,他们用这个机智的模型对剩下的10%的样本进行测试,结果,模型成功预测出了这部分用户的经济状况。

正如研究人员2015年秋天在《公共科学图书馆·综合》( PLOS ONE )杂志上所描述的,高收入者倾向于谈论商业、政治和非营利工作。低收入者的话题大多局限在个人方面,比如美容秘诀和个人经历。普雷奥蒂乌克-彼得罗说:“高收入者将推特作为传播信息的工具,而低收入者更多地将其用于社交。”这项分析还揭示,挣钱越多的人更易表露出恐惧或愤怒。

在之前的机器学习研究中,普雷奥蒂乌克-彼得罗和同事已经预测出了推特用户的性别、年龄和政治倾向。他们甚至能发现用户患上产后抑郁和创伤后应激障碍的一些迹象。

接下来,研究团队还将继续优化模型,不过,普雷奥蒂乌克-彼得罗说:“机器学习的威力归根结底源于获得的数据,人们应该注意自己是否在不经意中透露了私人信息。” lZFrWocys8V1oZhUlSIfBqB+Ue490rTetorBvUY0zvcZ4Ac5D6e6DM8Adu8LZxAV

点击中间区域
呼出菜单
上一章
目录
下一章
×