购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第2章
伦理数据的收集

珍妮(Jenny)是一家音乐活动开发应用程序的创始人。该应用程序有一个登录模块,用户可以通过其脸书个人信息登录。该应用程序通过借助用户的姓名、电子邮件地址和脸书点赞来提供更好的用户体验,并推荐其他音乐活动。珍妮意识到,她收集的应用程序用户的数据可以在其他地方发挥巨大的价值,于是她要求产品经理去寻找其他的商业机遇。产品经理给出了几种设想:

第一,脸书点赞的数据将有助于预测人们对产品的兴趣,从而帮助公司有针对性地进行定向网络广告宣传。在与一家广告技术公司讨论后,他们提议购买这些数据。第二,音乐制作人也对购买这些数据十分感兴趣,因为他们想知道人们听其已授权的音乐的频率和时长。为了实现这一想法,制作方要求应用程序时刻开着麦克风,以检测是否有任何他们授权的音乐正在播放。第三,音乐活动推广者对这些信息也很感兴趣:通过存储安装了应用程序的移动设备经常访问的IP地址,并将这些地址映射到相应的纬度、经度坐标,可以帮助他们日后结交新朋友。珍妮喜欢这些想法,因为这一商业案例表明,它会有利其公司的快速发展。但当珍妮向董事会提出她的想法时却受到严厉的批评。一位投资者公开质疑她领导一家与数据科学相关的初创企业的能力,并威胁要解雇她。正如你所想的那样,珍妮的这个案例涉及用户的隐私问题。本章将从详述隐私的重要性开始,并探讨欧盟通过的《通用数据保护条例》中的一些概念,这些概念可以指导我们进行伦理数据收集。除了这些概念,我们还将介绍一些隐私保护技术,如加密、模糊处理和差分隐私,这些技术着眼于保持隐私与个人数据的收集和存储之间的平衡。有偏差的数据科学模型通常是由所收集的数据的偏差造成的,我们将用几个警世故事来分析这些模型的问题。另一种重视伦理的数据收集实践是人体实验。我们会结合一定的历史背景讨论这个问题以及在线实验中经常出现的伦理问题。 gvmUq2GbbJtR/MtOo5lFT3SZrqlnvaRPNZu3IktEkpW1BuCHeslNsYuphSz2TfGW

点击中间区域
呼出菜单
上一章
目录
下一章
×