您的位置:首页 > 国内新闻

智能音箱,你在窃听我吗?

时间:2019-08-21
?

0×251C

关于智能扬声器的窃听、存储、泄漏和手动监控,哪些是事实,哪些是谣言?

作者姚新伟主编心平气和

女儿过生日的时候,朋友给了西兰一个智能音箱,这是市面上常见的主流品牌。这个小盒子不贵。席兰对新奇的兴趣一般放在客厅里,但6岁的女儿爱上了这个小喇叭,总是纠结在里面讲故事。

渐渐地,俚语给这个聪明的演讲者留下了很好的印象。“这只是一件蝎子工艺品。”当她高兴的时候,她开始在淘宝上浏览相关产品,并计划购买更高的知名度,更好的质量模型。

直到几个月前的一天,斯兰无意中打开了一个连接到智能扬声器的移动应用程序,却意外地发现其中记录的一段文本正是她刚和丈夫聊天时的文本。令她惊讶的是,这次谈话是在女儿听完故事后进行的。理论上讲,说话人已经处于休眠状态,不应收集声音,内容不应传输到手机并转换为文本。

“它总是偷听我们家的谈话吗?”西尔维娅心里产生了怀疑。家里人也很嫉妒那些聪明的演讲者。新的机器购买计划自然搁浅了。对于现有的演讲者,俚语选择“关机”。“女儿喜欢听故事。听的时候,我会打开一会。“拔掉电源。”在过去的四五个月里,他们一直这样使用。

1

正在“听”的扬声器

聪明的演讲者第一个已知的“窃听事件”发生在美国俄勒冈。

在2018年5月,Danielle的丈夫接到了下属的电话:“立刻放上你的Echo设备插头,你被黑了!” Danielle住在俄勒冈州的波特兰市,家里有四个亚马逊智能音箱。回声设备。当天早些时候,她丈夫的下属收到了一份录音文件并打开了它,但听到Danielle和她丈夫在家里的私人谈话,这对夫妇正在讨论使用哪种牌子的硬木地板。

在震惊之下,Danielle拔掉了所有Echo设备并快速拨打亚马逊客户服务电话进行解释。与此同时,她将事件打破了CBS。

对于这一事件,亚马逊给出了“误操作”,这意味着在运行时,Echo设备误将对话的内容误解为指令,希望用户希望将先前的语音内容发送给地址簿中的某人。然后,执行了该指令。

Echo是来自亚马逊的智能扬声器,配有语音助手Alexa。到2018年中期,Echo已在美国出货约3500万台;据CIRP预测,其市场份额达到70%,远远超过其他品牌。

头部产品出错了,新闻迅速传播和发酵。不久之后,Echo的第二次“意外”再次出现。一名德国用户将消息传给了当地杂志《c’t》。当他要求亚马逊发送自己的个人活动语音数据时,他收到了一个100MB的压缩文件供下载。下载是解释Alexa语音命令的PDF分类。记录和1700个陌生人对话的录音。

《c‘t》我听了一些录音,发现可以根据谈话内容“拼凑”的生活细节包括:家里和外面的时间,家里其他品牌的智能设备,性别家庭,甚至是用户的声音。

虽然亚马逊已为上述两起事件道歉,但它未能掩盖一种在公众舆论中逐渐形成的猜测:作为一种新兴设备,智能扬声器的“窃听”可能不仅是一种隐患,而且也存在。 “当你听到唤醒的话语时,它可以开始工作。这是否意味着智能扬声器随时随地都在倾听我们的对话?”斯兰怀疑。

最近几个月,更多与智能设备相关的“窃听”事件正在曝光。据国外媒体报道,今年7月,苹果承包商表示,为了增强Siri的产品功能,Apple将聘请外部承包商收听录音,包括Siri在事故被激活时所包含的私人谈话,如药物治疗。信息,毒品交易和其他信息。

巧合的是,在同一个月,有消息称谷歌智能助理将向公司员工提供录制的声音文件,甚至世界各地的谷歌第三方承包商也可以定期收听这些对话。

对设备中内置的智能扬声器和语音助手的担忧正在蔓延,不仅是“窃听”,而且智能扬声器的偶尔自启动也刺激了一些用户。从去年开始,有些网友表示,当Echo没有被唤醒时,会有一种“嘻嘻”的笑声,令人毛骨悚然。

一些国内智能扬声器也出现了类似的现象。一位用户透露,放置在家中的智能扬声器突然报告“该设备正在进行系统升级并更新了应用程序”。 “虽然这是正常的内容,但家里没有其他人,但每次发言人突然说话。我很害怕我。“甚至有一次,当她邀请朋友到家里互相聊天时,智能音箱突然惊醒,并在没有任何警告的情况下为所有人播放了一首森林歌曲《杀手》。

“随着屏幕”扬声器带来图像疑惑。随着“窃听事故”的增加,一些用户怀疑他们自己的屏幕扬声器具有“回家看”的功能,因为他们可以在家里远程直播。情景,这些图像会被记录下来并同时转移到其他地方吗?

人们越来越对这款智能扬声器的新产品感到困惑。来自“它在听我说话吗?”延伸至:睡觉时听起来是否合理?这些对话会在接收后存储和传输吗?听到这些声音了吗?并且,它会被黑客攻击并变成“虫子”吗?

2

谣言和真相

“在过去的一年里,我买了一个智能扬声器之前,我身边的很多朋友都来让我来监控这个问题,”张思成说。他曾在多家公司的智能扬声器部门工作,被朋友视为行业专家。 “更有意思的是,几乎每个人都在问题之后买了扬声器。”

根据张思成和许多熟悉智能扬声器的从业者的说法,智能扬声器的识别分为两种情况:“本地”和“云”。当智能扬声器未唤醒时,它处于本地工作状态,但它将包括外部声音。但这些声音不会被存储和语义识别。 “在醒来之前,它相当于做声波识别工作,”徐家明说。 “(智能扬声器)会将录制的声音与唤醒的单词进行比较。当声波匹配时,它会自动打开。“徐家明是一位智能音箱产品经理。

张思成否认了“偷袭”的谣言。据他介绍,主流市场上很多国内智能扬声器都没有主观的故意监控。

“这是一件非常昂贵的事情,”张思成说。他计算了这个帐户:假设一家公司销售100万个扬声器,并有200,000天的现场工作。如果该公司想要启动这些扬声器进行24小时监控,即使它每秒产生100k数据,再乘以200,000,累计转移带宽,存储和计算的成本也相当惊人。

更重要的是,凭借当前的技术处理能力,公司无法将这些庞大而零散的录音变成具有商业价值的有效信息。在张思成看来,即使我们不考虑道德层面,我们只关注商业利益,而企业也没有动力做主观信息收集。

据张思成介绍,在去年由工业和信息化部领导的智能扬声器检测工作中,在未醒来的状态下,每个智能扬声器传输的数据量仅为KB级。对于语音数据,这个数据量几乎可以忽略不计。

与“窃听”谣言更加一致的内容是“觉醒词”之后的智能扬声器工作模式。

张思成和徐家明都承认,在扬声器被唤醒后,它将进入云工作状态,并将收集到的声音传输到云服务器,完成语音语义识别和反馈工作。 “这是不可避免的,”张思成说,但他提到智能扬声器内置的计算能力不能支持AI的语义语义计算,也不能提高本地的识别能力。

为了避免网络故障和隐私问题,在一些定制的全屋智能中,张思成的公司提供了仅在本地运营的语音解决方案。但是,这将使功能非常单一,并且仅支持固定命令。例如,在主人回家后,他可以告诉语音助手“打开灯”,但如果它被切换为“打开灯”,则无法识别。

根据智能扬声器的产品策略,当用户结束命令时,如果几秒钟内没有出现新声音,机器将恢复睡眠状态。 “每个品牌的设置都不一样,有些在3秒内,有些在5秒内,”徐家明透露。然而,在实际工作中,由于智能扬声器的成熟度有限,“唤醒”和“睡眠”可能有误差。 “例如,只有一个类似于唤醒词的声音,或者在命令结束后还有其他声音,因此智能扬声器认为它需要继续工作,它将继续接收无线电,并且用户不知道。“根据他的推测,包括俚语在内的许多用户遇到的所谓“窃听事件”都是由于这些原因造成的。

根据许多从业者的说法,智能扬声器行业目前的“错误唤醒率”大约是每48小时2次,更糟糕的是,每24小时就有2-3次,这无疑意味着误操作。高所谓的“窃听”频率。 “对于每个品牌,目前最重要的是提高人工智能和减少滥用。收集的语料库是最好的培训材料。”徐家明提到。

今年4月,彭博社的调查显示,亚马逊全球有数千名员工负责手动收听和检查用户与Alexa的对话,并对这些录音进行标签,检查和反馈,以减少误用并更好地帮助Alexa。回应指示。罗马的两名亚马逊员工表示,他们需要每天工作9小时,并解析多达1000个音频。

“这实际上并不是业界的秘密,”张思成认为,不仅是国外品牌,还有几个“主要试听”环节在中国的几个主流智能音响品牌。为了尽可能地保护用户的隐私,在用户听到之前,记录将被去敏感和分解。虽然员工会听到录音对话甚至涉及私人事务,但它无法识别用户的特定身份。 “在云端进程中,音频文件本身并不对应用户帐户信息和设备信息,主要是为了优化指令。”国内主流智能扬声器制造商回应。

“手动审计的语料库总量的1%主要集中在识别困难的内容。例如,当说话者回答'我不明白你在说什么'时,这句话之前的内容将优先作为手册听着,“张思成解释说。在他以前的公司,当某些新功能推出时,为了提高其准确性,某些特定语料库的比例将提高到10%左右;然而,这种工作的持续时间非常短,通常“在解决问题几天后,它将恢复正常比例”。徐家明还认为,随着人工智能模型识别能力的提高,企业使用人工试听的比例可能会降低。

智能扬声器录制的语料库不会永久存储。扬声器制造商表示,识别完成后将删除音频文件。 “每次保持文件都不相等,我们在这里待几个月,”徐家明补充说。

3

什么都不做

毫无疑问,智能扬声器和其他语音助手产品还不是一个成熟的类别。

这导致了此类产品中的许多漏洞,例如虚假唤醒,例如“黑客攻击”。去年8月,在拉斯维加斯举行的全球黑客大会的Defcon会议上,腾讯安全团队在26秒内成功破解了亚马逊的Echo,远程控制了指定设备,因此该设备未被唤醒或提示。自动记录静默状态,并通过网络将记录文件发送到远程服务器。

“当使用2,300个扬声器时,其中一个智能扬声器遭到人身攻击。其他智能扬声器可以通过局域网上的非接触式攻击放在后门,成为黑客的远程黑客。“在破解时间后不久,腾讯安全专家吴惠宇在一次演讲中说。当然,在腾讯提交这些漏洞后,亚马逊已经完成了这部分修复和更新。

在另一个层面上,它是短暂的上涨时间和低成熟度。到目前为止,智能音箱还没有形成任何黑色和灰色的产业链。录音语料库在公司中具有非常严格的保密程度。张思成透露,在他工作的公司,涉及录音的工作将在公司内部完成。虽然人员有限,但一些安全级别较低的识别工作将外包。外包人员将被要求到公司完成识别工作。

“在国内市场,我还没有听说有任何公司转售语料库。我没有听过成功窃听的案例。同样,据我所知,智能音箱不会使用所听到的语料库,对每个人而言。全景画。“张思成肯定地说,“最后,智能音箱仍然是愚蠢的,提取有效信息的成本太高。我个人觉得在未来三到五年内,我不必担心隐私问题由发言者带来的。“

但与其他从业者一样,他并不否认上述“尚未发生”的情况将有可能在更成熟的技术中“发生”。

作为这个新兴行业的从业者,张思成已经可以接受技术和隐私难以平衡的问题。 “在物联网和人工智能时代,我们没有隐私,没有束缚,”即使没有智能扬声器,通过手机和电脑。每个人的信息,偏好,习惯和其他信息早已被各公司掌握。从本质上讲,这没有什么不同。

除非在更强大的计算未来,所有智能产品都在本地运行,全部断开连接,并且只在系统偶尔更新时联网。张思成认为,对于普通人来说,想象这种高科技难度和低商业价值,这是太过深远和太不现实。

面对这些焦虑,有些人选择远离智能扬声器。一位技术人员表示,他已完全断电家中的智能扬声器,并且不再有任何计划购买其他智能家居;张思成默默地接受说,他买了三四个家用智能音箱,最初用于工作测试,后来习惯了它们的存在。

在技术检测隐私的边缘,张思成的底线是“无害”。他将智能扬声器放在起居室和门厅里,这样即使一些语音数据被泄露,也不会对他和他的家人造成实质性伤害。 “智能音箱的声音范围约为3至5米。收集墙壁很困难。卧室基本上听不见。当有私人话题时,你也可以拔掉电源并通话。”

他不能接受的是图像泄漏。 “我永远不会在卧室里购买配备相机的扬声器或其他配备相机的产品。”他清楚地知道,一旦图像泄露,这将是一个无法弥补的重大危险。不止一位从业者透露,网络摄像头设备确实将图像传回服务器。这些信息将严格保密,但仍存在泄漏的理论风险。

你无法隐藏自己,所以你只能以最基本的方式保护自己。这是张思成的理论。

不过,有些人也有一种更乐观的态度,“智能音箱处于野蛮增长的初级阶段,延伸到整个智能家居,将经历这些初始阶段,那么隐私保护只能依靠制造商的自律,”徐Jiaming坚信:“当这些产品完全普及时,将会有更高水平的隐私实践,统一行业,限制权限,并作为强制性标准。”

(温思兰,张思成,徐家明都是假名)

玩电子游艺技巧

  • 友情链接:
  • 江西门户网站 版权所有© www.lg8uwm.cn 技术支持:江西门户网站| 网站地图