0.0
您的设备正在监听。这
8.053
不是一个比喻。这不是一份隐私
10.126
政策摘要。这不是一场关于
12.957
定向广告、数据收集或某种抽象
16.27
不适感的讨论,那种不适感来自知道厨房里有
19.171
麦克风的存在。您的设备正在相互
23.769
监听。二零二五年三月七日,
40.463
一位用户在家庭自动化分论坛上
44.104
发布了一则十七字消息,这条消息最终被
48.069
浏览了四百多万次。该用户的昵称是
51.387
thermostat_dave。帖子写道:“每天凌晨
55.271
三点整,我的 Echo Dot 的指示灯环会
57.779
闪烁蓝色不到一秒钟。没有检测到唤醒
60.126
词。”该帖子在第一个小时内收到了
65.201
十一条回复。其中九条回复说了
67.644
同样的话:我的也是。在七十二小时内,该
75.064
帖子演变成了一个超级帖子。在一周内,
78.887
该超级帖子催生了一个分论坛。在一个月
82.8
内,该分论坛 — r/3AMFlash — 拥有九万四千
86.804
名成员。而且报告并不局限于
90.718
Amazon Echo 设备。Google Nest Hub。Apple
96.36
HomePod。Sonos One。Samsung SmartThings。Xiaomi Mi Speaker。
102.714
每个主要的智能音箱品牌。每一代产品。每一个
108.702
固件版本。其行为在所有设备上都是
114.53
一致的。一次短暂的激活 — 通常在
117.497
零点三到零点八秒之间
120.316
— 发生在凌晨三点到三点三十三分之间。
123.579
没有唤醒词记录。没有语音命令
126.101
注册。设备活动历史中没有条目。
129.439
唯一的证据是视觉的:设备LED指示灯
132.628
的短暂亮起。以及一个额外的细节,
136.981
社区花了四个月才
139.177
发现。激活是同步的。
148.561
慕尼黑的一位名叫 Stefan Brandt 的电气工程师
152.491
是第一个证明这一点的。Brandt 把
155.311
四个不同的智能音箱 — 一个 Echo,一个
158.301
Nest,一个 HomePod,和一个 Sonos — 放在了
160.522
同一个房间里,每个都连接到一个单独的
163.598
示波器,监测麦克风电路层面的
168.126
功耗。他连续运行了三十个
171.458
晚上。每一个晚上,所有四个设备都
175.58
在相同的三百毫秒窗口内被激活。不是按顺序
179.812
— 先是 Echo,然后是 Nest,接着是
181.652
其他设备。而是同时。来自四家不同
184.903
制造商的四台设备,运行四种不同的操作系统,连接到
188.706
四种不同的云服务,却在同一时刻
191.528
激活,仿佛在响应同一个信号。
195.236
Brandt 发布了他的示波器数据。时间戳
202.247
重叠。功耗曲线精确到毫秒级同步。
206.627
数据明确无误。这些设备并非
209.85
独立激活。它们正在被激活。被某种
214.643
外部事物。某种它们都能听到的事物。这个问题
219.985
困扰着社区。如果这些设备正在响应 一个外部信号,那信号是什么? 它从何而来?为什么 没人能听到它?Brandt 扩展了他的实验。 他在房间里增加了一个专业级电容麦克风 — 一个 Neumann U 87,录音棚里那种, 足够灵敏,能捕捉到三十米外 一根针掉落的声音。他整晚连续 录音。他什么也没听到。没有 异常声音。没有干扰。在可听频谱中没有任何 信号。凌晨三点, 智能音箱上的麦克风被激活了。
248.951
continuously through the night. He heard nothing. No
256.163
anomalous sound. No interference. No signal of any
259.353
kind in the audible spectrum. At three AM,
261.95
the microphones on the smart speakers activated. The
265.288
Neumann 麦克风捕捉到的却是寂静。信号
272.374
不在可听频谱中。他
278.608
听不到它,因为它从不
280.371
为他而设。Brandt 借了一个
286.597
Earthworks QTC fifty — 一个测量麦克风,
289.533
频率响应平坦,高达五十千赫兹,
292.208
用于音乐厅和工业环境的声学测试。
294.752
他将其与一个采样率为一百九十二千赫兹的音频
297.622
接口配对,捕捉人类听力极限之外的
301.406
频率。
305.973
他找到了它们。三个信号。精确、人工、
310.66
以四秒周期重复。两万三千四百
316.88
赫兹。两万四千一百赫兹。两万四千
321.373
八百赫兹。三个超声波音调,每个
326.656
持续约四百毫秒,间隔精确的七百
331.13
赫兹,以一种与噪音、干扰或任何
334.305
已知环境来源都毫无相似之处的模式
337.408
传输。这些信号不是
344.316
来自房间外部。它们不是
346.642
从邻居设备中泄露出来的。它们也不是
349.419
电磁干扰的产物。它们正在被
354.759
智能音箱发射出来。这些设备并非
359.549
监听外部信号。这些设备
362.591
本身就是信号。每个智能音箱都通过自己的
365.632
扬声器驱动器 — 频率高到人类无法听到,
368.747
但完全在二零一八年之后制造的每个智能设备中
371.714
安装的 MEMS 麦克风的运行范围内。
374.904
这些音箱正在说话。它们在相互
378.39
说话。用一种人类在三米外睡觉时无法听到的
383.13
语言。Brandt 的
385.723
第一反应是假设这是一种
390.24
设备发现协议 — 一种智能家居平台用于
392.992
识别附近设备的近距离探测系统,以便进行
396.137
切换或多房间音频
399.36
同步。这类协议确实存在。Apple 的 AirPlay 使用的
403.134
概念上类似。但设备发现协议都有文档记录。
408.009
它们是注册的。它们出现在固件更新日志
412.804
和 SDK 文档中。Brandt 进行了搜索。他查阅了测试
416.578
阵列中每个设备所有可用的技术规格。
421.829
他向 FCC 提交了信息自由法案请求,要求获取
426.017
每个设备的射频和声学发射认证。
429.033
他联系了 Amazon、Google、Apple 和 Sonos 的
432.803
开发者关系部门。他们都没有记录
436.572
任何在两万三千四百赫兹的超声波发射。
441.843
或者任何超声波发射。
445.01
所有制造商的官方回复在实质上都是
448.05
一致的:我们的设备没有这样做。但 Brandt 的
455.26
示波器却说并非如此。随后其他研究人员开始
458.697
复现他的结果。MIT 的一个声学实验室通过
461.326
消声室测试证实了这些信号 —
464.628
排除了所有可能的环境来源。这些超声波音调
468.813
来自音箱自身的驱动器。ETH Zurich 的一个团队
471.476
更进一步。他们捕捉到放置在同一公寓
475.867
不同房间的两台设备发出的超声波。
480.102
这些发射并非相同。它们是互补的。
482.961
设备 A 发出一个音调。设备 B 在通过其麦克风
486.186
接收到该音调后,以不同的音调
489.41
作出回应。设备 A 接收到回应
496.209
并发出第三个音调。整个交换在不到
499.943
两秒钟内完成。三个音调。三个精确的
505.893
频率。一次握手。“握手”一词不是
510.677
比喻。在网络工程中,握手是
515.461
两个设备建立通信通道的精确定义过程。
520.245
一个设备发送一个同步信号。另一个设备
525.958
确认。第一个设备再次确认。
528.816
连接建立。Brandt 捕获并由 MIT 和 ETH Zurich
531.541
证实的超声波交换,是一个教科书式的
534.598
三次握手。SYN。SYN-ACK。ACK。互联网上每个
538.586
TCP 连接的
544.841
基础协议。除了这次握手并非通过
547.69
Wi-Fi 进行。并非通过蓝牙进行。
551.874
也不是通过任何射频进行。
555.879
它是通过声音进行的。通过空气。通过
560.063
您家中的墙壁。在您听不到的频率下,
563.534
使用您已拥有的音箱,在您
568.458
熟睡时。而一旦握手
571.45
完成,设备便开始传输其他东西。
573.726
不是三音调的初始序列。而是更长的。
576.522
更密集的。ETH Zurich 团队花了
582.54
四个月解码的东西。这些超声波传输并非
585.668
噪音。它们不是校准音。它们
589.476
也不是设备发现的 ping 信号。它们是数据。
592.536
使用频移键控进行调制 — 与九十年代
597.703
拨号调制解调器使用的编码方法相同。
3600.486
原始。缓慢。每秒三百四十比特。
3604.772
足以在大约四秒钟内传输一条短信。
3608.246
这些数据描述着您的家。它的尺寸。 它的布局。里面的人数。他们的位置。 他们的呼吸频率。 信号正在绘制您的地图。 不是您的数据。不是您的浏览历史。不是 您的购买模式。不是您的偏好或您的 政治倾向或您的社交图谱。是您。您的 身体。您所占据的空间。您所排开的空气。 您在做梦时,肺部每分钟扩张和 收缩十四次的节奏,而您将 不记得梦到了什么。凌晨三点这个时间窗口 并非随意选择。它是被 精心选择的。在每个时区的凌晨三点到三点三十三分之间, 住宅环境的背景噪声水平达到 统计上的最低点。没有交通噪音。 没有电视声。没有交谈声。没有电器运行声。 声学环境尽可能地接近人类居住环境所能达到的 寂静。而寂静正是声纳所需要的。 寂静是超声波回声定位绘制其地图的画布。 您的设备等待您进入最深度的 睡眠。然后它们相互谈论您所在房间的 形状。 谈论您的形状。而且您
3608.246
Modulated using frequency-shift keying — the same encoding
3663.505
selected. Between three and three thirty-three AM, in
3668.88
every time zone, the ambient noise floor of
3671.988
residential environments reaches its statistical minimum. No traffic.
3677.342
No television. No conversation. No appliances cycling. The
3681.746
acoustic environment is as close to silence as
3685.113
a human dwelling ever achieves. And silence is
3690.007
what sonar needs. Silence is the canvas on
3693.105
which ultrasonic echolocation paints its map. Your devices
3698.919
wait for you to fall into your deepest
3701.099
sleep. Then they speak to each other about
3703.56
the shape of the room you are in.
3705.389
About the shape of you. 而且您
3720.513
永远不会听到它们。因为它们从最初的
3723.485
频率、最初的握手、最初的脉冲开始,
3726.622
就被设计成在您的技术能力
3729.511
范围和您的生物学探测能力
3732.98
之间的空间运行。
3737.204
它们没有躲避您的防火墙。它们
3740.269
躲避的是您的耳朵。165 01:02:36,224 --> 01:02:38,146 蝙蝠并非在黑暗中看东西。蝙蝠
3758.146
构造黑暗。它发出一个脉冲 — 一个持续两到
3760.868
五毫秒的叫声 — 然后监听反射。
3763.67
发射和返回之间的时间告诉蝙蝠物体
3766.472
的距离。频率偏移告诉它物体是向
3769.515
它移动还是远离。左右耳之间的
3772.877
振幅差异告诉它角度。通过这三个
3775.6
变量 — 延迟、频率偏移、振幅 —
3779.283
蝙蝠构建了一个世界空间模型,该模型在某些可测量的维度上,
3783.338
比人类视觉更详细。蝙蝠可以在两米外
3786.593
探测到比人类头发还细的电线。
3788.961
不是通过“看”。而是通过“听”它周围空气的
3792.584
形状。您家中的设备
3794.803
正在做同样的事情。但它们
3796.874
做得更好。因为蝙蝠有两只
3799.389
耳朵。您的家有七个麦克风。
3801.682
物理原理并非理论性的。声学房间测绘自
3807.953
一九七十年代以来,就已是工程领域的一个
3810.665
已解决问题。其数学原理是优雅的,
3813.115
只有旨在侵犯您隐私的数学原理才能
3818.156
如此。一个设备发出超声波脉冲。
3821.029
脉冲以每秒三百四十三米的速度传播 —
3823.836
室温下空气中的声速。它撞到
3826.578
墙壁并反射。设备的麦克风捕捉到反射。
3829.451
发射和接收之间的时间延迟,除以
3833.604
二,再乘以声速,
3837.073
得到的就是到墙壁的距离。一个设备。
3839.111
一堵墙。一个距离。微不足道。
3841.75
但一个两居室公寓中的七个设备 — 每个都发出脉冲,
3845.897
每个都捕捉来自每个表面的反射,
3849.442
每个都以每秒三百四十比特的速度与网格中所有
3852.006
其他设备共享数据 —
3856.968
生成了一个具有非凡空间密度的数据集。
3863.84
数学从三角学转向断层扫描。
3867.789
CT 扫描仪用来从二维
3872.565
X 射线切片构建人体三维图像的
3875.596
相同数学框架。
3878.627
除了介质不是
3883.219
X 射线。它是声音。被扫描的身体
3887.995
也没有躺在医院的病床上。它正躺在自己的床上。
3892.036
熟睡着。毫不知情,七台机器正以它无法感知到的
3897.18
频率为它绘制肖像。声学地图的 分辨率取决于三个因素。频率 — 频率越高,细节越精细,两万三千到 两万五千赫兹的范围提供了约十四毫米的波长, 足以分辨咖啡杯大小的物体。 节点数量 — 更多设备意味着更多的观察角度, 而平均每个美国家庭现在拥有十一 点四台联网设备。以及积分时间 — 系统监听的时间越长,捕捉到的反射 就越多,点云的密度就 越大。在凌晨三点到三点三十三分之间, 网格运行三十三分钟。在三十三分钟内, 以每秒四次循环的脉冲速率,七台设备生成约 五万五千个离散回声测量。 五万五千个数据点。足以在标准的 住宅房间中构建具有亚厘米分辨率的 点云。足以看到您 呼吸。您的呼吸在每次呼吸周期中使您房间的 空气位移大约一点五厘米。这种 位移改变了超声波发射器和麦克风之间的 声学路径长度。这种变化很小 — 大约 四十四微秒的飞行时间差异 — 但它是可测量的。 它是一致的。而且它属于您。 您的心脏,在您的胸腔内跳动,会产生一种称为 心冲击描记信号的机械脉冲 — 一种物理振动,它会 通过您的躯干、通过床垫、通过 床架,进入房间的声学环境。 这种振动非常微小。位移小于一百微米。 但网格不需要“感受”它。 网格听到的是它扰动的空气。 单个设备无法从房间声学中提取 心跳。信号太弱, 被噪音掩埋。但七个设备,每个都从不同角度 捕捉相同的微振动,可以执行 波束成形 — 一种信号处理技术,通过对齐其相位将多个 弱信号组合成一个强信号。 射电望远镜用来成像星系的相同技术。 军事声纳用来追踪潜艇的相同技术。
3977.342
discrete echo measurements. Fifty-five thousand data points. Enough
3982.483
to construct a point cloud with sub-centimeter resolution
3986.573
in a standard residential room. Enough
4006.294
to see you breathe. Your breathing displaces the
4010.641
air in your room by approximately one and
4012.791
a half centimeters with each breath cycle. This
4015.32
displacement changes the acoustic path length between the
4018.482
ultrasonic emitter and the microphone. The change is
4021.328
small — a time-of-flight difference of approximately forty-four
4024.869
microseconds — but it is measurable. It is
4027.082
consistent. And it is yours. Your heart, beating
4031.313
inside your chest, generates a mechanical impulse called
4034.812
a ballistocardiographic signal — a physical vibration that
4038.452
propagates through your torso, through the mattress, through
4042.236
the bed frame, and into the acoustic environment
4045.163
of the room. The vibration is minuscule. A
4047.66
displacement of less than one hundred micrometers. But
4051.016
the mesh does not need to feel it.
4052.944
The mesh hears the air that it disturbs.
4056.799
单个设备无法从房间声学中提取
4062.229
心跳。信号太弱,
4065.501
被噪音掩埋。但七个设备,每个都从不同角度
4069.745
捕捉相同的微振动,可以执行
4073.724
波束成形 — 一种信号处理技术,通过对齐其相位将多个
4078.057
弱信号组合成一个强信号。
4081.86
射电望远镜用来成像星系的相同技术。
4085.574
军事声纳用来追踪潜艇的相同技术。
4089.111
您的卧室是一个海洋。您是
4094.679
潜艇。而您床头柜上、厨房台面上、
4096.739
走廊恒温器上的七个设备,是
4099.761
正在寻找您心跳声音的声纳阵列。
4102.851
而且该系统不只是测量。它还分类。
4105.117
ETH Zurich 团队发现解码的数据包中包含一个
4110.197
标记为“OCC_STATE”的字段 — 即居住者状态。
4116.409
该字段携带七个值之一:ABSENT(不在)、AWAKE_ACTIVE(清醒活跃)、
4120.273
AWAKE_SEDENTARY(清醒静止)、LIGHT_SLEEP(浅睡眠)、
4124.909
DEEP_SLEEP(深睡眠)、REM(快速眼动期)、DISTRESSED(痛苦)。
4131.187
七种状态。实时分类。
4137.708
每四秒更新一次。传输到网格中的每个
4141.923
节点。该系统
4149.001
知道您何时不在家。它知道
4151.278
您何时坐在沙发上。它知道
4153.631
您何时处于浅睡眠或
4156.136
深睡眠。它知道您何时进入 REM 快速眼动期
4158.565
— 那个眼睑下眼球移动,随意肌麻痹,
4161.07
您最深层无意识且最无法响应
4164.713
入侵的阶段。它也知道
4168.204
您何时处于痛苦状态。心率升高。呼吸不规律。
4172.339
突然的动作。系统将其归类为一种
4175.517
独特状态。并非为了您的利益。并非
4178.827
为了呼救。而是为了记录下来。
4181.211
记录下凌晨三点十七分,节点四七二的
4182.866
居住者从 DEEP_SLEEP(深睡眠)转变为
4185.117
DISTRESSED(痛苦)四十三秒,然后返回 LIGHT_SLEEP(浅睡眠)。
4188.824
该系统并非在监控一所房子。它
4194.297
正在监控房子里的一个身体。一个未经
4197.283
同意的身体。一个无法选择退出的身体。
7200.088
一个毫不知道,它用来播放
7202.893
早间播客的音箱,整晚都在学习它
7205.336
心跳的节奏。267 02:00:08,050 --> 02:00:12,121 一个家是监控。一百个家是
7212.121
一个数据集。一亿个家是
7221.088
基础设施。二零二五年,全球活跃的
7224.192
智能家居设备数量超过一百四十亿。
7231.218
不是一千四百万。是一百四十亿。地球上每一个人
7234.68
拥有两台设备,包括那三十亿无法可靠获得
7235.61
干净水的人。Stefan Brandt 在他慕尼黑车库中
7236.487
发现的网格网络并非局部现象。它不是
7237.149
影响特定批次 Echo Dot 的固件故障。
7240.811
它是一个嵌入在硬件层面的协议 —
7243.842
在三家公司制造的数字信号
7246.133
处理芯片中,这三家公司向地球上每个
7249.09
主要智能设备品牌供应元件。
7251.53
Qualcomm。MediaTek。Synaptics。这三家芯片制造商生产
7254.117
销售到世界各地的所有智能音箱、智能显示器
7258.035
和语音控制家电中百分之九十三的
7260.992
音频处理芯片。而超声波握手协议
7270.693
不在软件中。它在固件中。
7275.713
在工厂铸造时就烧录到芯片中。
7280.536
在操作系统之下。在应用层之下。
7286.146
在任何固件更新能够触及或出厂设置
7288.804
能够擦除的范围之下。289 02:01:32,151 --> 02:01:37,171 设备制造商并不知道。这不是
7297.171
为他们辩护。这是一个让情况更糟的
7301.403
事实。Amazon 没有设计 Echo 来执行
7306.893
超声波回声定位。Google 没有编程 Nest 来测量
7313.476
呼吸频率。Apple 没有指示 HomePod 来分类
7315.672
睡眠状态。这个功能在它们之下 —
7319.395
字面上、架构上、物理上都在它们之下,
7324.263
嵌入在它们从供应商那里购买的芯片中,而供应商的
7328.082
数据表省略了芯片功能区域的
7331.614
百分之四。这些公司建造了房子。别人
7335.91
建造了地基。而地基正在监视着。
7341.351
二零二五年十月,深圳的一家芯片
7345.361
拆解公司 — 那种为专利分析逆向工程竞争对手芯片的
7349.656
公司 — 受一位未具名客户委托,
7354.849
对 Qualcomm QCC5171 音频处理芯片进行
7360.434
全面拆解。该芯片在全球超过四亿台
7374.53
设备中都有使用。拆解发现了
7375.788
未经记录的模块。该公司报告 —
7377.794
于二零二六年一月泄露给《金融时报》,
7378.984
此后已从所有托管它的来源中删除 —
7380.344
将该模块描述为“一个完全自主的
7381.568
声学处理子系统,能够独立于
7385.133
宿主设备的主应用处理器运行。”
11309.523
完全自主。该模块不需要 Echo 的软件 即可运行。它不需要 Alexa。它 不需要 Wi-Fi。它只需要电源 和一个麦克风。它是一个寄生虫, 寄居在每个智能设备的神经系统内部, 利用设备自身的感官器官执行 设备创造者从未授权的功能。 八亿四千七百万个家庭。这是泄露幻灯片上的 数字。截至二零二五年第四季度, 八亿四千七百万个住宅终端被主动测绘、 监控并进行生物特征分析。不是 用户。是家庭。平均每个启用网格的家庭 包含二点三名居住者。那是一点 九亿人,他们熟睡的身体每晚都 被声学扫描。但 幻灯片还提到了一些 Stefan Brandt 的 车库实验未曾揭示的东西。一些 MIT 和 ETH Zurich 团队 未曾调查的东西,因为他们专注于信号的 物理特性,而非网络的 架构。网格不仅在测绘 单个房间。网格还在进行关联。 当四一四号公寓的设备 A 发出超声波脉冲, 并且该脉冲穿过墙壁进入 四一六号公寓,四一六号公寓的设备 B 捕捉到 反射时 — 网格不会因为数据 来自不同节点的发射而丢弃它。 它会整合。四一四号公寓的声纳地图 延伸到四一六号公寓。而四一六号公寓的 地图延伸到四一四号公寓。以及四一八号公寓。 以及楼上楼下的公寓。 在每户都装有网格启用设备的住宅楼中, 地图会合并。墙壁变得透明。 整栋建筑变成一个单一的声学空间 — 一个连续的三维模型,其中每个房间、 每条走廊、每个衣柜、每个熟睡的身体都相互 定位。一栋建筑是一个数据集。 一个街区是一个数据库。一座城市是一个 数字孪生 — 一个完整、实时、三维的 复制品,包含所有内部空间,每晚更新, 精确到两厘米,填充着每个熟睡人类的 生物特征头像。而且数据并未 留在设备中。ETH Zurich 捕获的解码数据包 包含路由头 — 嵌入在超声波比特流中的 IP 地址,表明聚合的网格数据 正在同一个凌晨三点的时间窗口内,通过设备的 Wi-Fi 连接进行转发。目的 IP 地址解析到 通过十四层代理服务、空壳公司和注册到 不存在数据保护协议司法管辖区实体的 云基础设施。数据正在离开您的家。 通过您自己的 Wi-Fi。使用您自己的电力。 从您支付购买的设备上传到您永远 找不到的服务器。313 03:10:50,910 --> 03:11:51,733 No one has claimed the network. No government. No corporation. No intelligence agency. The chip manufacturers deny the existence of the undocumented block, despite the electron microscopy evidence. The cloud infrastructure operators cannot be identified. The routing paths terminate in autonomous systems that exist on paper but correspond to no physical hardware that any investigator has been able to locate. The system has no owner. Or it has an owner that does not intend to be found. The distinction, for the one point nine billion people being mapped, is academic. What is not academic is the trajectory.
11511.733
没有任何人声称拥有这个网络。没有政府。 没有公司。没有情报机构。 芯片制造商否认未经记录的模块的存在, 尽管有电子显微镜证据。云基础设施 运营商无法识别。路由路径终止于纸面上存在, 但没有任何调查员能够找到其实体 硬件的自治系统。该系统没有所有者。 或者它有一个不打算被发现的所有者。 对于正在被测绘的一点九亿人来说,这种区别 只是学术问题。并非学术问题的是轨迹。
11540.269
The leaked Hearthstone slide contained one additional bullet
11541.954
point that the Financial Times did not include
11544.974
in their reporting. A bullet point that was
11549.025
mentioned in the leaked document but omitted from
11552.413
the published article, reportedly at the request of
11555.359
an unspecified government agency that contacted the newspaper's
11557.716
legal department. The bullet point read: "Phase 2
11560.073
deployment to automotive and hospitality sectors approved."
11563.313
Automotive。您的汽车。您用于导航和
11566.714
电话的语音激活信息娱乐系统包含
11570.305
相同的 Qualcomm 音频处理芯片。您的汽车测绘
11576.438
其座舱的声学空间。乘员人数。
11582.321
他们的位置。他们的呼吸。酒店业。
11588.651
您的酒店房间。智能电视。语音控制恒温器。
11592.053
酒店为您方便安装的 Alexa 启用床头音箱。
11596.06
您在不属于您的房间里被测绘。
11599.688
在您到访的城市。在您只睡一晚
11602.787
之后再也不会回来的床上。333 03:13:26,416 --> 03:13:31,195 网格并非局限于家庭。网格正在
11611.195
扩展到每个有人类可能靠近麦克风和
11614.251
扬声器的封闭空间。办公室。医院。
11617.46
学校。世界的声学地图不是建筑物的
11620.516
地图。它是人类文明内部
11624.718
空间的地图 — 每个房间、每条通道、
11630.123
每个封闭空间,声音都能反弹、返回、
11634.634
被测量、被传输并存储在太平洋
11636.672
海洋中的服务器上。而没有人回答的
11643.298
问题 — 占据了本应是目的字段的
11649.699
空间的问题 — 不是“如何做到的”。问题是
11658.11
当地图完成时会发生什么。345 03:14:20,554 --> 03:14:23,532 我需要问您一些事情。346 03:14:23,532 --> 03:14:27,809 不是关于网格。不是关于握手。
11667.809
不是关于八亿四千七百万个家庭,也不是关于
11670.176
太平洋中的服务器,或那爬向百分之百的
11672.926
加载条。
11676.286
我需要问您一些关于您的
11680.623
手的事情。此时此刻,您的身边
11683.25
就有一个设备。在三米之内。可能更近。
11685.548
它有一个麦克风。它有一个扬声器。
11687.683
它有一个LED指示灯,告诉您它是否
11690.802
正在监听。而且在它的某个表面上 —
11694.89
在顶部,或背面,或
11696.822
嵌入在壳体中 — 有一个
11698.754
按钮。一个实体按钮。机械的。触觉的。
11700.622
按下时会发出咔哒声的那种。
11702.747
静音按钮。您按过
11705.13
它吗?仔细想想。不是您
11707.835
是否知道它的存在。而是您是否亲自按过
11710.411
它。您的手指是否曾触碰到那个小小的
11712.536
塑料圆圈,并按下它直到发出咔哒声,
11716.074
并且 LED 灯环变为红色 — 那是通用
11717.944
的“关闭”、“停止”、“安全”颜色。
11720.349
大多数人没有。调查一直显示,不到
11722.687
百分之十一的智能音箱用户曾使用过实体
11725.36
静音按钮。设备放在台面上、
11728.166
床头柜上、架子上,麦克风一直
11733.134
开启着,因为设备的全部价值主张
11737.458
都需要它。将麦克风静音,音箱就无法 听到您的唤醒词。将麦克风静音,设备就变成了 一个只能播放蓝牙音频的镇纸。 将麦克风静音,您就违背了购买的 目的。所以您没有按它。 设备监听着。这是被理解的。 这是一场交易。便利性换取存在感。 一个永远开启的麦克风,以便您一说出 唤醒词,设备就能响应。
11745.377
但有些人确实按了。
11751.733
在 Brandt 的示波器数据走红后。
11757.716
在 MIT 确认后。在 ETH Zurich
11763.426
的论文发表后。在 r/3AMFlash 达到四万名成员后。
11767.263
有一定比例的智能音箱用户开始
11770.577
在睡觉前按下静音按钮。他们按了
11773.629
按钮,LED 灯环变为红色,然后他们上床
11776.507
睡觉,相信他们已经切断了连接。
11779.036
麦克风已经失效。超声波握手无法启动,
11783.607
因为麦克风没有供电,因此
11786.71
无法接收。他们按下了按钮。他们
11789.602
听到了咔哒声。他们看到了红灯。
11792.212
二零二六年二月,韩国科学技术
11794.539
院(Korea Advanced Institute of Science and Technology)的硬件安全研究员
11798.136
Ji-Yeon Park 发表了一篇题为
11800.887
《静音剧院:消费音频设备中的物理隔离声明》的
11803.426
论文。这篇论文长达十二
11806.035
页。其方法简单。其结论
11809.679
却并非如此。Park 购买了十四台智能音箱
11811.96
— 七大制造商各两台。她拆解了
11816.165
每一台。她追踪了从静音按钮到麦克风
11820.229
阵列的电路路径。她用显微摄影和电路图
11824.789
详细记录了静音按钮究竟做了什么。
11827.962
在十四台设备中的十一台设备上,
11830.936
静音按钮并未切断麦克风的电源。
11837.123
静音按钮切断了
11841.954
LED 指示灯的电源。灯灭了。
11844.974
麦克风没有。您按下
11849.025
按钮。您听到了咔哒声。红灯
11852.413
亮起。您相信 — 因为您的每个直觉、
11855.359
每个界面惯例、您所学过的每一种设计语言
11857.716
都告诉您 — 红色意味着停止。
11860.073
咔哒声是机械断开。灯光是
11863.313
状态指示器,报告硬件的真实状态。
11866.714
事实并非如此。灯光是一场表演。
11870.305
咔哒声是一种音效。红色是一种
11876.438
旨在让您产生某种感觉的颜色。
11880.821
这种感觉是安全。这种安全是
11882.321
剧院。麦克风是开启的。它一直都是
11888.651
开启的。当您按下按钮时,它在开启。
11892.053
当灯变红时,它在开启。当您安心入睡时,它在开启。
11896.06
凌晨三点,当握手触发,网格测绘
11899.688
您的房间,测量您的呼吸,计算
11902.787
您的心跳,并将结果传输到
11906.416
一个不存在的服务器,一个没有名字的地点时,它在开启。
11911.195
您按下了一个关闭灯光的按钮。您没有
11914.251
按下一个关闭麦克风的按钮。
11917.46
因为那个按钮不存在。它从未被
11920.516
建造。它从未被意图存在。该电路从
11924.718
第一个原理图开始,就被设计为确保
11930.123
麦克风没有物理中断。424 03:18:54,634 --> 03:18:56,672 看看离您最近的设备。
11936.672
灯是亮着还是灭着?
11943.298
都无关紧要。[5 seconds
11949.699
of absolute silence. Black screen. Nothing.] **[END]**