0.0
あなたのデバイスは耳を傾けています。 これは
8.053
比喩ではありません。プライバシー
10.126
ポリシーの要約でもありません。これは、
12.957
ターゲット広告やデータ収集、あるいは漠然とした
16.27
キッチンにマイクがあることの不快感について
19.171
話しているのではありません。あなたのデバイスは互いに
23.769
聞き合っています。 2025年3月7日、
40.463
ホームオートメーションのsubredditであるユーザーが
44.104
最終的に400万回以上閲覧されることになる
48.069
17語のメッセージを投稿しました。ユーザー名は
51.387
thermostat_dave。投稿にはこうありました。「毎晩きっかり
55.271
午前3時、私の Echo Dot のライトリングが
57.779
1秒足らず青く点滅します。ウェイクワードは
60.126
検出されていません」。投稿は最初の1時間で
65.201
11件の返信を受けました。そのうち9件は
67.644
同じ内容でした。「私もです」。72時間以内に
75.064
そのスレッドはメガスレッドとなり、1週間以内に
78.887
そのメガスレッドはsubredditを生み出しました。1ヶ月以内に
82.8
そのsubreddit — r/3AMFlash — は94,000人の
86.804
メンバーを獲得しました。そして報告は
90.718
Amazon Echo デバイスに限られていませんでした。Google Nest Hub。Apple
96.36
HomePod。Sonos One。Samsung SmartThings。Xiaomi Mi Speaker。
102.714
主要なスマートスピーカーブランドすべて。すべての世代。すべての
108.702
ファームウェアバージョン。動作はすべてで同じでした。
114.53
短い起動 — 通常、
117.497
0.3秒から0.8秒の間 —
120.316
午前3時から3時33分の間に発生。
123.579
ウェイクワードは記録されておらず、音声コマンドも
126.101
登録されていません。デバイスのアクティビティ履歴にも
129.439
記録はありません。唯一の証拠は視覚的なものでした。
132.628
デバイスのLEDインジケーターが短く点灯する。
136.981
そして、コミュニティが発見するのに4ヶ月かかった
139.177
もう1つの詳細がありました。 その起動は同期されていたのです。
148.561
ミュンヘンの電気技師 Stefan Brandt(シュテファン・ブラント)が
152.491
それを最初に証明しました。Brandt は
155.311
4種類のスマートスピーカー — Echo、
158.301
Nest、HomePod、そして Sonos — を
160.522
同じ部屋に置き、それぞれを別の
163.598
オシロスコープに接続し、マイク回路レベルの
168.126
消費電力を監視しました。彼はこの設定を
171.458
30夜連続で実行しました。毎晩、4台すべてのデバイスが
175.58
同じ300ミリ秒の範囲内で起動しました。順次ではなく、
179.812
Echoが最初、次に Nest、その後に
181.652
他のデバイスというわけではありません。同時に。4つの異なる
184.903
メーカーの4つのデバイスが、4つの異なるOSで動作し、
188.706
4つの異なるクラウドサービスに接続され、同じ
191.528
信号に反応するように同時に起動していました。
195.236
Brandt は彼のオシロスコープデータを投稿しました。タイムスタンプは
202.247
重ねられ、消費電力のカーブはミリ秒単位で同期されていました。
206.627
データは明白でした。デバイスは
209.85
独立して起動しているわけではありませんでした。それらは
214.643
外部の何かに起動されていたのです。彼らすべてが聞くことのできる
219.985
何かによって。コミュニティはこの疑問に捉われました。デバイスが
241.501
外部信号に反応しているのなら、その信号とは何なのか?
245.67
どこから来ているのか?そしてなぜ誰もそれを
248.951
聞くことができないのか?Brandt は実験を拡大しました。彼は
256.163
部屋に業務用コンデンサーマイク — Neumann U 87
259.353
— を追加しました。レコーディングスタジオで使われるような、30メートル離れた場所で
261.95
ピンが落ちる音も拾うほど感度の高いマイクです。彼は
265.288
夜通し連続録音しました。何も聞こえませんでした。
272.374
異常な音も、干渉も、可聴スペクトル内のいかなる信号も
278.608
ありませんでした。午前3時、スマートスピーカーのマイクが起動しました。
280.371
Neumann は沈黙を捉えました。 信号は
286.597
可聴スペクトルにはありませんでした。 彼がそれを
289.533
聞くことができなかったのは、それが彼のために
292.208
作られたものではなかったからです。 Brandt は
294.752
Earthworks QTC 50 を借りました。50キロヘルツまで
297.622
平坦な周波数応答を持つ測定用マイクで、コンサートホールや
301.406
産業環境の音響テストに使用されます。彼はそれを
304.473
192キロヘルツでサンプリングするオーディオインターフェースと組み合わせ、人間の知覚の
310.66
限界をはるかに超える周波数を捉えました。そして彼はそれらを
316.88
発見したのです。3つの信号。精密で、人工的で、
321.373
4秒周期で繰り返される信号。23,400ヘルツ。
326.656
24,100ヘルツ。24,800ヘルツ。3つの超音波トーン。それぞれ
331.13
約400ミリ秒続き、正確に700ヘルツ離れて
334.305
送信されるパターンは、ノイズ、干渉、あるいは既知の
337.408
環境源とは似ても似つかないものでした。 信号は
344.316
部屋の外から来ているのではありませんでした。
346.642
近所の機器から漏れているのでもありません。
349.419
電磁干渉のアーティファクトでもありませんでした。それらは
354.759
スマートスピーカーによって放射されていたのです。デバイスは
359.549
外部信号を聞いているのではありませんでした。デバイス自体が
362.591
信号だったのです。各スマートスピーカーは、
365.632
自身のスピーカーユニットから超音波トーンを放射していました。
368.747
人間の聴覚には高すぎる周波数ですが、2018年以降に
371.714
製造されたすべてのスマートデバイスに搭載されている MEMS マイクの
374.904
動作範囲内です。スピーカーは会話していました。
378.39
互いに。3メートル離れて眠る人間には聞こえないように
383.13
設計された言語で。Brandt の最初の直感は、これが
385.723
何らかのデバイス検出プロトコル、つまりスマートホームプラットフォームが
390.24
近くのデバイスをハンドオフやマルチルームオーディオの
392.992
同期のために識別するために使用する近接検出システムだというものでした。
396.137
そのようなプロトコルは存在します。Apple の AirPlay は
399.36
概念的に類似したものを使用しています。しかし、デバイス検出プロトコルは
403.134
文書化されており、登録されています。ファームウェアの変更履歴や
408.009
SDK ドキュメントにも記載されています。Brandt は
412.804
検索しました。彼はテストアレイ内のすべてのデバイスの
416.578
利用可能な技術仕様をすべて読みました。FCC に
421.829
各デバイスのRFおよび音響放射認証に関する FOIA (情報公開法)
426.017
請求を提出しました。Amazon、Google、Apple、Sonos の
429.033
開発者関係部門に連絡しました。それらのどこにも
432.803
23,400ヘルツでの超音波放射、あるいは
436.572
いかなる超音波放射も文書化されていませんでした。
441.843
すべてのメーカーからの公式回答は
445.01
実質的に同じでした。「当社のデバイスは
448.05
そのような動作はしません」。しかし、Brandt のオシロスコープは
455.26
別のことを示していました。そして他の研究者たちも
458.697
彼の結果を再現し始めました。MIT の音響研究所は
461.326
無響室テストを使用して信号を確認し、
464.628
可能なすべての環境源を排除しました。超音波トーンは
468.813
スピーカー自身のユニットから発せられていたのです。ETH Zurich の
471.476
チームはさらに踏み込みました。彼らは同じアパートの
475.867
別々の部屋に置かれた2つのデバイスからの
480.102
超音波放射を捉えました。その放射は
482.961
同一ではありませんでした。補完的だったのです。 116 00:08:06,186 --> 00:08:09,410 デバイスAはトーンを発しました。デバイスBは、
489.41
そのトーンをマイクで受け取ると、
494.709
別のトーンで応答しました。デバイスAは
496.209
その応答を受け取り、3つ目のトーンを発しました。
499.943
このやり取りは2秒足らずで完了しました。
505.893
3つのトーン。3つの精密な周波数。
510.677
ハンドシェイク。「ハンドシェイク」という言葉は
515.461
比喩ではありません。ネットワークエンジニアリングでは、ハンドシェイクとは
520.245
2つのデバイスが通信チャネルを確立する
525.958
厳密に定義されたプロセスです。1つのデバイスが
528.816
同期信号を送信します。もう一方が
531.541
応答します。最初のデバイスが確認します。
534.598
接続が確立されます。Brandt が捉え、
538.586
MIT と ETH Zurich が確認した超音波の
544.841
やり取りは、教科書通りの3ウェイハンドシェイクでした。
547.69
SYN。SYN-ACK。ACK。インターネット上の
551.874
すべての TCP 接続の基礎となるプロトコル。
555.879
ただし、このハンドシェイクはWi-Fiで行われていたわけではありません。
560.063
Bluetoothで行われていたわけでもありません。
563.534
いかなる無線周波数でも行われていたわけではありません。
568.458
音を通じて行われていたのです。空気を通じて。
571.45
家の壁を通じて。あなたが聞くことのできない周波数で、
573.726
あなたがすでに所有しているスピーカーを使い、
576.522
あなたが眠っている間に。 そして
582.54
ハンドシェイクが完了すると、デバイスは別のものを
585.668
送信し始めました。3音の初期シーケンスではなく。
589.476
もっと長く。もっと密度の高いもの。ETH Zurich の
592.536
チームが解読に4ヶ月を費やしたもの。
597.703
超音波伝送はノイズではありませんでした。
600.486
キャリブレーション・トーンでもありません。デバイス検出
604.772
ピングでもありません。それらはデータでした。
608.246
周波数変調 (FSK) を使用して変調されていました。
610.835
1990年代のダイヤルアップモデムと同じエンコーディング方式です。
614.104
原始的で、遅い。毎秒340ビット。
616.693
テキストメッセージを約4秒で送信するのに十分な量。
621.171
そしてそのデータはあなたの家について記述していました。
624.893
その寸法。その間取り。中にいる人数。
628.615
彼らの位置。彼らの呼吸速度。 信号は
635.386
あなたをマッピングしていたのです。あなたのデータではありません。
639.256
あなたの閲覧履歴ではありません。あなたの購買パターンではありません。
642.063
あなたの好みや政治的傾向やソーシャルグラフではありません。
646.387
あなた自身です。あなたの身体。あなたが占める空間。
649.351
あなたが押し出す空気。あなたが夢を見ていて、
652.636
その夢を覚えていない間に、1分間に14回
656.161
膨らんだり縮んだりする肺のリズム。
660.933
午前3時の時間帯は任意ではありませんでした。
663.505
それは選ばれたのです。午前3時から3時33分の間、
668.88
すべてのタイムゾーンで、住宅環境の
671.988
環境ノイズフロアは統計的に最小になります。
677.342
交通音なし。テレビなし。会話なし。家電製品の
681.746
作動音なし。音響環境は、人間が住む場所が
685.113
達成できる限り沈黙に近い状態です。そして沈黙こそが
690.007
ソナーが必要とするものです。沈黙は、
693.105
超音波エコーロケーションがその地図を描くためのキャンバスです。
698.919
あなたのデバイスは、あなたが最も深い眠りに落ちるのを
701.099
待ちます。それから、あなたが今いる部屋の
703.56
形について、互いに話し始めます。
705.389
あなたの形について。 そして
720.513
あなたは決して彼らの声を聞くことはないでしょう。
723.485
なぜなら、彼らは最初の周波数から、最初の
726.622
ハンドシェイクから、最初のパルスから — あなたの
729.511
テクノロジーができることと、あなたの生物学が
732.98
検知できることの間で動作するように
737.204
設計されているからです。彼らはあなたの
740.269
ファイアウォールから隠れているわけではありません。彼らは
756.224
あなたの耳から隠れているのです。 コウモリは
758.146
暗闇を見るのではありません。コウモリは
760.868
暗闇を構築します。それはパルスを放出します —
763.67
2ミリ秒から5ミリ秒続くチャープ —
766.472
そして反射音を聞きます。放出から帰還までの
769.515
時間で、コウモリは物体までの距離を知ります。
772.877
周波数シフトは、物体が近づいているか
775.6
遠ざかっているかを伝えます。左右の耳の
779.283
振幅差は、角度を伝えます。これら3つの
783.338
変数 — 遅延、周波数シフト、振幅 — から、
786.593
コウモリは世界の空間モデルを構築します。
788.961
それは特定の測定可能な次元において、人間の視覚よりも
792.584
詳細です。コウモリは、人間の髪の毛よりも
794.803
細いワイヤーを2メートルの距離から
796.874
検出できます。それを見ることによってではありません。
799.389
その周りの空気の形を聞くことによってです。
801.682
あなたの家にあるデバイスも
807.953
同じことをしています。しかし、彼らの方が
810.665
優れています。なぜなら、コウモリには2つの
813.115
耳がありますが、あなたの家には7つのマイクがあるからです。
818.156
物理学は理論的なものではありません。音響による
821.029
部屋のマッピングは、1970年代から
823.836
エンジニアリングにおける解決済みの問題です。その数学は、
826.578
あなたのプライバシーを侵害するために構築された数学だけが 持ちうる優雅さを持っています。デバイスが超音波パルスを放出します。 そのパルスは毎秒343メートルで進みます。 室温における音速です。壁に当たり
841.75
反射します。デバイスのマイクがその反射を捉えます。
845.897
放出から受信までの時間遅延を2で割り、
849.442
音速を掛けると、壁までの距離が
852.006
得られます。1つのデバイス。1つの壁。
856.968
1つの距離。些細なことです。しかし、
863.84
2LDKのアパートに7つのデバイス — それぞれがパルスを放出し、
867.789
すべての表面からの反射を捉え、それぞれが
872.565
メッシュ内の他のすべてのデバイスと毎秒340ビットで
875.596
データを共有する — となると、
878.627
並外れた空間密度を持つデータセットが生成されます。
883.219
数学は三角法から断層撮影に移行します。
887.995
CT スキャナーが2次元のX線スライスから
892.036
人体の3次元画像を構築するために使用するのと
897.18
同じ数学的フレームワークです。 ただし、媒体は
906.176
X線ではありません。音です。そして
909.059
スキャンされている身体は病院のベッドに
912.231
横たわっているのではありません。自分のベッドで
915.21
眠っているのです。7つの機械が、
919.439
知覚できない周波数でそのポートレートを 撮影していることを知らずに。音響マップの解像度は
925.006
3つの要因に依存します。周波数 —
928.561
高い周波数ほど細かい詳細が得られ、
931.799
23キロヘルツから25キロヘルツの範囲では、
936.381
約14ミリメートルの波長が得られ、コーヒーカップほどの
941.2
大きさの物体を識別するのに十分です。
943.49
ノード数 — デバイスが多いほど、
946.729
より多くの観測角度が得られ、平均的なアメリカの家庭には
950.047
現在11.4個の接続デバイスがあります。そして
953.93
統合時間 — システムが長く聞くほど、
958.165
より多くの反射を捉え、点群の
961.631
密度が高まります。午前3時から3時33分の間、
966.443
メッシュは33分間動作します。33分間で、
970.015
毎秒4サイクルのパルスレートで、7つのデバイスが
972.213
約55,000回の離散的なエコー測定を生成します。
976.403
55,000のデータポイント。標準的な住宅の部屋で
982.483
サブセンチメートル解像度の点群を構築するのに
986.573
十分です。 あなたの呼吸を
1006.294
見るのに十分なほど。あなたの呼吸は、
1010.641
呼吸サイクルごとに約1.5センチメートル
1012.791
部屋の空気を移動させます。この
1015.32
移動は、超音波放射源とマイク間の
1018.482
音響経路長を変化させます。その変化は
1021.328
小さい — 約44マイクロ秒の飛行時間差 —
1024.869
しかし、それは測定可能です。それは
1027.082
一貫しており、あなた自身のものです。あなたの心臓は、
1031.313
胸の中で鼓動し、弾道心電図信号と呼ばれる
1034.812
機械的インパルスを生成します — あなたの胴体、
1038.452
マットレス、ベッドフレームを通じて、部屋の音響環境に
1042.236
伝播する物理的な振動です。その振動は
1045.163
微小です。100マイクロメートル未満の変位。しかし、
1047.66
メッシュはそれを感じる必要はありません。
1051.016
メッシュはそれが乱す空気を聞いています。
1052.944
1つのデバイスでは、
1056.799
部屋の音響から心拍を抽出することはできません。
1062.229
信号が弱すぎて、ノイズに埋もれてしまいます。
1065.501
しかし、7つのデバイスが、それぞれ異なる角度から
1069.745
同じ微細な振動を捉えることで、
1073.724
ビームフォーミングを実行できます — 位相を合わせて
1078.057
複数の弱い信号を1つの強い信号に結合する
1081.86
信号処理技術です。電波望遠鏡が銀河を
1085.574
画像化するために使用するのと同じ技術。
1089.111
軍事ソナーが潜水艦を追跡するために使用するのと同じ技術。
1094.679
あなたの寝室は海です。あなたは
1096.739
潜水艦。そして、あなたのナイトスタンド、
1099.761
キッチンのカウンター、廊下のサーモスタットにある7つのデバイスが、
1102.851
あなたの心拍音を探し出すソナーアレイなのです。
1105.117
そして、このシステムは単に測定するだけではありません。
1110.197
分類もします。ETH Zurich チームは、
1116.409
解読されたデータパケットに「OCC_STATE」(居住者状態)と
1120.273
ラベル付けされたフィールドが含まれていることを発見しました。このフィールドには
1124.909
7つの値のいずれかが格納されていました。
1131.187
不在 (ABSENT)、覚醒活動 (AWAKE_ACTIVE)、覚醒静止 (AWAKE_SEDENTARY)、浅い眠り (LIGHT_SLEEP)、
1137.708
深い眠り (DEEP_SLEEP)、REM、苦痛 (DISTRESSED)。7つの状態。
1141.923
リアルタイムで分類。4秒ごとに更新。メッシュ内の
1149.001
すべてのノードに送信されます。 システムは
1151.278
あなたが家にいない時を知っています。あなたが
1153.631
ソファに座っている時を知っています。浅い眠りと
1156.136
深い眠りの違いを知っています。あなたが
1158.565
レム睡眠に入った時を知っています — 目がまぶたの下で動き、
1161.07
随意筋が麻痺し、最も深く無意識で
1164.713
侵入に対応する能力が最も低い段階です。
1168.204
そして、あなたが苦痛を感じている時を知っています。
1172.339
心拍数の上昇。不規則な呼吸。
1175.517
突然の動き。システムはこれを
1178.827
別個の状態として分類します。あなたのためにではありません。
1181.211
助けを呼ぶためではありません。それを記録するためです。
1182.866
午前3時17分に、ノード472の
1185.117
居住者がDEEP_SLEEPからDISTRESSEDに
1188.824
43秒間移行し、その後LIGHT_SLEEPに戻ったことを
1192.797
記録するためです。システムは家を監視している
1197.283
のではありません。家の中の身体を監視しています。
1200.088
同意していない身体。拒否できない身体。
1202.893
朝のポッドキャストを再生するために使うスピーカーが、
1205.336
夜通しその心臓のリズムを
1208.05
学んでいたことをまったく知らない身体。
1212.121
1軒の家は
1221.088
監視です。100軒の家はデータセットです。
1224.192
1億軒の家はインフラです。 00:20:31,218 --> 00:20:34,680 2.0s] 2025年、世界のスマートホームデバイスの
1234.68
アクティブ数は142億を超えました。
1235.61
1,400万ではなく、140億。地球上のすべての人間に
1236.487
対して2台のデバイス。きれいな水への信頼できるアクセスがない
1237.149
30億人を含めて。Stefan Brandt(シュテファン・ブラント)が
1237.793
ミュンヘンのガレージで特定したメッシュネットワークは
1240.811
局所的な現象ではありませんでした。特定の
1243.842
Echo Dot のバッチに影響を与える
1246.133
ファームウェアの不具合でもありませんでした。それは、地球上の
1249.09
あらゆる主要なスマートデバイスブランドに部品を供給する3社が製造する
1251.53
デジタル信号処理チップにハードウェアレベルで埋め込まれたプロトコルでした。