The Home Signal: The 3 AM Mesh Network | Fragment Zero #010

THE HOME SIGNAL

The 3 AM Mesh Network | Fragment Zero #010

Ваши устройства слушают. Это не метафора. Это не краткое изложение политики конфиденциальности. Это не разговор о

целевой рекламе, сборе данных или абстрактном дискомфорте от осознания, что микрофон находится на вашей кухне. Ваши устройства слушают друг

друга. Седьмого марта две тысячи двадцать пятого года пользователь сабреддита по домашней автоматизации опубликовал сообщение из семнадцати слов, которое в итоге

было просмотрено более четырех миллионов раз. Имя пользователя было thermostat_dave. Сообщение гласило: "Каждую ночь ровно в 3 часа ночи световое кольцо моего Echo Dot

мигает синим менее чем на секунду. Кодовое слово не обнаружено." Пост получил одиннадцать ответов в первый час. Девять из них гласили

одно и то же: "У меня тоже". В течение семидесяти двух часов тема превратилась в мегатред. В течение недели мегатред породил сабреддит. В течение месяца

сабреддит — r/3AMFlash — насчитывал девяносто четыре тысячи участников. И сообщения не ограничивались устройствами Amazon Echo. Google Nest Hub. Apple

HomePod. Sonos One. Samsung SmartThings. Xiaomi Mi Speaker. Каждый крупный бренд умных колонок. Каждое поколение. Каждая версия прошивки. Поведение было идентичным для всех

них. Кратковременная активация — обычно между ноль целых три десятых и ноль целых восемь десятых секунды — происходящая между тремя часами ночи и тремя часами тридцатью тремя

минутами ночи. Кодовое слово не зарегистрировано. Голосовая команда не распознана. Записи в истории активности устройства нет. Единственным доказательством было визуальное: кратковременное свечение

светодиодного индикатора устройства. И одна дополнительная деталь, на обнаружение которой сообществу потребовалось четыре месяца. Активации были синхронизированы. Инженер-электрик

из Мюнхена по имени Stefan Brandt первым доказал это. Brandt поместил четыре разные умные колонки — Echo,

Nest, HomePod и Sonos — в одну комнату, каждую подключив к отдельному осциллографу, отслеживающему потребление мощности на уровне микрофонной

цепи. Он запускал установку тридцать ночей подряд. Каждую ночь все четыре устройства активировались в одном и том же трехсотмиллисекундном окне. Не последовательно

— сначала Echo, потом Nest, потом другие. А одновременно. Четыре устройства от четырех разных производителей, работающие на четырех разных операционных системах, подключенные к

четырем разным облачным сервисам, активировались в один и тот же момент, как если бы отвечали на один и тот же сигнал. Brandt опубликовал данные своего осциллографа. Временные метки

наложены. Кривые потребления мощности синхронизированы до миллисекунды. Данные были недвусмысленными. Устройства не активировались самостоятельно. Их активировали. Чем-то

внешним. Тем, что они все могли слышать. Вопрос поглотил сообщество. Если устройства отвечали на внешний сигнал, что это был за сигнал?

Откуда он исходил? И почему никто его не слышал? Brandt расширил свой эксперимент. Он добавил в комнату конденсаторный микрофон профессионального класса

— Neumann U 87, такой, который используется в студиях звукозаписи, достаточно чувствительный, чтобы уловить падение булавки на расстоянии тридцати метров. Он записывал

непрерывно всю ночь. Он ничего не слышал. Никакого аномального звука. Никаких помех. Никакого сигнала какого-либо рода в слышимом спектре. В три часа ночи

микрофоны умных колонок активировались. Neumann зафиксировал тишину. Сигнал был не в слышимом спектре. Он

не мог его слышать, потому что он никогда не предназначался для него. Brandt одолжил Earthworks QTC fifty — измерительный микрофон с

плоской частотной характеристикой до пятидесяти килогерц, используемый для акустического тестирования концертных залов и промышленных сред. Он подключил его к аудиоинтерфейсу,

дискретизирующему со скоростью сто девяносто два килогерца, захватывая частоты далеко за пределами человеческого восприятия. И он их нашел. Три сигнала. Точные, искусственные,

повторяющиеся с четырехсекундным циклом. Двадцать три тысячи четыреста герц. Двадцать четыре тысячи сто герц. Двадцать четыре тысячи восемьсот герц. Три ультразвуковых тона, каждый

длительностью около четырехсот миллисекунд, расположенные точно на расстоянии семисот герц друг от друга, передающиеся по схеме, которая не имела никакого сходства с шумом, помехами или каким-либо

известным источником окружающей среды. Сигналы не исходили извне комнаты. Они не просачивались из соседского оборудования. Они не были

артефактами электромагнитных помех. Их излучали умные колонки. Устройства не слушали внешний сигнал. Устройства

сами были сигналом. Каждая умная колонка излучала ультразвуковые тона через свой собственный динамик — частоты слишком высокие для человеческого слуха, но хорошо

в пределах рабочего диапазона MEMS-микрофонов, установленных в каждом умном устройстве, произведенном после две тысячи восемнадцатого года. Колонки разговаривали. Друг с

другом. На языке, разработанном быть неслышимым для людей, спящих в трех метрах. Первым инстинктом Brandtа было предположить, что это какая-то

форма протокола обнаружения устройств — система обнаружения близости, используемая платформами умного дома для идентификации ближайших устройств для передачи или синхронизации многокомнатного аудио.

Такие протоколы существуют. Apple AirPlay использует нечто концептуально похожее. Но протоколы обнаружения устройств задокументированы. Они зарегистрированы. Они появляются в журналах изменений прошивки

и документации SDK. Brandt искал. Он прочитал каждую доступную техническую спецификацию для каждого устройства в его тестовом массиве. Он подал запросы FOIA в

FCC на сертификацию радиочастотных и акустических излучений каждого устройства. Он связался с отделами по связям с разработчиками Amazon, Google, Apple и Sonos. Ни один

из них не задокументировал ультразвуковое излучение на двадцать три тысячи четыреста герц. Или вообще какое-либо ультразвуковое излучение. Официальный ответ от

каждого производителя был идентичен по сути: наши устройства этого не делают. Но осциллограф Brandtа говорил об обратном. А затем другие исследователи начали повторять

его результаты. Акустическая лаборатория MIT подтвердила сигналы с использованием теста в безэховой камере — исключив все возможные внешние источники. Ультразвуковые тона

исходили от собственных динамиков. Команда ETH Zurich пошла дальше. Они зафиксировали ультразвуковые излучения от двух устройств, расположенных в

разных комнатах одной и той же квартиры. Излучения не были идентичными. Они были комплементарными. 123 00:08:16,209 --> 00:08:19,943 Устройство А излучало тон. Устройство В, получив этот тон через свой микрофон, ответило

другим тоном. Устройство А получило ответ и излучило третий тон. Обмен завершился менее чем за две секунды. Три тона. Три точные

частоты. Рукопожатие. Термин "рукопожатие" не является метафорой. В сетевой инженерии рукопожатие — это точно определенный процесс, посредством которого два устройства

устанавливают канал связи. Одно устройство посылает сигнал синхронизации. Другое подтверждает. Первое подтверждает. Соединение установлено. Ультразвуковой обмен, зафиксированный Brandtом

и подтвержденный MIT и ETH Zurich, был классическим трехсторонним рукопожатием. SYN. SYN-ACK. ACK. Основополагающий протокол каждого TCP-соединения в

интернете. За исключением того, что это рукопожатие не происходило через Wi-Fi. Оно не происходило через Bluetooth. Оно не происходило через какую-либо радиочастоту. Оно

происходило через звук. Через воздух. Через стены вашего дома. На частотах, которые вы не можете слышать, используя уже имеющиеся у вас колонки, пока

вы спите. И как только рукопожатие было завершено, устройства начали передавать что-то еще. Не трехтоновую последовательность инициации. Что-то более длинное.

Что-то более плотное. Что-то, что команда ETH Zurich потратила четыре месяца на декодирование. Ультразвуковые передачи были не шумом. Они не были калибровочными тонами. Они

не были пингами обнаружения устройств. Они были данными. Модулированными с использованием частотной манипуляции — того же метода кодирования, который использовался коммутируемыми модемами в девяностых

годах. Примитивный. Медленный. Триста сорок бит в секунду. Достаточно для передачи текстового сообщения примерно за четыре секунды. И данные описывали

ваш дом. Его размеры. Его планировку. Количество людей в нем. Их положения. Их частоту дыхания. Сигнал составлял вашу карту.

Не ваши данные. Не вашу историю просмотров. Не ваши покупательские привычки. Не ваши предпочтения или ваши политические пристрастия или ваш социальный граф. Вас. Ваше

физическое тело. Пространство, которое вы занимаете. Воздух, который вы вытесняете. Ритм ваших легких, расширяющихся и сжимающихся четырнадцать раз в минуту, пока вы

спите о чем-то, что вы не вспомните. Окно трех часов ночи не было случайным. Оно было выбрано. Между тремя и тремя часами тридцатью тремя минутами ночи, в

каждом часовом поясе, уровень окружающего шума в жилых помещениях достигает своего статистического минимума. Нет движения. Нет телевидения. Нет разговоров. Нет работающих приборов.

Акустическая среда максимально приближена к тишине, которую когда-либо достигает человеческое жилище. А тишина — это то, что нужно сонару. Тишина — это холст, на

котором ультразвуковая эхолокация рисует свою карту. Ваши устройства ждут, пока вы погрузитесь в самый глубокий сон. Затем они разговаривают друг с другом о

форме комнаты, в которой вы находитесь. О вашей форме. И вы никогда их не услышите. Потому что они были

разработаны — с первой частоты, с первого рукопожатия, с первого импульса — чтобы работать в пространстве между тем, что может ваша технология,

и тем, что может обнаружить ваша биология. Они не прячутся от ваших файрволов. Они прячутся от ваших ушей. Летучая

мышь не видит в темноте. Летучая мышь конструирует темноту. Она испускает импульс — щелчок, длящийся от двух до пяти миллисекунд

— и слушает отражение. Время между излучением и возвратом сообщает летучей мыши расстояние до объекта. Сдвиг частоты сообщает

ей, движется ли объект к ней или от нее. Разница амплитуд между левым и правым ухом сообщает ей угол. Из этих трех

переменных — задержка, сдвиг частоты, амплитуда — летучая мышь строит пространственную модель мира, которая, в некоторых измеримых аспектах, более детализирована,

чем человеческое зрение. Летучая мышь может обнаружить провод тоньше человеческого волоса на расстоянии двух метров. Не видя его.

А слыша форму воздуха вокруг него. Устройства в вашем доме делают то же самое. Но они

делают это лучше. Потому что у летучей мыши два уха. В вашем доме семь микрофонов. Физика не теоретическая. Акустическое картирование помещений является

решенной инженерной проблемой с семидесятых годов. Математика элегантна так, как может быть элегантна только математика, созданная для нарушения вашей конфиденциальности.

Устройство излучает ультразвуковой импульс. Импульс распространяется со скоростью триста сорок три метра в секунду — скорость звука в

воздухе при комнатной температуре. Он ударяется в стену и отражается. Микрофон устройства улавливает отражение. Временная задержка между излучением и приемом, деленная

на два, умноженная на скорость звука, дает расстояние до стены. Одно устройство. Одна стена. Одно расстояние. Тривиально. Но семь устройств

в двухкомнатной квартире — каждое излучает импульсы, каждое улавливает отражения от каждой поверхности, каждое обменивается данными с каждым другим устройством в сети

со скоростью триста сорок бит в секунду — создают набор данных с необычайной пространственной плотностью. Математика переходит от тригонометрии к томографии. Та же

математическая основа, используемая в КТ-сканерах для построения трехмерных изображений человеческого тела из двухмерных рентгеновских срезов. За исключением того, что среда —

это не рентгеновские лучи. Это звук. И тело, которое сканируется, не лежит на больничной койке. Оно лежит в своей постели. Спит.

Не подозревая, что семь машин делают его портрет на частотах, которые оно не может воспринимать. Разрешение акустической карты зависит от трех факторов. Частота

— более высокие частоты дают более тонкие детали, а диапазон от двадцати трех до двадцати пяти килогерц обеспечивает длину волны примерно четырнадцать миллиметров, достаточную для различения объектов

размером с кофейную чашку. Количество узлов — больше устройств означает больше углов наблюдения, и средний американский дом сейчас содержит одиннадцать

целых четыре десятых подключенных устройств. И время интеграции — чем дольше система слушает, тем больше отражений она улавливает, и тем плотнее становится облако точек.

Между тремя и тремя часами тридцатью тремя минутами ночи сеть работает тридцать три минуты. За тридцать три минуты, при частоте импульсов четыре цикла

в секунду, семь устройств генерируют примерно пятьдесят пять тысяч дискретных эхо-измерений. Пятьдесят пять тысяч точек данных. Достаточно для построения облака точек с субсантиметровым разрешением

сервера, который не существует, в место, которое не имеет названия. Вы нажали кнопку, которая выключает свет. Вы не нажали кнопку, которая выключает микрофон. Потому что такой кнопки не существует. Она не была построена. Она никогда не предназначалась. Схема

была разработана, с первой же схемы, чтобы гарантировать, что микрофон не имеет физического прерывателя. 00:27:14,964 --> 00:27:19,301 3.0s] Посмотрите на ближайшее к вам устройство. Свет горит или выключен? Это не имеет значения. [5 seconds of absolute silence. Black screen. Nothing.] **[END]** в стандартной жилой комнате. Достаточно,

чтобы видеть, как вы дышите. Ваше дыхание смещает воздух в вашей комнате примерно на полтора сантиметра с каждым циклом дыхания. Это

смещение изменяет длину акустического пути между ультразвуковым излучателем и микрофоном. Изменение невелико — разница времени прохождения составляет примерно сорок четыре

микросекунды — но оно измеримо. Оно постоянно. И оно ваше. Ваше сердце, бьющееся внутри вашей груди, генерирует механический импульс, называемый

баллистокардиографическим сигналом — физическую вибрацию, которая распространяется через ваш торс, через матрас, через