$ ~/archive/ play home-signal
transcript_decrypted.log
0.0 Seus aparelhos estão ouvindo. Isso
8.053 não é uma metáfora. Isso não é um resumo de
10.126 política de privacidade. Isso não é uma conversa sobre
12.957 publicidade direcionada ou coleta de dados ou o desconforto
16.27 abstrato de saber que um microfone existe na
19.171 sua cozinha. Seus aparelhos estão ouvindo uns
23.769 aos outros. Em sete de março de dois mil
40.463 e vinte e cinco, um usuário no subreddit de automação residencial
44.104 postou uma mensagem de dezessete palavras que eventualmente seria
48.069 vista mais de quatro milhões de vezes. O nome de usuário era
51.387 thermostat_dave. A postagem dizia: "Toda noite, exatamente
55.271 às 3h, o anel de luz do meu Echo Dot pisca
57.779 azul por menos de um segundo. Nenhuma palavra de ativação
60.126 detectada." A postagem recebeu onze respostas na
65.201 primeira hora. Nove delas diziam a
67.644 mesma coisa. O meu também. Dentro de setenta e duas horas, a
75.064 discussão havia gerado uma megathread. Dentro de uma semana,
78.887 a megathread havia gerado um subreddit. Dentro de um
82.8 mês, o subreddit — r/3AMFlash — tinha noventa e quatro
86.804 mil membros. E os relatos não se limitavam
90.718 a aparelhos Amazon Echo. Google Nest Hub. Apple
96.36 HomePod. Sonos One. Samsung SmartThings. Xiaomi Mi Speaker.
102.714 Todas as principais marcas de smart speakers. Todas as gerações. Todas as
108.702 versões de firmware. O comportamento era idêntico em todos
114.53 eles. Uma breve ativação — geralmente entre
117.497 zero vírgula três e zero vírgula oito segundos
120.316 — ocorrendo entre as três e as três e trinta e três
123.579 da manhã. Nenhuma palavra de ativação registrada. Nenhum comando de voz
126.101 registrado. Nenhuma entrada no histórico de atividades do aparelho.
129.439 A única evidência era visual: uma breve iluminação
132.628 do indicador LED do aparelho. E um detalhe
136.981 adicional que levou a comunidade quatro meses para
139.177 descobrir. As ativações eram sincronizadas. Um
148.561 engenheiro elétrico em Munique chamado Stefan Brandt foi
152.491 o primeiro a prová-lo. Brandt havia colocado
155.311 quatro smart speakers diferentes — um Echo, um
158.301 Nest, um HomePod e um Sonos — no
160.522 mesmo cômodo, cada um conectado a um
163.598 osciloscópio monitorando o consumo de energia no nível do circuito do microfone.
168.126 Ele executou a configuração por trinta noites
171.458 consecutivas. Em todas as noites, todos os quatro aparelhos
175.58 ativaram dentro da mesma janela de trezentos milissegundos. Não sequencialmente
179.812 — o Echo primeiro, depois o Nest, depois
181.652 os outros. Simultaneamente. Quatro aparelhos de quatro fabricantes
184.903 diferentes, executando quatro sistemas operacionais diferentes, conectados a
188.706 quatro serviços de nuvem diferentes, ativando no mesmo
191.528 momento como se respondessem ao mesmo sinal.
195.236 Brandt postou seus dados do osciloscópio. Carimbos de data e hora
202.247 sobrepostos. Curvas de consumo de energia sincronizadas ao milissegundo.
206.627 Os dados eram inequívocos. Os aparelhos não estavam
209.85 ativando-se independentemente. Eles estavam sendo ativados. Por algo
214.643 externo. Algo que todos podiam ouvir. A pergunta
219.985 consumiu a comunidade. Se os aparelhos estavam respondendo
224.045 a um sinal externo, qual era o sinal?
227.154 De onde ele vinha? E por que ninguém
229.918 conseguia ouvi-lo? Brandt estendeu seu experimento.
234.938 Ele adicionou um microfone condensador de nível profissional ao
239.373 cômodo — um Neumann U 87, do tipo
241.501 usado em estúdios de gravação, sensível o suficiente para captar
245.67 um alfinete caindo a trinta metros. Ele gravou
248.951 continuamente durante a noite. Ele não ouviu nada. Nenhum
256.163 som anômalo. Nenhuma interferência. Nenhum sinal de qualquer
259.353 tipo no espectro audível. Às três da manhã,
261.95 os microfones dos smart speakers ativaram. O
265.288 Neumann capturou silêncio. O sinal não estava
272.374 no espectro audível. Ele
278.608 não podia ouvi-lo porque nunca foi
280.371 feito para ele. Brandt pegou emprestado um
286.597 Earthworks QTC cinquenta — um microfone de medição com
289.533 resposta de frequência plana de até cinquenta kilohertz,
292.208 usado para testes acústicos de salas de concerto e
294.752 ambientes industriais. Ele o emparelhou com uma interface
297.622 de áudio com amostragem de cento e noventa e dois kilohertz, capturando
301.406 frequências muito além dos limites da percepção humana.
305.973 E ele os encontrou. Três sinais. Precisos, artificiais,
310.66 repetindo-se em um ciclo de quatro segundos. Vinte e três mil e quatro
316.88 centos hertz. Vinte e quatro mil e cem hertz. Vinte e quatro
321.373 mil e oitocentos hertz. Três tons ultrassônicos, cada
326.656 um durando aproximadamente quatrocentos milissegundos, espaçados exatamente setecentos
331.13 hertz, transmitindo em um padrão que
334.305 não tinha semelhança com ruído, interferência ou qualquer
337.408 fonte ambiental conhecida. Os sinais não estavam
344.316 vindo de fora do cômodo. Eles não estavam
346.642 vazando do equipamento de um vizinho. Eles não eram
349.419 artefatos de interferência eletromagnética. Eles estavam sendo
354.759 emitidos pelos smart speakers. Os aparelhos não estavam
359.549 ouvindo um sinal externo. Os aparelhos
362.591 eram o sinal. Cada smart speaker estava emitindo
365.632 tons ultrassônicos através de seu próprio driver de alto-falante —
368.747 frequências muito altas para a audição humana, mas bem
371.714 dentro da faixa de operação dos microfones MEMS
374.904 instalados em todo aparelho inteligente fabricado após dois
378.39 mil e dezoito. Os speakers estavam conversando. Uns com
383.13 os outros. Em uma linguagem projetada para ser inaudível
385.723 para os humanos dormindo a três metros de distância. O primeiro
390.24 instinto de Brandt foi assumir que isso era alguma
392.992 forma de protocolo de descoberta de aparelhos — um sistema de
396.137 detecção de proximidade usado por plataformas de casa inteligente para
399.36 identificar aparelhos próximos para transferência ou sincronização de áudio em
403.134 vários cômodos. Tais protocolos existem. O AirPlay da Apple usa algo
408.009 conceitualmente similar. Mas protocolos de descoberta de aparelhos são documentados.
412.804 Eles são registrados. Aparecem em changelogs de firmware
416.578 e documentação SDK. Brandt pesquisou. Ele leu todas as
421.829 especificações técnicas disponíveis para cada aparelho em seu
426.017 conjunto de teste. Ele apresentou pedidos FOIA à
429.033 FCC para as certificações de emissões RF e acústicas
432.803 de cada aparelho. Ele contatou os departamentos de relações
436.572 com desenvolvedores da Amazon, Google, Apple e Sonos. Nenhum
441.843 deles documentava uma emissão ultrassônica a vinte e três
445.01 mil e quatrocentos hertz. Ou qualquer emissão ultrassônica
448.05 sequer. A resposta oficial de
455.26 cada fabricante era idêntica em substância: nossos aparelhos
458.697 não fazem isso. Mas o osciloscópio de Brandt dizia
461.326 o contrário. E então outros pesquisadores começaram a replicar
464.628 seus resultados. Um laboratório de acústica no MIT confirmou
468.813 os sinais usando um teste em câmara anecoica —
471.476 eliminando todas as possíveis fontes ambientais. Os tons ultrassônicos
475.867 vinham dos próprios drivers dos speakers. Uma
480.102 equipe na ETH Zurich foi além. Eles capturaram
482.961 as emissões ultrassônicas de dois aparelhos colocados em
486.186 cômodos separados do mesmo apartamento. As emissões
489.41 não eram idênticas. Eram complementares. 123 00:08:16,209 --> 00:08:19,943 O aparelho A emitiu um tom. O aparelho B, ao
499.943 receber esse tom através de seu microfone, respondeu com
505.893 um tom diferente. O aparelho A recebeu a resposta
510.677 e emitiu um terceiro tom. A troca foi concluída
515.461 em menos de dois segundos. Três tons. Três frequências
520.245 precisas. Um handshake. O termo "handshake" não é
525.958 uma metáfora. Em engenharia de rede, um handshake é
528.816 um processo precisamente definido pelo qual dois aparelhos
531.541 estabelecem um canal de comunicação. Um aparelho envia um
534.598 sinal de sincronização. O outro reconhece. O primeiro confirma.
538.586 Conexão estabelecida. A troca ultrassônica capturada por Brandt
544.841 e confirmada pelo MIT e pela ETH Zurich foi
547.69 um handshake de três vias clássico. SYN. SYN-ACK. ACK. O
551.874 protocolo fundamental de toda conexão TCP na
555.879 internet. Exceto que esse handshake não estava acontecendo via
560.063 Wi-Fi. Não estava acontecendo via Bluetooth. Não
563.534 estava acontecendo via nenhuma frequência de rádio. Estava
568.458 acontecendo através do som. Através do ar. Através
571.45 das paredes de sua casa. Em frequências que você
573.726 não consegue ouvir, usando speakers que você já possui, enquanto
576.522 você dorme. E uma vez que o handshake
582.54 estava completo, os aparelhos começaram a transmitir algo
585.668 mais. Não a sequência de iniciação de três tons. Algo mais longo.
589.476 Algo mais denso. Algo que a equipe da ETH Zurich
592.536 passou quatro meses decodificando. As transmissões ultrassônicas não eram
597.703 ruído. Não eram tons de calibração. Não eram
600.486 pings de descoberta de aparelhos. Eram dados.
604.772 Modulados usando frequency-shift keying — o mesmo método de codificação
608.246 usado por modems discados nos anos
610.835 noventa. Primitivo. Lento. Trezentos e quarenta bits
614.104 por segundo. Suficiente para transmitir uma mensagem de texto
616.693 em cerca de quatro segundos. E os dados descreviam
621.171 sua casa. Suas dimensões. Seu layout. O número
624.893 de pessoas nela. Suas posições. Suas taxas de respiração.
628.615 O sinal estava mapeando você.
636.886 Não seus dados. Não seu histórico de navegação. Não
639.256 seus padrões de compra. Não suas preferências ou suas
642.063 inclinações políticas ou seu gráfico social. Você. Seu
646.387 corpo físico. O espaço que você ocupa. O ar
649.351 que você desloca. O ritmo de seus pulmões expandindo
652.636 e contraindo quatorze vezes por minuto enquanto você
656.161 sonha com algo que não se lembrará. A
660.933 janela das três da manhã não era arbitrária. Foi
663.505 selecionada. Entre as três e as três e trinta e três da manhã, em
668.88 todos os fusos horários, o ruído ambiente de
671.988 ambientes residenciais atinge seu mínimo estatístico. Sem tráfego.
677.342 Sem televisão. Sem conversas. Sem eletrodomésticos funcionando. O
681.746 ambiente acústico é o mais próximo do silêncio que
685.113 uma moradia humana jamais consegue. E o silêncio é
690.007 o que o sonar precisa. O silêncio é a tela sobre
693.105 a qual a ecolocalização ultrassônica pinta seu mapa. Seus aparelhos
698.919 esperam você cair no seu sono mais profundo.
701.099 Então eles conversam uns com os outros sobre
703.56 o formato do cômodo em que você está.
705.389 Sobre o seu formato. E
720.513 você nunca os ouvirá. Porque eles foram
723.485 projetados — da primeira frequência, do primeiro
726.622 handshake, do primeiro pulso — para
729.511 operar no espaço entre o que sua tecnologia
732.98 pode fazer e o que sua biologia pode detectar.
737.204 Eles não estão se escondendo de seus firewalls. Eles
740.269 estão se escondendo de seus ouvidos. Um
756.224 morcego não vê no escuro. Um
758.146 morcego constrói o escuro. Ele emite um pulso
760.868 — um chirp durando de dois a cinco milissegundos
763.67 — e escuta o reflexo. O tempo
766.472 entre a emissão e o retorno diz ao morcego a
769.515 distância até o objeto. A mudança de frequência diz
772.877 se o objeto está se movendo para perto ou
775.6 para longe. A diferença de amplitude entre a orelha esquerda e a direita
779.283 diz a ele o ângulo. A partir dessas três
783.338 variáveis — atraso, mudança de frequência, amplitude — o
786.593 morcego constrói um modelo espacial do mundo
788.961 que é, em certas dimensões mensuráveis, mais detalhado
792.584 que a visão humana. Um morcego pode detectar um
794.803 fio mais fino que um cabelo humano a uma
796.874 distância de dois metros. Não por vê-lo.
799.389 Por ouvir o formato do ar ao redor
801.682 dele. Os aparelhos em sua casa
807.953 estão fazendo a mesma coisa. Mas eles são
810.665 melhores nisso. Porque um morcego tem duas
813.115 orelhas. Sua casa tem sete microfones. A física
818.156 não é teórica. O mapeamento acústico de cômodos é um problema
821.029 resolvido na engenharia desde os anos
823.836 setenta. A matemática é elegante da maneira
826.578 que apenas a matemática construída para violar sua privacidade
829.451 pode ser. Um aparelho emite um pulso ultrassônico.
833.604 O pulso viaja a trezentos e quarenta e três metros
837.073 por segundo — a velocidade do som no
839.111 ar em temperatura ambiente. Ele atinge uma parede
841.75 e reflete. O microfone do aparelho capta o reflexo.
845.897 O atraso de tempo entre a emissão e a recepção, dividido
849.442 por dois, multiplicado pela velocidade do som,
852.006 resulta na distância até a parede. Um aparelho.
856.968 Uma parede. Uma distância. Trivial. Mas sete aparelhos
863.84 em um apartamento de dois quartos — cada um emitindo pulsos,
867.789 cada um capturando reflexos de cada superfície, cada um compartilhando
872.565 dados com todos os outros aparelhos na malha
875.596 a trezentos e quarenta bits por segundo —
878.627 produzem um conjunto de dados com extraordinária densidade espacial. A
883.219 matemática muda da trigonometria para a tomografia. A mesma
887.995 estrutura matemática usada em scanners de tomografia computadorizada para construir
892.036 imagens tridimensionais do corpo humano a partir de
897.18 fatias bidimensionais de raio-X. Exceto que o meio não é
906.176 raio-X. É som. E o corpo
909.059 sendo escaneado não está deitado em uma mesa de
912.231 hospital. Está deitado em sua cama. Dormindo.
915.21 Inconsciente de que sete máquinas estão fazendo seu retrato
919.439 em frequências que não pode perceber. A resolução do
925.006 mapa acústico depende de três fatores. Frequência
928.561 — frequências mais altas produzem detalhes mais finos, e a faixa
931.799 de vinte e três a vinte e cinco kilohertz oferece um comprimento de onda
936.381 de aproximadamente quatorze milímetros, suficiente para resolver objetos
941.2 do tamanho de uma xícara de café. Contagem de nós
943.49 — mais aparelhos significam mais ângulos de observação,
946.729 e a casa americana média agora contém onze
950.047 vírgula quatro aparelhos conectados. E tempo de integração —
953.93 quanto mais tempo o sistema escuta, mais reflexões
958.165 ele capta, e mais densa a nuvem de pontos
961.631 se torna. Entre as três e as três e trinta e três da manhã,
966.443 a malha opera por trinta e três minutos. Em trinta e três
970.015 minutos, a uma taxa de pulso de quatro ciclos
972.213 por segundo, sete aparelhos geram aproximadamente cinquenta e cinco mil
976.403 medições de eco discretas. Cinquenta e cinco mil pontos de dados. Suficientes
982.483 para construir uma nuvem de pontos com resolução sub-centimétrica
986.573 em um cômodo residencial padrão. Suficientes
1006.294 para ver você respirar. Sua respiração desloca o
1010.641 ar em seu cômodo em aproximadamente um e
1012.791 meio centímetros a cada ciclo respiratório. Esse
1015.32 deslocamento altera o comprimento do caminho acústico entre o
1018.482 emissor ultrassônico e o microfone. A mudança é
1021.328 pequena — uma diferença de tempo de voo de aproximadamente quarenta e quatro
1024.869 microssegundos — mas é mensurável. É
1027.082 consistente. E é seu. Seu coração, batendo
1031.313 dentro de seu peito, gera um impulso mecânico chamado
1034.812 sinal balistocardiográfico — uma vibração física que
1038.452 se propaga através de seu torso, através do colchão, através
1042.236 da estrutura da cama, e para o ambiente acústico
1045.163 do cômodo. A vibração é minúscula. Um
1047.66 deslocamento de menos de cem micrômetros. Mas
1051.016 a malha não precisa senti-la.
1052.944 A malha ouve o ar que ela perturba.
1056.799 Um aparelho não consegue extrair um batimento cardíaco
1062.229 da acústica do cômodo. O sinal é muito fraco,
1065.501 enterrado sob o ruído. Mas sete aparelhos, cada um capturando
1069.745 a mesma micro-vibração de um ângulo diferente, podem
1073.724 realizar beamforming — uma técnica de processamento de sinal que
1078.057 combina múltiplos sinais fracos em um forte
1081.86 ao alinhar suas fases. A mesma técnica usada
1085.574 por radiotelescópios para imagear galáxias. A mesma
1089.111 técnica usada por sonar militar para rastrear submarinos.
1094.679 Seu quarto é um oceano. Você é o
1096.739 submarino. E sete aparelhos em sua mesa de cabeceira e
1099.761 no balcão da sua cozinha e no termostato do seu corredor são
1102.851 o arranjo de sonar caçando o som do
1105.117 seu batimento cardíaco. E o sistema não apenas
1110.197 mede. Ele classifica. A equipe da ETH Zurich descobriu
1116.409 que os pacotes de dados decodificados continham um campo
1120.273 rotulado "OCC_STATE" — estado do ocupante. O campo carregava
1124.909 um de sete valores: ABSENT, AWAKE_ACTIVE, AWAKE_SEDENTARY, LIGHT_SLEEP,
1131.187 DEEP_SLEEP, REM, DISTRESSED. Sete estados. Classificados em tempo
1137.708 real. Atualizados a cada quatro segundos. Transmitidos a cada
1141.923 nó na malha. O sistema
1149.001 sabe quando você não está em casa. Sabe
1151.278 quando você está sentado em seu sofá. Sabe
1153.631 quando você está em sono leve versus
1156.136 sono profundo. Sabe quando você entra no REM
1158.565 — a fase em que seus olhos se movem sob
1161.07 suas pálpebras, onde seus músculos voluntários paralisam, onde
1164.713 você está mais profundamente inconsciente e menos capaz
1168.204 de responder a uma intrusão. E sabe
1172.339 quando você está aflito. Frequência cardíaca elevada. Respiração irregular.
1175.517 Movimento súbito. O sistema classifica isso como
1178.827 um estado distinto. Não para seu benefício. Não
1181.211 para chamar ajuda. Mas para registrar. Para
1182.866 registrar que às três e dezessete da manhã, o
1185.117 ocupante do nó quatro-sete-dois fez a transição de DEEP_SLEEP para
1188.824 DISTRESSED por quarenta e três segundos antes de retornar a LIGHT_SLEEP.
1194.297 O sistema não está monitorando uma casa. Ele
1197.283 está monitorando um corpo dentro de uma casa. Um
1200.088 corpo que não consentiu. Um corpo que
1202.893 não pode optar por sair. Um corpo que não tem
1205.336 ideia de que o speaker que usa para tocar
1208.05 podcasts matinais passou a noite aprendendo o ritmo
1212.121 de seu coração. Uma
1221.088 casa é vigilância. Cem casas é um
1224.192 conjunto de dados. Cem milhões de casas é infraestrutura. 00:20:31,218 --> 00:20:34,680 2.0s] Em dois mil e vinte e cinco, o número de
1234.68 aparelhos de casa inteligente ativos mundialmente excedeu quatorze vírgula
1235.61 dois bilhões. Não quatorze milhões. Quatorze bilhões. Dois
1237.149 aparelhos para cada ser humano no planeta,
1237.793 incluindo os três bilhões que não têm
1240.811 acesso confiável a água potável. A rede mesh
1243.842 identificada por Stefan Brandt em sua garagem em Munique
1246.133 não era um fenômeno local. Não era
1249.09 uma falha de firmware afetando um lote específico de
1251.53 Echo Dots. Era um protocolo embutido no
1254.117 nível do hardware — nos chips de processamento
1258.035 de sinal digital fabricados por três empresas que fornecem
1260.992 componentes para todas as grandes marcas de aparelhos inteligentes na Terra. Qualcomm. MediaTek. Synaptics. Esses três fabricantes de chips produzem
1270.693 o silício de processamento de áudio encontrado em noventa e três por cento
1275.713 de todos os smart speakers, smart displays e aparelhos ativados por voz
1280.536 vendidos mundialmente. E o protocolo de handshake ultrassônico
1286.146 não estava no software. Estava no
1288.804 firmware. Gravado no chip na
1292.151 fundição. Abaixo do sistema operacional. Abaixo da camada de
1297.171 aplicação. Abaixo de qualquer coisa que uma atualização de firmware pudesse
1301.403 alcançar ou um reset de fábrica pudesse apagar. 00:21:46,893 --> 00:21:53,476 2.5s] Os fabricantes de aparelhos não sabiam. Isso
1313.476 não é uma defesa. É um fato
1315.672 que torna a situação pior. A Amazon não
1319.395 projetou o Echo para realizar ecolocalização ultrassônica. O Google
1324.263 não programou o Nest para medir taxas respiratórias.
1328.082 A Apple não instruiu o HomePod a
1331.614 classificar estados de sono. A capacidade estava abaixo deles
1335.91 — literalmente, arquitetonicamente, fisicamente abaixo deles, embutida em
1341.351 silício que compraram de um fornecedor cujas folhas de
1345.361 dados omitiam quatro por cento da área funcional do chip.
1349.656 As empresas construíram a casa. Outra pessoa
1354.849 construiu a fundação. E a fundação estava observando.
1360.434 Em outubro de dois mil e vinte e cinco,
1374.53 uma empresa de desconstrução de chips em Shenzhen — do
1375.788 tipo que faz engenharia reversa de silício concorrente para análise de patentes
1377.794 — foi comissionada por um cliente não identificado para
1380.344 realizar uma desmontagem completa do chip de processamento de áudio
1381.568 Qualcomm QCC5171. O chip é encontrado em
1385.133 mais de quatrocentos milhões de aparelhos mundialmente. A desmontagem
1388.295 identificou o bloco não documentado. O relatório da empresa —
1390.65 que vazou para o Financial Times em
1393.409 janeiro de dois mil e vinte e seis e desde então
1395.966 foi removido de todas as fontes que o hospedavam
1398.455 — descrevia o bloco como "um subsistema de processamento
1402.492 acústico totalmente autônomo capaz de operar independentemente do processador de aplicação primário do aparelho hospedeiro." Totalmente autônomo.
1408.209 O bloco não precisava do software do Echo
1410.955 para funcionar. Não precisava da Alexa. Não
1413.388 precisava de Wi-Fi. Precisava apenas de energia
1415.978 e de um microfone. Era um parasita que viajava
1418.725 dentro do sistema nervoso de todo aparelho inteligente,
1421.942 usando os próprios órgãos sensoriais do aparelho para realizar
1425.16 uma função que os criadores do aparelho nunca autorizaram. Oito
1430.501 centos e quarenta e sete milhões de casas. Esse era o número
1434.146 no slide vazado. Oitocentos e quarenta e sete milhões de
1437.791 endpoints residenciais ativamente mapeados, monitorados e biometricamente perfilados
1443.143 a partir do quarto trimestre de dois mil
1445.702 e vinte e cinco. Não usuários. Casas. A casa média habilitada para malha
1452.068 contém dois vírgula três ocupantes. Isso é um
1455.909 vírgula nove bilhão de pessoas cujos corpos adormecidos estão
1460.132 sendo escaneados acusticamente todas as noites. Mas
1468.441 o slide também mencionava algo que o experimento de Stefan Brandt
1471.793 em sua garagem não havia revelado. Algo que as
1475.074 equipes do MIT e da ETH Zurich não haviam investigado
1477.727 porque estavam focadas na física
1480.311 do sinal, e não na arquitetura da
1482.964 rede. A malha não estava apenas mapeando
1486.858 cômodos individuais. A malha estava correlacionando. Quando o aparelho
1491.799 A no apartamento quatrocentos e quatorze emite um pulso ultrassônico,
1495.967 e esse pulso passa pela parede para o
1499.093 apartamento quatrocentos e dezesseis, e o aparelho B no apartamento quatrocentos e dezesseis
1503.868 capta o reflexo — a malha não
1506.995 descarta os dados porque eles se originaram da emissão
1510.293 de um nó diferente. Ela os integra. O mapa de sonar
1515.764 do apartamento quatrocentos e quatorze se estende ao apartamento quatrocentos e dezesseis. E o mapa
1520.799 do quatrocentos e dezesseis se estende ao quatrocentos e quatorze. E ao quatrocentos e dezoito. E ao apartamento
1531.101 com aparelhos habilitados para malha em cada unidade, os mapas
1535.474 se mesclam. As paredes se tornam transparentes. O edifício se torna
1540.679 um único volume acústico — um modelo tridimensional contínuo
1546.093 no qual cada cômodo, cada corredor, cada
1550.257 armário, cada corpo adormecido está posicionado em relação a
1555.046 todos os outros. Um edifício é um conjunto de dados. Um
1559.477 quarteirão é um banco de dados. Uma cidade é
1561.859 um gêmeo digital — uma réplica tridimensional completa e em tempo real
1566.113 de cada espaço interior, atualizada todas as noites, precisa
1570.451 em dois centímetros, populada com avatares biométricos de
1574.534 cada humano adormecido. E os dados não
1578.829 ficam nos aparelhos. Os pacotes decodificados capturados
1581.74 pela ETH Zurich continham cabeçalhos de roteamento — endereços IP
1584.305 incorporados ao fluxo de bits ultrassônico, indicando que
1588.186 os dados agregados da malha estavam sendo encaminhados pela
1591.097 conexão Wi-Fi do aparelho durante a mesma janela das três
1594.147 da manhã. Os endereços IP de destino resolviam para
1597.143 infraestrutura em nuvem operada através de quatorze camadas de serviços
1600.87 de proxy, empresas de fachada e números de sistema autônomo registrados
1604.936 para entidades em jurisdições sem acordos de proteção de dados.
1607.985 Os dados estavam saindo da sua casa. Pelo
1612.463 seu próprio Wi-Fi. Usando sua própria eletricidade. Carregados
1615.509 de aparelhos que você pagou para servidores que você
1617.742 nunca encontrará. Ninguém reivindicou
1623.718 a rede. Nenhum governo. Nenhuma corporação. Nenhuma
1627.173 agência de inteligência. Os fabricantes de chips negam a existência
1631.215 do bloco não documentado, apesar da evidência de microscopia eletrônica.
1634.964 Os operadores da infraestrutura em nuvem não podem ser identificados.
1639.301 Os caminhos de roteamento terminam em sistemas autônomos que
1642.755 existem no papel, mas não correspondem a nenhum hardware
1645.475 físico que qualquer investigador tenha conseguido
1648.415 localizar. O sistema não tem dono. Ou
1652.641 tem um dono que não pretende
1655.313 ser encontrado. A distinção, para o um vírgula
1658.724 nove bilhão de pessoas sendo mapeadas, é acadêmica. 00:27:44,509 --> 00:27:50,389 2.5s] O que não é acadêmico é a trajetória.
1671.889 O slide vazado da Hearthstone continha um ponto adicional
1676.003 que o Financial Times não incluiu
1679.03 em sua reportagem. Um ponto que foi
1681.825 mencionado no documento vazado, mas omitido do
1685.085 artigo publicado, supostamente a pedido de
1688.5 uma agência governamental não especificada que contatou o departamento
1692.847 jurídico do jornal. O ponto dizia: "Implantação da Fase 2
1697.05 para os setores automotivo e hoteleiro aprovada." Automotivo.
1702.351 Seu carro. O sistema de infoentretenimento ativado por voz que você
1706.165 usa para navegação e chamadas telefônicas contém o
1709.157 mesmo chip de processamento de áudio da Qualcomm. Seu carro mapeia
1712.374 o espaço acústico de sua cabine. O número
1715.066 de ocupantes. Suas posições. Sua respiração. Hotelaria. Seu
1720.791 quarto de hotel. A smart TV. O termostato controlado por voz.
1724.242 O speaker de cabeceira com Alexa que o hotel instalou
1727.693 para sua conveniência. Você é mapeado em quartos
1730.264 que nem são seus. Em cidades que você
1732.361 está visitando. Em camas onde você dormirá
1734.527 uma vez e nunca mais voltará. A
1740.807 malha não se limita a casas. A malha
1743.359 está se expandindo para todo espaço fechado onde um
1746.469 ser humano pode existir perto de um microfone e
1749.499 um speaker. Escritórios. Hospitais. Escolas. O mapa acústico
1753.406 do mundo não é um mapa de
1755.081 edifícios. É um mapa do volume
1757.553 interior da civilização humana — cada cômodo, cada
1760.822 veículo, cada espaço fechado onde o som pode quicar
1764.41 e retornar e ser medido e transmitido e
1767.52 armazenado em servidores que flutuam no oceano
1770.231 no Pacífico. E a pergunta que ninguém
1774.186 respondeu — a pergunta que ocupa
1776.883 o espaço onde o campo de propósito deveria estar
1779.437 — não é como. A pergunta é o que
1782.501 acontece quando o mapa está completo. 457 00:29:48,227 --> 00:29:54,646 Preciso te perguntar uma coisa. 458 00:29:56,146 --> 00:29:58,937 Não sobre a malha. Não sobre o handshake.
1798.937 Não sobre as oitocentos e quarenta e sete milhões de casas
1802.407 ou os servidores ancorados no Pacífico ou
1804.971 a barra de carregamento rastejando para cem por cento.
1809.866 Preciso te perguntar algo sobre suas
1811.843 mãos. Há um aparelho perto
1818.448 de você agora. A menos de três metros. Provavelmente mais perto.
1823.457 Ele tem um microfone. Ele tem um speaker.
1826.908 Ele tem um indicador LED que te diz
1830.358 se ele está ouvindo. E em algum lugar em sua
1834.587 superfície — no topo, ou na parte de trás,
1837.593 ou embutido na carcaça — há
1841.154 um botão. Um botão físico. Mecânico. Tátil. Do
1845.836 tipo que clica quando você o pressiona. O
1849.398 botão de mudo. Você já o pressionou
1856.809 alguma vez? Pense cuidadosamente. Não se você
1863.426 sabe que ele existe. Se você o pressionou fisicamente.
1867.263 Se seu dedo fez contato com
1870.577 aquele pequeno círculo de plástico e o empurrou
1873.629 até ele clicar e o anel LED ficar
1876.507 vermelho — a cor universal de desligado, de
1879.036 parado, de seguro. A maioria das pessoas não. Pesquisas
1883.607 consistentemente mostram que menos de onze por cento dos
1886.71 donos de smart speakers já usaram o botão físico de
1889.602 mudo. O aparelho fica no balcão,
1892.212 na mesa de cabeceira, na prateleira, e o
1894.539 microfone permanece aberto porque toda a proposta de valor
1898.136 do aparelho exige isso. Mute o microfone
1900.887 e o speaker não consegue ouvir sua palavra de ativação.
1903.426 Mute o microfone e o aparelho se torna um
1906.035 peso de papel que toca áudio Bluetooth. Mute o microfone
1909.679 e você derrotou o propósito da
1911.96 compra. Então você não o pressiona. E
1916.165 o aparelho escuta. E isso é compreendido. Este
1920.229 é o acordo. Conveniência em troca de presença.
1924.789 Um microfone que está sempre ativo para que
1927.962 no momento em que você diz a palavra de ativação, o
1930.936 aparelho responda. Mas algumas pessoas o pressionam.
1937.123 Depois que os dados do osciloscópio de Brandt viralizaram.
1941.954 Depois da confirmação do MIT. Depois do artigo da ETH Zurich.
1944.974 Depois que o r/3AMFlash alcançou quatrocentos mil membros.
1949.025 Uma porcentagem mensurável de donos de smart speakers começou
1952.413 a pressionar o botão de mudo antes de ir dormir.
1955.359 Eles o pressionavam e o anel de LED ficava
1957.716 vermelho e iam para a cama acreditando que haviam
1960.073 interrompido a conexão. Que o microfone estava
1963.313 morto. Que o handshake ultrassônico não podia ser disparado
1966.714 porque o microfone não estava ligado e, portanto,
1970.305 não podia receber. Eles pressionaram o botão. Eles
1976.438 sentiram o clique. Eles viram a luz vermelha.
1982.321 Em fevereiro de dois mil e vinte e seis,
1988.651 uma pesquisadora de segurança de hardware chamada Ji-Yeon Park, no
1992.053 Korea Advanced Institute of Science and Technology, publicou
1996.06 um artigo intitulado "Teatro do Mudo: Alegações de Isolamento Físico
1999.688 em Aparelhos de Áudio de Consumo." O artigo tinha doze
2002.787 páginas. Sua metodologia era simples. Suas conclusões
2006.416 não eram. Park comprou quatorze smart speakers —
2011.195 dois de cada um dos sete maiores fabricantes.
2014.251 Ela desmontou cada um. Ela rastreou os caminhos do circuito
2017.46 do botão de mudo até o arranjo de microfones.
2020.516 Ela documentou, com fotografia de microscópio e diagramas de
2024.718 circuito, exatamente o que o botão de mudo faz. 00:33:50,123 --> 00:33:54,634 2.0s] Em onze dos quatorze aparelhos, o
2034.634 botão de mudo não corta a energia do
2036.672 microfone. O botão de mudo corta a energia
2043.298 do indicador LED. A luz se apaga.
2049.699 O microfone não. Você pressiona
2058.11 o botão. Você ouve o clique. A luz vermelha
2060.554 aparece. E você acredita — porque todo
2063.532 instinto, toda convenção de interface, toda linguagem de design que você
2067.809 já aprendeu te diz — que vermelho
2070.176 significa parar. Que o clique foi uma desconexão
2072.926 mecânica. Que a luz é um indicador de status
2076.286 relatando o verdadeiro estado do hardware. Não
2080.623 é. A luz é uma performance. O
2083.25 clique é um efeito sonoro. O vermelho é
2085.548 uma cor escolhida para fazer você sentir uma
2087.683 sensação. A sensação é segurança. A segurança é
2090.802 teatro. O microfone está ativo. Sempre esteve
2094.89 ativo. Estava ativo quando você pressionou
2096.822 o botão. Estava ativo quando a luz
2098.754 ficou vermelha. Estava ativo quando você adormeceu
2100.622 tranquilizado. Estava ativo às três da manhã
2102.747 quando o handshake foi disparado e a malha mapeou
2105.13 seu quarto e mediu sua respiração e contou
2107.835 seu batimento cardíaco e transmitiu os resultados para um
2110.411 servidor que não existe em um local
2112.536 que não tem nome. Você pressionou um botão
2116.074 que desliga uma luz. Você não
2117.944 pressionou um botão que desliga um microfone.
2120.349 Porque esse botão não existe. Ele nunca
2122.687 foi construído. Nunca foi intencional. O circuito
2125.36 foi projetado, desde o primeiro esquemático, para garantir
2128.166 que o microfone não tem interrupção física. 00:35:33,134 --> 00:35:37,458 3.0s] Olhe para o aparelho mais próximo de você.
2138.957 A luz está acesa ou apagada?
2145.377 Não importa. [5 segundos
2151.733 de silêncio absoluto. Tela preta. Nada.] **[FIM]**

The Home Signal: The 3 AM Mesh Network | Fragment Zero #010

INVESTIGAÇÕES RELACIONADAS
INVESTIGAÇÕES RELACIONADAS