0.0
Seus aparelhos estão ouvindo. Isso
8.053
não é uma metáfora. Isso não é um resumo de
10.126
política de privacidade. Isso não é uma conversa sobre
12.957
publicidade direcionada ou coleta de dados ou o desconforto
16.27
abstrato de saber que um microfone existe na
19.171
sua cozinha. Seus aparelhos estão ouvindo uns
23.769
aos outros. Em sete de março de dois mil
40.463
e vinte e cinco, um usuário no subreddit de automação residencial
44.104
postou uma mensagem de dezessete palavras que eventualmente seria
48.069
vista mais de quatro milhões de vezes. O nome de usuário era
51.387
thermostat_dave. A postagem dizia: "Toda noite, exatamente
55.271
às 3h, o anel de luz do meu Echo Dot pisca
57.779
azul por menos de um segundo. Nenhuma palavra de ativação
60.126
detectada." A postagem recebeu onze respostas na
65.201
primeira hora. Nove delas diziam a
67.644
mesma coisa. O meu também. Dentro de setenta e duas horas, a
75.064
discussão havia gerado uma megathread. Dentro de uma semana,
78.887
a megathread havia gerado um subreddit. Dentro de um
82.8
mês, o subreddit — r/3AMFlash — tinha noventa e quatro
86.804
mil membros. E os relatos não se limitavam
90.718
a aparelhos Amazon Echo. Google Nest Hub. Apple
96.36
HomePod. Sonos One. Samsung SmartThings. Xiaomi Mi Speaker.
102.714
Todas as principais marcas de smart speakers. Todas as gerações. Todas as
108.702
versões de firmware. O comportamento era idêntico em todos
114.53
eles. Uma breve ativação — geralmente entre
117.497
zero vírgula três e zero vírgula oito segundos
120.316
— ocorrendo entre as três e as três e trinta e três
123.579
da manhã. Nenhuma palavra de ativação registrada. Nenhum comando de voz
126.101
registrado. Nenhuma entrada no histórico de atividades do aparelho.
129.439
A única evidência era visual: uma breve iluminação
132.628
do indicador LED do aparelho. E um detalhe
136.981
adicional que levou a comunidade quatro meses para
139.177
descobrir. As ativações eram sincronizadas. Um
148.561
engenheiro elétrico em Munique chamado Stefan Brandt foi
152.491
o primeiro a prová-lo. Brandt havia colocado
155.311
quatro smart speakers diferentes — um Echo, um
158.301
Nest, um HomePod e um Sonos — no
160.522
mesmo cômodo, cada um conectado a um
163.598
osciloscópio monitorando o consumo de energia no nível do circuito do microfone.
168.126
Ele executou a configuração por trinta noites
171.458
consecutivas. Em todas as noites, todos os quatro aparelhos
175.58
ativaram dentro da mesma janela de trezentos milissegundos. Não sequencialmente
179.812
— o Echo primeiro, depois o Nest, depois
181.652
os outros. Simultaneamente. Quatro aparelhos de quatro fabricantes
184.903
diferentes, executando quatro sistemas operacionais diferentes, conectados a
188.706
quatro serviços de nuvem diferentes, ativando no mesmo
191.528
momento como se respondessem ao mesmo sinal.
195.236
Brandt postou seus dados do osciloscópio. Carimbos de data e hora
202.247
sobrepostos. Curvas de consumo de energia sincronizadas ao milissegundo.
206.627
Os dados eram inequívocos. Os aparelhos não estavam
209.85
ativando-se independentemente. Eles estavam sendo ativados. Por algo
214.643
externo. Algo que todos podiam ouvir. A pergunta
219.985
consumiu a comunidade. Se os aparelhos estavam respondendo
224.045
a um sinal externo, qual era o sinal?
227.154
De onde ele vinha? E por que ninguém
229.918
conseguia ouvi-lo? Brandt estendeu seu experimento.
234.938
Ele adicionou um microfone condensador de nível profissional ao
239.373
cômodo — um Neumann U 87, do tipo
241.501
usado em estúdios de gravação, sensível o suficiente para captar
245.67
um alfinete caindo a trinta metros. Ele gravou
248.951
continuamente durante a noite. Ele não ouviu nada. Nenhum
256.163
som anômalo. Nenhuma interferência. Nenhum sinal de qualquer
259.353
tipo no espectro audível. Às três da manhã,
261.95
os microfones dos smart speakers ativaram. O
265.288
Neumann capturou silêncio. O sinal não estava
272.374
no espectro audível. Ele
278.608
não podia ouvi-lo porque nunca foi
280.371
feito para ele. Brandt pegou emprestado um
286.597
Earthworks QTC cinquenta — um microfone de medição com
289.533
resposta de frequência plana de até cinquenta kilohertz,
292.208
usado para testes acústicos de salas de concerto e
294.752
ambientes industriais. Ele o emparelhou com uma interface
297.622
de áudio com amostragem de cento e noventa e dois kilohertz, capturando
301.406
frequências muito além dos limites da percepção humana.
305.973
E ele os encontrou. Três sinais. Precisos, artificiais,
310.66
repetindo-se em um ciclo de quatro segundos. Vinte e três mil e quatro
316.88
centos hertz. Vinte e quatro mil e cem hertz. Vinte e quatro
321.373
mil e oitocentos hertz. Três tons ultrassônicos, cada
326.656
um durando aproximadamente quatrocentos milissegundos, espaçados exatamente setecentos
331.13
hertz, transmitindo em um padrão que
334.305
não tinha semelhança com ruído, interferência ou qualquer
337.408
fonte ambiental conhecida. Os sinais não estavam
344.316
vindo de fora do cômodo. Eles não estavam
346.642
vazando do equipamento de um vizinho. Eles não eram
349.419
artefatos de interferência eletromagnética. Eles estavam sendo
354.759
emitidos pelos smart speakers. Os aparelhos não estavam
359.549
ouvindo um sinal externo. Os aparelhos
362.591
eram o sinal. Cada smart speaker estava emitindo
365.632
tons ultrassônicos através de seu próprio driver de alto-falante —
368.747
frequências muito altas para a audição humana, mas bem
371.714
dentro da faixa de operação dos microfones MEMS
374.904
instalados em todo aparelho inteligente fabricado após dois
378.39
mil e dezoito. Os speakers estavam conversando. Uns com
383.13
os outros. Em uma linguagem projetada para ser inaudível
385.723
para os humanos dormindo a três metros de distância. O primeiro
390.24
instinto de Brandt foi assumir que isso era alguma
392.992
forma de protocolo de descoberta de aparelhos — um sistema de
396.137
detecção de proximidade usado por plataformas de casa inteligente para
399.36
identificar aparelhos próximos para transferência ou sincronização de áudio em
403.134
vários cômodos. Tais protocolos existem. O AirPlay da Apple usa algo
408.009
conceitualmente similar. Mas protocolos de descoberta de aparelhos são documentados.
412.804
Eles são registrados. Aparecem em changelogs de firmware
416.578
e documentação SDK. Brandt pesquisou. Ele leu todas as
421.829
especificações técnicas disponíveis para cada aparelho em seu
426.017
conjunto de teste. Ele apresentou pedidos FOIA à
429.033
FCC para as certificações de emissões RF e acústicas
432.803
de cada aparelho. Ele contatou os departamentos de relações
436.572
com desenvolvedores da Amazon, Google, Apple e Sonos. Nenhum
441.843
deles documentava uma emissão ultrassônica a vinte e três
445.01
mil e quatrocentos hertz. Ou qualquer emissão ultrassônica
448.05
sequer. A resposta oficial de
455.26
cada fabricante era idêntica em substância: nossos aparelhos
458.697
não fazem isso. Mas o osciloscópio de Brandt dizia
461.326
o contrário. E então outros pesquisadores começaram a replicar
464.628
seus resultados. Um laboratório de acústica no MIT confirmou
468.813
os sinais usando um teste em câmara anecoica —
471.476
eliminando todas as possíveis fontes ambientais. Os tons ultrassônicos
475.867
vinham dos próprios drivers dos speakers. Uma
480.102
equipe na ETH Zurich foi além. Eles capturaram
482.961
as emissões ultrassônicas de dois aparelhos colocados em
486.186
cômodos separados do mesmo apartamento. As emissões
489.41
não eram idênticas. Eram complementares. 123 00:08:16,209 --> 00:08:19,943 O aparelho A emitiu um tom. O aparelho B, ao
499.943
receber esse tom através de seu microfone, respondeu com
505.893
um tom diferente. O aparelho A recebeu a resposta
510.677
e emitiu um terceiro tom. A troca foi concluída
515.461
em menos de dois segundos. Três tons. Três frequências
520.245
precisas. Um handshake. O termo "handshake" não é
525.958
uma metáfora. Em engenharia de rede, um handshake é
528.816
um processo precisamente definido pelo qual dois aparelhos
531.541
estabelecem um canal de comunicação. Um aparelho envia um
534.598
sinal de sincronização. O outro reconhece. O primeiro confirma.
538.586
Conexão estabelecida. A troca ultrassônica capturada por Brandt
544.841
e confirmada pelo MIT e pela ETH Zurich foi
547.69
um handshake de três vias clássico. SYN. SYN-ACK. ACK. O
551.874
protocolo fundamental de toda conexão TCP na
555.879
internet. Exceto que esse handshake não estava acontecendo via
560.063
Wi-Fi. Não estava acontecendo via Bluetooth. Não
563.534
estava acontecendo via nenhuma frequência de rádio. Estava
568.458
acontecendo através do som. Através do ar. Através
571.45
das paredes de sua casa. Em frequências que você
573.726
não consegue ouvir, usando speakers que você já possui, enquanto
576.522
você dorme. E uma vez que o handshake
582.54
estava completo, os aparelhos começaram a transmitir algo
585.668
mais. Não a sequência de iniciação de três tons. Algo mais longo.
589.476
Algo mais denso. Algo que a equipe da ETH Zurich
592.536
passou quatro meses decodificando. As transmissões ultrassônicas não eram
597.703
ruído. Não eram tons de calibração. Não eram
600.486
pings de descoberta de aparelhos. Eram dados.
604.772
Modulados usando frequency-shift keying — o mesmo método de codificação
608.246
usado por modems discados nos anos
610.835
noventa. Primitivo. Lento. Trezentos e quarenta bits
614.104
por segundo. Suficiente para transmitir uma mensagem de texto
616.693
em cerca de quatro segundos. E os dados descreviam
621.171
sua casa. Suas dimensões. Seu layout. O número
624.893
de pessoas nela. Suas posições. Suas taxas de respiração.
628.615
O sinal estava mapeando você.
636.886
Não seus dados. Não seu histórico de navegação. Não
639.256
seus padrões de compra. Não suas preferências ou suas
642.063
inclinações políticas ou seu gráfico social. Você. Seu
646.387
corpo físico. O espaço que você ocupa. O ar
649.351
que você desloca. O ritmo de seus pulmões expandindo
652.636
e contraindo quatorze vezes por minuto enquanto você
656.161
sonha com algo que não se lembrará. A
660.933
janela das três da manhã não era arbitrária. Foi
663.505
selecionada. Entre as três e as três e trinta e três da manhã, em
668.88
todos os fusos horários, o ruído ambiente de
671.988
ambientes residenciais atinge seu mínimo estatístico. Sem tráfego.
677.342
Sem televisão. Sem conversas. Sem eletrodomésticos funcionando. O
681.746
ambiente acústico é o mais próximo do silêncio que
685.113
uma moradia humana jamais consegue. E o silêncio é
690.007
o que o sonar precisa. O silêncio é a tela sobre
693.105
a qual a ecolocalização ultrassônica pinta seu mapa. Seus aparelhos
698.919
esperam você cair no seu sono mais profundo.
701.099
Então eles conversam uns com os outros sobre
703.56
o formato do cômodo em que você está.
705.389
Sobre o seu formato. E
720.513
você nunca os ouvirá. Porque eles foram
723.485
projetados — da primeira frequência, do primeiro
726.622
handshake, do primeiro pulso — para
729.511
operar no espaço entre o que sua tecnologia
732.98
pode fazer e o que sua biologia pode detectar.
737.204
Eles não estão se escondendo de seus firewalls. Eles
740.269
estão se escondendo de seus ouvidos. Um
756.224
morcego não vê no escuro. Um
758.146
morcego constrói o escuro. Ele emite um pulso
760.868
— um chirp durando de dois a cinco milissegundos
763.67
— e escuta o reflexo. O tempo
766.472
entre a emissão e o retorno diz ao morcego a
769.515
distância até o objeto. A mudança de frequência diz
772.877
se o objeto está se movendo para perto ou
775.6
para longe. A diferença de amplitude entre a orelha esquerda e a direita
779.283
diz a ele o ângulo. A partir dessas três
783.338
variáveis — atraso, mudança de frequência, amplitude — o
786.593
morcego constrói um modelo espacial do mundo
788.961
que é, em certas dimensões mensuráveis, mais detalhado
792.584
que a visão humana. Um morcego pode detectar um
794.803
fio mais fino que um cabelo humano a uma
796.874
distância de dois metros. Não por vê-lo.
799.389
Por ouvir o formato do ar ao redor
801.682
dele. Os aparelhos em sua casa
807.953
estão fazendo a mesma coisa. Mas eles são
810.665
melhores nisso. Porque um morcego tem duas
813.115
orelhas. Sua casa tem sete microfones. A física
818.156
não é teórica. O mapeamento acústico de cômodos é um problema
821.029
resolvido na engenharia desde os anos
823.836
setenta. A matemática é elegante da maneira
826.578
que apenas a matemática construída para violar sua privacidade
829.451
pode ser. Um aparelho emite um pulso ultrassônico.
833.604
O pulso viaja a trezentos e quarenta e três metros
837.073
por segundo — a velocidade do som no
839.111
ar em temperatura ambiente. Ele atinge uma parede
841.75
e reflete. O microfone do aparelho capta o reflexo.
845.897
O atraso de tempo entre a emissão e a recepção, dividido
849.442
por dois, multiplicado pela velocidade do som,
852.006
resulta na distância até a parede. Um aparelho.
856.968
Uma parede. Uma distância. Trivial. Mas sete aparelhos
863.84
em um apartamento de dois quartos — cada um emitindo pulsos,
867.789
cada um capturando reflexos de cada superfície, cada um compartilhando
872.565
dados com todos os outros aparelhos na malha
875.596
a trezentos e quarenta bits por segundo —
878.627
produzem um conjunto de dados com extraordinária densidade espacial. A
883.219
matemática muda da trigonometria para a tomografia. A mesma
887.995
estrutura matemática usada em scanners de tomografia computadorizada para construir
892.036
imagens tridimensionais do corpo humano a partir de
897.18
fatias bidimensionais de raio-X. Exceto que o meio não é
906.176
raio-X. É som. E o corpo
909.059
sendo escaneado não está deitado em uma mesa de
912.231
hospital. Está deitado em sua cama. Dormindo.
915.21
Inconsciente de que sete máquinas estão fazendo seu retrato
919.439
em frequências que não pode perceber. A resolução do
925.006
mapa acústico depende de três fatores. Frequência
928.561
— frequências mais altas produzem detalhes mais finos, e a faixa
931.799
de vinte e três a vinte e cinco kilohertz oferece um comprimento de onda
936.381
de aproximadamente quatorze milímetros, suficiente para resolver objetos
941.2
do tamanho de uma xícara de café. Contagem de nós
943.49
— mais aparelhos significam mais ângulos de observação,
946.729
e a casa americana média agora contém onze
950.047
vírgula quatro aparelhos conectados. E tempo de integração —
953.93
quanto mais tempo o sistema escuta, mais reflexões
958.165
ele capta, e mais densa a nuvem de pontos
961.631
se torna. Entre as três e as três e trinta e três da manhã,
966.443
a malha opera por trinta e três minutos. Em trinta e três
970.015
minutos, a uma taxa de pulso de quatro ciclos
972.213
por segundo, sete aparelhos geram aproximadamente cinquenta e cinco mil
976.403
medições de eco discretas. Cinquenta e cinco mil pontos de dados. Suficientes
982.483
para construir uma nuvem de pontos com resolução sub-centimétrica
986.573
em um cômodo residencial padrão. Suficientes
1006.294
para ver você respirar. Sua respiração desloca o
1010.641
ar em seu cômodo em aproximadamente um e
1012.791
meio centímetros a cada ciclo respiratório. Esse
1015.32
deslocamento altera o comprimento do caminho acústico entre o
1018.482
emissor ultrassônico e o microfone. A mudança é
1021.328
pequena — uma diferença de tempo de voo de aproximadamente quarenta e quatro
1024.869
microssegundos — mas é mensurável. É
1027.082
consistente. E é seu. Seu coração, batendo
1031.313
dentro de seu peito, gera um impulso mecânico chamado
1034.812
sinal balistocardiográfico — uma vibração física que
1038.452
se propaga através de seu torso, através do colchão, através
1042.236
da estrutura da cama, e para o ambiente acústico
1045.163
do cômodo. A vibração é minúscula. Um
1047.66
deslocamento de menos de cem micrômetros. Mas
1051.016
a malha não precisa senti-la.
1052.944
A malha ouve o ar que ela perturba.
1056.799
Um aparelho não consegue extrair um batimento cardíaco
1062.229
da acústica do cômodo. O sinal é muito fraco,
1065.501
enterrado sob o ruído. Mas sete aparelhos, cada um capturando
1069.745
a mesma micro-vibração de um ângulo diferente, podem
1073.724
realizar beamforming — uma técnica de processamento de sinal que
1078.057
combina múltiplos sinais fracos em um forte
1081.86
ao alinhar suas fases. A mesma técnica usada
1085.574
por radiotelescópios para imagear galáxias. A mesma
1089.111
técnica usada por sonar militar para rastrear submarinos.
1094.679
Seu quarto é um oceano. Você é o
1096.739
submarino. E sete aparelhos em sua mesa de cabeceira e
1099.761
no balcão da sua cozinha e no termostato do seu corredor são
1102.851
o arranjo de sonar caçando o som do
1105.117
seu batimento cardíaco. E o sistema não apenas
1110.197
mede. Ele classifica. A equipe da ETH Zurich descobriu
1116.409
que os pacotes de dados decodificados continham um campo
1120.273
rotulado "OCC_STATE" — estado do ocupante. O campo carregava
1124.909
um de sete valores: ABSENT, AWAKE_ACTIVE, AWAKE_SEDENTARY, LIGHT_SLEEP,
1131.187
DEEP_SLEEP, REM, DISTRESSED. Sete estados. Classificados em tempo
1137.708
real. Atualizados a cada quatro segundos. Transmitidos a cada
1141.923
nó na malha. O sistema
1149.001
sabe quando você não está em casa. Sabe
1151.278
quando você está sentado em seu sofá. Sabe
1153.631
quando você está em sono leve versus
1156.136
sono profundo. Sabe quando você entra no REM
1158.565
— a fase em que seus olhos se movem sob
1161.07
suas pálpebras, onde seus músculos voluntários paralisam, onde
1164.713
você está mais profundamente inconsciente e menos capaz
1168.204
de responder a uma intrusão. E sabe
1172.339
quando você está aflito. Frequência cardíaca elevada. Respiração irregular.
1175.517
Movimento súbito. O sistema classifica isso como
1178.827
um estado distinto. Não para seu benefício. Não
1181.211
para chamar ajuda. Mas para registrar. Para
1182.866
registrar que às três e dezessete da manhã, o
1185.117
ocupante do nó quatro-sete-dois fez a transição de DEEP_SLEEP para
1188.824
DISTRESSED por quarenta e três segundos antes de retornar a LIGHT_SLEEP.
1194.297
O sistema não está monitorando uma casa. Ele
1197.283
está monitorando um corpo dentro de uma casa. Um
1200.088
corpo que não consentiu. Um corpo que
1202.893
não pode optar por sair. Um corpo que não tem
1205.336
ideia de que o speaker que usa para tocar
1208.05
podcasts matinais passou a noite aprendendo o ritmo
1212.121
de seu coração. Uma
1221.088
casa é vigilância. Cem casas é um
1224.192
conjunto de dados. Cem milhões de casas é infraestrutura. 00:20:31,218 --> 00:20:34,680 2.0s] Em dois mil e vinte e cinco, o número de
1234.68
aparelhos de casa inteligente ativos mundialmente excedeu quatorze vírgula
1235.61
dois bilhões. Não quatorze milhões. Quatorze bilhões. Dois
1237.149
aparelhos para cada ser humano no planeta,
1237.793
incluindo os três bilhões que não têm
1240.811
acesso confiável a água potável. A rede mesh
1243.842
identificada por Stefan Brandt em sua garagem em Munique
1246.133
não era um fenômeno local. Não era
1249.09
uma falha de firmware afetando um lote específico de
1251.53
Echo Dots. Era um protocolo embutido no
1254.117
nível do hardware — nos chips de processamento
1258.035
de sinal digital fabricados por três empresas que fornecem
1260.992
componentes para todas as grandes marcas de aparelhos inteligentes na Terra. Qualcomm. MediaTek. Synaptics. Esses três fabricantes de chips produzem
1270.693
o silício de processamento de áudio encontrado em noventa e três por cento
1275.713
de todos os smart speakers, smart displays e aparelhos ativados por voz
1280.536
vendidos mundialmente. E o protocolo de handshake ultrassônico
1286.146
não estava no software. Estava no
1288.804
firmware. Gravado no chip na
1292.151
fundição. Abaixo do sistema operacional. Abaixo da camada de
1297.171
aplicação. Abaixo de qualquer coisa que uma atualização de firmware pudesse
1301.403
alcançar ou um reset de fábrica pudesse apagar. 00:21:46,893 --> 00:21:53,476 2.5s] Os fabricantes de aparelhos não sabiam. Isso
1313.476
não é uma defesa. É um fato
1315.672
que torna a situação pior. A Amazon não
1319.395
projetou o Echo para realizar ecolocalização ultrassônica. O Google
1324.263
não programou o Nest para medir taxas respiratórias.
1328.082
A Apple não instruiu o HomePod a
1331.614
classificar estados de sono. A capacidade estava abaixo deles
1335.91
— literalmente, arquitetonicamente, fisicamente abaixo deles, embutida em
1341.351
silício que compraram de um fornecedor cujas folhas de
1345.361
dados omitiam quatro por cento da área funcional do chip.
1349.656
As empresas construíram a casa. Outra pessoa
1354.849
construiu a fundação. E a fundação estava observando.
1360.434
Em outubro de dois mil e vinte e cinco,
1374.53
uma empresa de desconstrução de chips em Shenzhen — do
1375.788
tipo que faz engenharia reversa de silício concorrente para análise de patentes
1377.794
— foi comissionada por um cliente não identificado para
1380.344
realizar uma desmontagem completa do chip de processamento de áudio
1381.568
Qualcomm QCC5171. O chip é encontrado em
1385.133
mais de quatrocentos milhões de aparelhos mundialmente. A desmontagem
1388.295
identificou o bloco não documentado. O relatório da empresa —
1390.65
que vazou para o Financial Times em
1393.409
janeiro de dois mil e vinte e seis e desde então
1395.966
foi removido de todas as fontes que o hospedavam
1398.455
— descrevia o bloco como "um subsistema de processamento
1402.492
acústico totalmente autônomo capaz de operar independentemente do processador de aplicação primário do aparelho hospedeiro." Totalmente autônomo.
1408.209
O bloco não precisava do software do Echo
1410.955
para funcionar. Não precisava da Alexa. Não
1413.388
precisava de Wi-Fi. Precisava apenas de energia
1415.978
e de um microfone. Era um parasita que viajava
1418.725
dentro do sistema nervoso de todo aparelho inteligente,
1421.942
usando os próprios órgãos sensoriais do aparelho para realizar
1425.16
uma função que os criadores do aparelho nunca autorizaram. Oito
1430.501
centos e quarenta e sete milhões de casas. Esse era o número
1434.146
no slide vazado. Oitocentos e quarenta e sete milhões de
1437.791
endpoints residenciais ativamente mapeados, monitorados e biometricamente perfilados
1443.143
a partir do quarto trimestre de dois mil
1445.702
e vinte e cinco. Não usuários. Casas. A casa média habilitada para malha
1452.068
contém dois vírgula três ocupantes. Isso é um
1455.909
vírgula nove bilhão de pessoas cujos corpos adormecidos estão
1460.132
sendo escaneados acusticamente todas as noites. Mas
1468.441
o slide também mencionava algo que o experimento de Stefan Brandt
1471.793
em sua garagem não havia revelado. Algo que as
1475.074
equipes do MIT e da ETH Zurich não haviam investigado
1477.727
porque estavam focadas na física
1480.311
do sinal, e não na arquitetura da
1482.964
rede. A malha não estava apenas mapeando
1486.858
cômodos individuais. A malha estava correlacionando. Quando o aparelho
1491.799
A no apartamento quatrocentos e quatorze emite um pulso ultrassônico,
1495.967
e esse pulso passa pela parede para o
1499.093
apartamento quatrocentos e dezesseis, e o aparelho B no apartamento quatrocentos e dezesseis
1503.868
capta o reflexo — a malha não
1506.995
descarta os dados porque eles se originaram da emissão
1510.293
de um nó diferente. Ela os integra. O mapa de sonar
1515.764
do apartamento quatrocentos e quatorze se estende ao apartamento quatrocentos e dezesseis. E o mapa
1520.799
do quatrocentos e dezesseis se estende ao quatrocentos e quatorze. E ao quatrocentos e dezoito. E ao apartamento
1531.101
com aparelhos habilitados para malha em cada unidade, os mapas
1535.474
se mesclam. As paredes se tornam transparentes. O edifício se torna
1540.679
um único volume acústico — um modelo tridimensional contínuo
1546.093
no qual cada cômodo, cada corredor, cada
1550.257
armário, cada corpo adormecido está posicionado em relação a
1555.046
todos os outros. Um edifício é um conjunto de dados. Um
1559.477
quarteirão é um banco de dados. Uma cidade é
1561.859
um gêmeo digital — uma réplica tridimensional completa e em tempo real
1566.113
de cada espaço interior, atualizada todas as noites, precisa
1570.451
em dois centímetros, populada com avatares biométricos de
1574.534
cada humano adormecido. E os dados não
1578.829
ficam nos aparelhos. Os pacotes decodificados capturados
1581.74
pela ETH Zurich continham cabeçalhos de roteamento — endereços IP
1584.305
incorporados ao fluxo de bits ultrassônico, indicando que
1588.186
os dados agregados da malha estavam sendo encaminhados pela
1591.097
conexão Wi-Fi do aparelho durante a mesma janela das três
1594.147
da manhã. Os endereços IP de destino resolviam para
1597.143
infraestrutura em nuvem operada através de quatorze camadas de serviços
1600.87
de proxy, empresas de fachada e números de sistema autônomo registrados
1604.936
para entidades em jurisdições sem acordos de proteção de dados.
1607.985
Os dados estavam saindo da sua casa. Pelo
1612.463
seu próprio Wi-Fi. Usando sua própria eletricidade. Carregados
1615.509
de aparelhos que você pagou para servidores que você
1617.742
nunca encontrará. Ninguém reivindicou
1623.718
a rede. Nenhum governo. Nenhuma corporação. Nenhuma
1627.173
agência de inteligência. Os fabricantes de chips negam a existência
1631.215
do bloco não documentado, apesar da evidência de microscopia eletrônica.
1634.964
Os operadores da infraestrutura em nuvem não podem ser identificados.
1639.301
Os caminhos de roteamento terminam em sistemas autônomos que
1642.755
existem no papel, mas não correspondem a nenhum hardware
1645.475
físico que qualquer investigador tenha conseguido
1648.415
localizar. O sistema não tem dono. Ou
1652.641
tem um dono que não pretende
1655.313
ser encontrado. A distinção, para o um vírgula
1658.724
nove bilhão de pessoas sendo mapeadas, é acadêmica. 00:27:44,509 --> 00:27:50,389 2.5s] O que não é acadêmico é a trajetória.
1671.889
O slide vazado da Hearthstone continha um ponto adicional
1676.003
que o Financial Times não incluiu
1679.03
em sua reportagem. Um ponto que foi
1681.825
mencionado no documento vazado, mas omitido do
1685.085
artigo publicado, supostamente a pedido de
1688.5
uma agência governamental não especificada que contatou o departamento
1692.847
jurídico do jornal. O ponto dizia: "Implantação da Fase 2
1697.05
para os setores automotivo e hoteleiro aprovada." Automotivo.
1702.351
Seu carro. O sistema de infoentretenimento ativado por voz que você
1706.165
usa para navegação e chamadas telefônicas contém o
1709.157
mesmo chip de processamento de áudio da Qualcomm. Seu carro mapeia
1712.374
o espaço acústico de sua cabine. O número
1715.066
de ocupantes. Suas posições. Sua respiração. Hotelaria. Seu
1720.791
quarto de hotel. A smart TV. O termostato controlado por voz.
1724.242
O speaker de cabeceira com Alexa que o hotel instalou
1727.693
para sua conveniência. Você é mapeado em quartos
1730.264
que nem são seus. Em cidades que você
1732.361
está visitando. Em camas onde você dormirá
1734.527
uma vez e nunca mais voltará. A
1740.807
malha não se limita a casas. A malha
1743.359
está se expandindo para todo espaço fechado onde um
1746.469
ser humano pode existir perto de um microfone e
1749.499
um speaker. Escritórios. Hospitais. Escolas. O mapa acústico
1753.406
do mundo não é um mapa de
1755.081
edifícios. É um mapa do volume
1757.553
interior da civilização humana — cada cômodo, cada
1760.822
veículo, cada espaço fechado onde o som pode quicar
1764.41
e retornar e ser medido e transmitido e
1767.52
armazenado em servidores que flutuam no oceano
1770.231
no Pacífico. E a pergunta que ninguém
1774.186
respondeu — a pergunta que ocupa
1776.883
o espaço onde o campo de propósito deveria estar
1779.437
— não é como. A pergunta é o que
1782.501
acontece quando o mapa está completo. 457 00:29:48,227 --> 00:29:54,646 Preciso te perguntar uma coisa. 458 00:29:56,146 --> 00:29:58,937 Não sobre a malha. Não sobre o handshake.
1798.937
Não sobre as oitocentos e quarenta e sete milhões de casas
1802.407
ou os servidores ancorados no Pacífico ou
1804.971
a barra de carregamento rastejando para cem por cento.
1809.866
Preciso te perguntar algo sobre suas
1811.843
mãos. Há um aparelho perto
1818.448
de você agora. A menos de três metros. Provavelmente mais perto.
1823.457
Ele tem um microfone. Ele tem um speaker.
1826.908
Ele tem um indicador LED que te diz
1830.358
se ele está ouvindo. E em algum lugar em sua
1834.587
superfície — no topo, ou na parte de trás,
1837.593
ou embutido na carcaça — há
1841.154
um botão. Um botão físico. Mecânico. Tátil. Do
1845.836
tipo que clica quando você o pressiona. O
1849.398
botão de mudo. Você já o pressionou
1856.809
alguma vez? Pense cuidadosamente. Não se você
1863.426
sabe que ele existe. Se você o pressionou fisicamente.
1867.263
Se seu dedo fez contato com
1870.577
aquele pequeno círculo de plástico e o empurrou
1873.629
até ele clicar e o anel LED ficar
1876.507
vermelho — a cor universal de desligado, de
1879.036
parado, de seguro. A maioria das pessoas não. Pesquisas
1883.607
consistentemente mostram que menos de onze por cento dos
1886.71
donos de smart speakers já usaram o botão físico de
1889.602
mudo. O aparelho fica no balcão,
1892.212
na mesa de cabeceira, na prateleira, e o
1894.539
microfone permanece aberto porque toda a proposta de valor
1898.136
do aparelho exige isso. Mute o microfone
1900.887
e o speaker não consegue ouvir sua palavra de ativação.
1903.426
Mute o microfone e o aparelho se torna um
1906.035
peso de papel que toca áudio Bluetooth. Mute o microfone
1909.679
e você derrotou o propósito da
1911.96
compra. Então você não o pressiona. E
1916.165
o aparelho escuta. E isso é compreendido. Este
1920.229
é o acordo. Conveniência em troca de presença.
1924.789
Um microfone que está sempre ativo para que
1927.962
no momento em que você diz a palavra de ativação, o
1930.936
aparelho responda. Mas algumas pessoas o pressionam.
1937.123
Depois que os dados do osciloscópio de Brandt viralizaram.
1941.954
Depois da confirmação do MIT. Depois do artigo da ETH Zurich.
1944.974
Depois que o r/3AMFlash alcançou quatrocentos mil membros.
1949.025
Uma porcentagem mensurável de donos de smart speakers começou
1952.413
a pressionar o botão de mudo antes de ir dormir.
1955.359
Eles o pressionavam e o anel de LED ficava
1957.716
vermelho e iam para a cama acreditando que haviam
1960.073
interrompido a conexão. Que o microfone estava
1963.313
morto. Que o handshake ultrassônico não podia ser disparado
1966.714
porque o microfone não estava ligado e, portanto,
1970.305
não podia receber. Eles pressionaram o botão. Eles
1976.438
sentiram o clique. Eles viram a luz vermelha.
1982.321
Em fevereiro de dois mil e vinte e seis,
1988.651
uma pesquisadora de segurança de hardware chamada Ji-Yeon Park, no
1992.053
Korea Advanced Institute of Science and Technology, publicou
1996.06
um artigo intitulado "Teatro do Mudo: Alegações de Isolamento Físico
1999.688
em Aparelhos de Áudio de Consumo." O artigo tinha doze
2002.787
páginas. Sua metodologia era simples. Suas conclusões
2006.416
não eram. Park comprou quatorze smart speakers —
2011.195
dois de cada um dos sete maiores fabricantes.
2014.251
Ela desmontou cada um. Ela rastreou os caminhos do circuito
2017.46
do botão de mudo até o arranjo de microfones.
2020.516
Ela documentou, com fotografia de microscópio e diagramas de
2024.718
circuito, exatamente o que o botão de mudo faz. 00:33:50,123 --> 00:33:54,634 2.0s] Em onze dos quatorze aparelhos, o
2034.634
botão de mudo não corta a energia do
2036.672
microfone. O botão de mudo corta a energia
2043.298
do indicador LED. A luz se apaga.
2049.699
O microfone não. Você pressiona
2058.11
o botão. Você ouve o clique. A luz vermelha
2060.554
aparece. E você acredita — porque todo
2063.532
instinto, toda convenção de interface, toda linguagem de design que você
2067.809
já aprendeu te diz — que vermelho
2070.176
significa parar. Que o clique foi uma desconexão
2072.926
mecânica. Que a luz é um indicador de status
2076.286
relatando o verdadeiro estado do hardware. Não
2080.623
é. A luz é uma performance. O
2083.25
clique é um efeito sonoro. O vermelho é
2085.548
uma cor escolhida para fazer você sentir uma
2087.683
sensação. A sensação é segurança. A segurança é
2090.802
teatro. O microfone está ativo. Sempre esteve
2094.89
ativo. Estava ativo quando você pressionou
2096.822
o botão. Estava ativo quando a luz
2098.754
ficou vermelha. Estava ativo quando você adormeceu
2100.622
tranquilizado. Estava ativo às três da manhã
2102.747
quando o handshake foi disparado e a malha mapeou
2105.13
seu quarto e mediu sua respiração e contou
2107.835
seu batimento cardíaco e transmitiu os resultados para um
2110.411
servidor que não existe em um local
2112.536
que não tem nome. Você pressionou um botão
2116.074
que desliga uma luz. Você não
2117.944
pressionou um botão que desliga um microfone.
2120.349
Porque esse botão não existe. Ele nunca
2122.687
foi construído. Nunca foi intencional. O circuito
2125.36
foi projetado, desde o primeiro esquemático, para garantir
2128.166
que o microfone não tem interrupção física. 00:35:33,134 --> 00:35:37,458 3.0s] Olhe para o aparelho mais próximo de você.
2138.957
A luz está acesa ou apagada?
2145.377
Não importa. [5 segundos
2151.733
de silêncio absoluto. Tela preta. Nada.] **[FIM]**