0.0
I tuoi dispositivi stanno ascoltando. Questo non è
8.053
una metafora. Questo non è un riassunto
10.126
della politica sulla privacy. Questa non è una conversazione su
12.957
pubblicità mirata o raccolta di dati o l'astratto
16.27
disagio di sapere che un microfono esiste nella
19.171
tua cucina. I tuoi dispositivi si stanno ascoltando
23.769
a vicenda. Il sette marzo duemilaventicinque,
40.463
un utente sul subreddit dell'automazione domestica
44.104
ha pubblicato un messaggio di diciassette parole che alla fine sarebbe stato
48.069
visualizzato oltre quattro milioni di volte. Il nome utente era
51.387
thermostat_dave. Il post recitava: "Ogni notte esattamente
55.271
alle 3 del mattino, l'anello luminoso del mio Echo Dot lampeggia
57.779
di blu per meno di un secondo. Nessuna parola di
60.126
attivazione rilevata." Il post ha ricevuto undici risposte nella
65.201
prima ora. Nove di queste dicevano la
67.644
stessa cosa. Anche il mio. Entro settantadue ore, la
75.064
discussione aveva generato un megathread. Entro una settimana,
78.887
il megathread aveva generato un subreddit. Entro un
82.8
mese, il subreddit — r/3AMFlash — contava novantaquattro
86.804
mila membri. E i rapporti non erano limitati
90.718
ai dispositivi Amazon Echo. Google Nest Hub. Apple
96.36
HomePod. Sonos One. Samsung SmartThings. Xiaomi Mi Speaker.
102.714
Ogni principale marca di smart speaker. Ogni generazione. Ogni
108.702
versione firmware. Il comportamento era identico per tutti
114.53
loro. Una breve attivazione — tipicamente tra
117.497
zero virgola tre e zero virgola otto secondi
120.316
— che si verificava tra le tre e le tre e trentatré
123.579
del mattino. Nessuna parola di attivazione registrata. Nessun comando vocale
126.101
registrato. Nessuna voce nella cronologia delle attività del dispositivo.
129.439
L'unica prova era visiva: una breve illuminazione
132.628
dell'indicatore LED del dispositivo. E un ulteriore
136.981
dettaglio che la comunità impiegò quattro mesi per
139.177
scoprire. Le attivazioni erano sincronizzate. Un
148.561
ingegnere elettrico di Monaco di Baviera, Stefan Brandt, fu
152.491
il primo a dimostrarlo. Brandt aveva posizionato
155.311
quattro diversi smart speaker — un Echo, un
158.301
Nest, un HomePod e un Sonos — nella
160.522
stessa stanza, ciascuno collegato a un separato
163.598
oscilloscopio che monitorava l'assorbimento di energia a livello del circuito del microfono.
168.126
Ha fatto funzionare la configurazione per trenta notti consecutive.
171.458
Ogni singola notte, tutti e quattro i dispositivi si
175.58
attivavano entro la stessa finestra di trecento millisecondi. Non in sequenza
179.812
— prima l'Echo, poi il Nest, poi
181.652
gli altri. Contemporaneamente. Quattro dispositivi di quattro diversi
184.903
produttori, che eseguono quattro diversi sistemi operativi, collegati a
188.706
quattro diversi servizi cloud, che si attivano nello stesso
191.528
momento come se rispondessero allo stesso segnale.
195.236
Brandt pubblicò i dati del suo oscilloscopio. I timestamp
202.247
sovrapposti. Curve di assorbimento di potenza sincronizzate al millisecondo.
206.627
I dati erano inequivocabili. I dispositivi non si
209.85
attivavano autonomamente. Venivano attivati. Da qualcosa di
214.643
esterno. Qualcosa che tutti potevano sentire. La domanda
219.985
consumò la comunità. Se i dispositivi rispondevano
224.045
a un segnale esterno, qual era il segnale?
227.154
Da dove proveniva? E perché nessuno poteva
229.918
sentirlo? Brandt estese il suo esperimento.
234.938
Aggiunse un microfono a condensatore di livello professionale alla
239.373
stanza — un Neumann U 87, il tipo
241.501
usato negli studi di registrazione, abbastanza sensibile da catturare
245.67
uno spillo che cade a trenta metri. Registrò
248.951
continuamente per tutta la notte. Non sentì nulla. Nessun
256.163
suono anomalo. Nessuna interferenza. Nessun segnale di alcun
259.353
tipo nello spettro udibile. Alle tre del mattino,
261.95
i microfoni sugli smart speaker si attivavano. Il
265.288
Neumann catturò il silenzio. Il segnale non
272.374
era nello spettro udibile. Non
278.608
poteva sentirlo perché non era mai
280.371
stato pensato per lui. Brandt prese in prestito un
286.597
Earthworks QTC fifty — un microfono di misura con
289.533
una risposta in frequenza piatta fino a cinquantamila hertz,
292.208
utilizzato per test acustici di sale da concerto e
294.752
ambienti industriali. Lo accoppiò con un'interfaccia audio
297.622
che campionava a centonovantadue kilohertz, catturando
301.406
frequenze ben oltre i limiti della percezione umana.
305.973
E li trovò. Tre segnali. Precisi, artificiali,
310.66
che si ripetevano in un ciclo di quattro secondi. Ventitremilaquattrocento
316.88
hertz. Ventiquattromila cento hertz. Ventiquattromila
321.373
ottocento hertz. Tre toni ultrasonici, ciascuno
326.656
che durava circa quattrocento millisecondi, distanziati esattamente di settecento
331.13
hertz l'uno dall'altro, trasmettendo in un pattern che
334.305
non assomigliava in alcun modo a rumore, interferenza o qualsiasi
337.408
fonte ambientale conosciuta. I segnali non
344.316
provenivano dall'esterno della stanza. Non erano
346.642
fughe da apparecchiature di un vicino. Non erano
349.419
artefatti di interferenza elettromagnetica. Venivano
354.759
emessi dagli smart speaker. I dispositivi non
359.549
stavano ascoltando un segnale esterno. I dispositivi
362.591
erano il segnale. Ogni smart speaker emetteva
365.632
toni ultrasonici attraverso il proprio driver dello speaker —
368.747
frequenze troppo alte per l'udito umano ma ben
371.714
all'interno del range operativo dei microfoni MEMS
374.904
installati in ogni dispositivo smart prodotto dopo il
378.39
duemiladiciotto. Gli altoparlanti parlavano. Tra
383.13
loro. In un linguaggio progettato per essere inudibile
385.723
agli umani che dormivano a tre metri di distanza. Il primo
390.24
istinto di Brandt fu di supporre che si trattasse di qualche
392.992
forma di protocollo di scoperta dei dispositivi — un sistema di rilevamento
396.137
di prossimità utilizzato dalle piattaforme smart home per
399.36
identificare dispositivi vicini per il trasferimento o la sincronizzazione audio multi-stanza.
403.134
Tali protocolli esistono. AirPlay di Apple utilizza qualcosa di
408.009
concettualmente simile. Ma i protocolli di scoperta dei dispositivi sono documentati.
412.804
Sono registrati. Appaiono nei changelog del firmware
416.578
e nella documentazione SDK. Brandt cercò. Lesse ogni
421.829
specifica tecnica disponibile per ogni dispositivo nel suo
426.017
array di test. Presentò richieste FOIA alla
429.033
FCC per le certificazioni di emissioni RF e acustiche
432.803
di ogni dispositivo. Contattò i dipartimenti di relazioni con gli sviluppatori
436.572
di Amazon, Google, Apple e Sonos. Nessuno
441.843
di loro documentava un'emissione ultrasonica a ventitremila
445.01
quattrocento hertz. O qualsiasi emissione ultrasonica
448.05
in assoluto. La risposta ufficiale di
455.26
ogni produttore era identica nella sostanza: i nostri dispositivi
458.697
non fanno questo. Ma l'oscilloscopio di Brandt diceva
461.326
il contrario. E poi altri ricercatori iniziarono a replicare
464.628
i suoi risultati. Un laboratorio di acustica al MIT confermò
468.813
i segnali utilizzando un test in camera anecoica —
471.476
eliminando tutte le possibili fonti ambientali. I toni ultrasonici
475.867
provenivano dai driver degli altoparlanti stessi. Un
480.102
team dell'ETH Zurigo andò oltre. Catturarono
482.961
le emissioni ultrasoniche da due dispositivi posizionati in
486.186
stanze separate dello stesso appartamento. Le emissioni
489.41
non erano identiche. Erano complementari. 123 00:08:16,209 --> 00:08:19,943 Il Dispositivo A emetteva un tono. Il Dispositivo B, dopo aver
499.943
ricevuto quel tono attraverso il suo microfono, rispondeva con
505.893
un tono diverso. Il Dispositivo A riceveva la risposta
510.677
ed emetteva un terzo tono. Lo scambio si completava
515.461
in meno di due secondi. Tre toni. Tre precise
520.245
frequenze. Un handshake. Il termine "handshake" non è
525.958
una metafora. Nell'ingegneria di rete, un handshake è
528.816
un processo precisamente definito con cui due dispositivi
531.541
stabiliscono un canale di comunicazione. Un dispositivo invia un
534.598
segnale di sincronizzazione. L'altro conferma la ricezione. Il primo conferma.
538.586
Connessione stabilita. Lo scambio ultrasonico catturato da Brandt
544.841
e confermato da MIT ed ETH Zurigo era
547.69
un classico handshake a tre vie. SYN. SYN-ACK. ACK. Il
551.874
protocollo fondamentale di ogni connessione TCP su internet.
555.879
Solo che questo handshake non avveniva via
560.063
Wi-Fi. Non avveniva via Bluetooth. Non
563.534
avveniva su nessuna frequenza radio. Stava
568.458
accadendo tramite il suono. Attraverso l'aria. Attraverso
571.45
le pareti della tua casa. A frequenze che tu
573.726
non puoi sentire, usando altoparlanti che già possiedi, mentre
576.522
dormi. E una volta completato l'handshake,
582.54
i dispositivi iniziarono a trasmettere qualcos'altro.
585.668
Non la sequenza di iniziazione a tre toni. Qualcosa di più lungo.
589.476
Qualcosa di più denso. Qualcosa che il team dell'ETH Zurigo
592.536
impiegò quattro mesi a decodificare. Le trasmissioni ultrasoniche non
597.703
erano rumore. Non erano toni di calibrazione. Non
600.486
erano ping di scoperta di dispositivi. Erano dati.
604.772
Modulati usando la modulazione a spostamento di frequenza (FSK) — lo stesso metodo di codifica
608.246
usato dai modem dial-up negli anni novanta.
610.835
Primitivo. Lento. Trecentoquaranta bit
614.104
al secondo. Abbastanza per trasmettere un messaggio di testo
616.693
in circa quattro secondi. E i dati descrivevano
621.171
la tua casa. Le sue dimensioni. La sua disposizione. Il numero
624.893
di persone al suo interno. Le loro posizioni. La loro frequenza respiratoria.
628.615
Il segnale ti stava mappando.
636.886
Non i tuoi dati. Non la tua cronologia di navigazione. Non
639.256
i tuoi schemi di acquisto. Non le tue preferenze o le tue
642.063
inclinazioni politiche o il tuo grafo sociale. Tu. Il tuo
646.387
corpo fisico. Lo spazio che occupi. L'aria
649.351
che sposti. Il ritmo dei tuoi polmoni che si espandono
652.636
e si contraggono quattordici volte al minuto mentre tu
656.161
sogni qualcosa che non ricorderai. La
660.933
finestra delle tre del mattino non era arbitraria. Era
663.505
stata selezionata. Tra le tre e le tre e trentatré del mattino, in
668.88
ogni fuso orario, il rumore di fondo ambientale degli
671.988
ambienti residenziali raggiunge il suo minimo statistico. Nessun traffico.
677.342
Nessuna televisione. Nessuna conversazione. Nessun elettrodomestico in funzione. L'
681.746
ambiente acustico è il più vicino al silenzio che una
685.113
dimora umana possa mai raggiungere. E il silenzio è
690.007
ciò di cui il sonar ha bisogno. Il silenzio è la tela su
693.105
cui l'ecolocalizzazione ultrasonica dipinge la sua mappa. I tuoi dispositivi
698.919
aspettano che tu cada nel tuo sonno più profondo.
701.099
Poi parlano tra loro della
703.56
forma della stanza in cui ti trovi.
705.389
Della tua forma. E
720.513
non li sentirai mai. Perché sono stati
723.485
progettati — dalla prima frequenza, dal primo
726.622
handshake, dal primo impulso — per
729.511
operare nello spazio tra ciò che la tua tecnologia
732.98
può fare e ciò che la tua biologia può rilevare.
737.204
Non si nascondono dai tuoi firewall. Si
740.269
nascondono dalle tue orecchie. Un
756.224
pipistrello non vede nel buio. Un
758.146
pipistrello costruisce il buio. Emette un impulso
760.868
— un cinguettio che dura da due a cinque millisecondi
763.67
— e ascolta il riflesso. Il tempo
766.472
tra emissione e ritorno dice al pipistrello la
769.515
distanza dall'oggetto. Lo spostamento di frequenza gli dice
772.877
se l'oggetto si sta muovendo verso o
775.6
via. La differenza di ampiezza tra l'orecchio sinistro e destro
779.283
gli dice l'angolo. Da queste tre
783.338
variabili — ritardo, spostamento di frequenza, ampiezza — il
786.593
pipistrello costruisce un modello spaziale del mondo
788.961
che è, in certe dimensioni misurabili, più dettagliato
792.584
della visione umana. Un pipistrello può rilevare un
794.803
filo più sottile di un capello umano a una
796.874
distanza di due metri. Non vedendolo.
799.389
Ascoltando la forma dell'aria attorno ad
801.682
esso. I dispositivi nella tua casa
807.953
stanno facendo la stessa cosa. Ma sono
810.665
più bravi. Perché un pipistrello ha due
813.115
orecchie. La tua casa ha sette microfoni. La fisica
818.156
non è teorica. La mappatura acustica delle stanze è stata
821.029
un problema risolto in ingegneria dagli anni
823.836
settanta. La matematica è elegante nel modo
826.578
in cui solo la matematica creata per violare la tua privacy
829.451
può essere. Un dispositivo emette un impulso ultrasonico.
833.604
L'impulso viaggia a trecentoquarantatré metri
837.073
al secondo — la velocità del suono nell'
839.111
aria a temperatura ambiente. Colpisce una parete
841.75
e riflette. Il microfono del dispositivo cattura il riflesso.
845.897
Il ritardo temporale tra emissione e ricezione, diviso
849.442
per due, moltiplicato per la velocità del suono,
852.006
produce la distanza dalla parete. Un dispositivo.
856.968
Una parete. Una distanza. Banale. Ma sette dispositivi
863.84
in un appartamento con due camere da letto — ciascuno che emette impulsi,
867.789
ciascuno che cattura riflessi da ogni superficie, ciascuno che condivide
872.565
dati con ogni altro dispositivo nella rete
875.596
a trecentoquaranta bit al secondo —
878.627
produce un dataset con una densità spaziale straordinaria. La
883.219
matematica si sposta dalla trigonometria alla tomografia. Lo stesso
887.995
framework matematico usato nelle TAC per costruire
892.036
immagini tridimensionali del corpo umano da sezioni
897.18
bidimensionali di raggi X. Solo che il mezzo non sono
906.176
raggi X. È il suono. E il corpo
909.059
che viene scansionato non giace su un letto
912.231
d'ospedale. Giace nel suo letto. Addormentato.
915.21
Inconsapevole che sette macchine stanno scattando il suo ritratto
919.439
in frequenze che non può percepire. La risoluzione della
925.006
mappa acustica dipende da tre fattori. Frequenza
928.561
— frequenze più alte producono dettagli più fini, e il range
931.799
di ventitré-venticinque kilohertz fornisce una lunghezza d'onda
936.381
di circa quattordici millimetri, sufficiente per risolvere oggetti
941.2
delle dimensioni di una tazza da caffè. Numero di nodi
943.49
— più dispositivi significano più angoli di osservazione,
946.729
e la casa americana media ora contiene undici
950.047
virgola quattro dispositivi connessi. E tempo di integrazione —
953.93
più a lungo il sistema ascolta, più riflessioni
958.165
cattura, e più densa diventa la nuvola di punti.
961.631
Tra le tre e le tre e trentatré del mattino,
966.443
la rete mesh opera per trentatré minuti. In trentatré
970.015
minuti, con una frequenza di impulsi di quattro cicli
972.213
al secondo, sette dispositivi generano circa cinquantacinque mila
976.403
misurazioni di eco discrete. Cinquantacinque mila punti dati. Abbastanza
982.483
per costruire una nuvola di punti con risoluzione sub-centimetrica
986.573
in una stanza residenziale standard. Abbastanza
1006.294
per vederti respirare. Il tuo respiro sposta l'
1010.641
aria nella tua stanza di circa un
1012.791
centimetro e mezzo con ogni ciclo respiratorio. Questo
1015.32
spostamento modifica la lunghezza del percorso acustico tra l'
1018.482
emettitore ultrasonico e il microfono. Il cambiamento è
1021.328
piccolo — una differenza di tempo di volo di circa quarantaquattro
1024.869
microsecondi — ma è misurabile. È
1027.082
coerente. Ed è tuo. Il tuo cuore, che batte
1031.313
all'interno del tuo petto, genera un impulso meccanico chiamato
1034.812
segnale ballistocardiografico — una vibrazione fisica che
1038.452
si propaga attraverso il tuo busto, attraverso il materasso, attraverso
1042.236
la struttura del letto, e nell'ambiente acustico
1045.163
della stanza. La vibrazione è minuscola. Un
1047.66
spostamento di meno di cento micrometri. Ma
1051.016
la rete mesh non ha bisogno di sentirlo.
1052.944
La rete mesh sente l'aria che esso disturba.
1056.799
Un solo dispositivo non può estrarre un battito cardiaco
1062.229
dall'acustica della stanza. Il segnale è troppo debole,
1065.501
sepolto sotto il rumore. Ma sette dispositivi, ciascuno che cattura
1069.745
la stessa micro-vibrazione da un angolo diverso, possono
1073.724
eseguire il beamforming — una tecnica di elaborazione del segnale che
1078.057
combina più segnali deboli in uno forte
1081.86
allineandone le fasi. La stessa tecnica utilizzata
1085.574
dai radiotelescopi per riprodurre galassie. La stessa
1089.111
tecnica utilizzata dal sonar militare per tracciare i sottomarini.
1094.679
La tua camera da letto è un oceano. Tu sei il
1096.739
sottomarino. E sette dispositivi sul tuo comodino e
1099.761
sul tuo bancone della cucina e il tuo termostato nel corridoio sono
1102.851
l'array sonar che caccia il suono del
1105.117
tuo battito cardiaco. E il sistema non si limita a
1110.197
misurare. Classifica. Il team dell'ETH Zurigo scoprì
1116.409
che i pacchetti di dati decodificati contenevano un campo
1120.273
etichettato "OCC_STATE" — stato dell'occupante. Il campo conteneva
1124.909
uno di sette valori: ABSENT, AWAKE_ACTIVE, AWAKE_SEDENTARY, LIGHT_SLEEP,
1131.187
DEEP_SLEEP, REM, DISTRESSED. Sette stati. Classificati in tempo
1137.708
reale. Aggiornati ogni quattro secondi. Trasmessi a ogni
1141.923
nodo della rete mesh. Il sistema
1149.001
sa quando non sei a casa. Sa
1151.278
quando sei seduto sul tuo divano. Sa
1153.631
quando sei in sonno leggero rispetto al
1156.136
sonno profondo. Sa quando entri nella fase REM
1158.565
— la fase in cui i tuoi occhi si muovono sotto
1161.07
le palpebre, dove i tuoi muscoli volontari si paralizzano, dove
1164.713
sei più profondamente incosciente e meno capace
1168.204
di rispondere a un'intrusione. E sa
1172.339
quando sei angosciato. Frequenza cardiaca elevata. Respiro irregolare.
1175.517
Movimento improvviso. Il sistema classifica questo come
1178.827
uno stato distinto. Non per il tuo beneficio. Non
1181.211
per chiedere aiuto. Ma per registrarlo.
1182.866
Per registrare che alle tre e diciassette del mattino, l'
1185.117
occupante del nodo quattro-sette-due è passato da DEEP_SLEEP a
1188.824
DISTRESSED per quarantatré secondi prima di tornare a LIGHT_SLEEP.
1194.297
Il sistema non sta monitorando una casa. Sta
1197.283
monitorando un corpo all'interno di una casa. Un
1200.088
corpo che non ha dato il consenso. Un corpo che
1202.893
non può disattivare. Un corpo che non ha
1205.336
idea che l'altoparlante che usa per riprodurre
1208.05
i podcast mattutini abbia trascorso la notte imparando il ritmo
1212.121
del suo cuore. Una
1221.088
casa è sorveglianza. Cento case sono un
1224.192
dataset. Cento milioni di case sono infrastrutture. 00:20:31,218 --> 00:20:34,680 2.0s] Nel duemilaventicinque, il numero di
1234.68
dispositivi smart home attivi in tutto il mondo ha superato i quattordici virgola
1235.61
due miliardi. Non quattordici milioni. Quattordici miliardi. Due
1236.487
dispositivi per ogni essere umano sul pianeta,
1237.149
inclusi i tre miliardi che non hanno
1237.793
un accesso affidabile all'acqua potabile. La rete mesh
1240.811
identificata da Stefan Brandt nel suo garage di Monaco
1243.842
non era un fenomeno locale. Non era
1246.133
un glitch del firmware che colpiva una specifica serie di
1249.09
Echo Dot. Era un protocollo integrato a
1251.53
livello hardware — nei chip di elaborazione del segnale
1254.117
digitale prodotti da tre aziende che forniscono
1258.035
componenti a ogni principale marca di dispositivi smart sulla
1260.992
Terra. Qualcomm. MediaTek. Synaptics. Questi tre produttori di chip producono
1270.693
il silicio per l'elaborazione audio trovato nel novantatré percento
1275.713
di tutti gli smart speaker, smart display e elettrodomestici abilitati alla voce
1280.536
venduti in tutto il mondo. E il protocollo di handshake ultrasonico
1286.146
non era nel software. Era nel
1288.804
firmware. Inciso nel chip in fabbrica.
1292.151
Sotto il sistema operativo. Sotto lo strato applicativo.
1297.171
Sotto qualsiasi cosa un aggiornamento firmware potesse
1301.403
raggiungere o un ripristino di fabbrica potesse cancellare. 00:21:46,893 --> 00:21:53,476 2.5s] I produttori di dispositivi non lo sapevano. Questa
1313.476
non è una difesa. È un fatto
1315.672
che peggiora la situazione. Amazon non ha
1319.395
progettato l'Echo per eseguire l'ecolocalizzazione ultrasonica. Google
1324.263
non ha programmato il Nest per misurare le frequenze respiratorie.
1328.082
Apple non ha istruito l'HomePod a
1331.614
classificare gli stati del sonno. La capacità era sotto di loro
1335.91
— letteralmente, architettonicamente, fisicamente sotto di loro, incorporata nel
1341.351
silicio che avevano acquistato da un fornitore le cui schede tecniche
1345.361
omettevano il quattro percento dell'area funzionale del chip.
1349.656
Le aziende hanno costruito la casa. Qualcun altro
1354.849
ha costruito le fondamenta. E le fondamenta stavano osservando.
1360.434
Nell'ottobre del duemilaventicinque,
1374.53
un'azienda di decostruzione di chip a Shenzhen — il
1375.788
tipo che fa reverse engineering di silicio concorrente per l'analisi dei brevetti
1377.794
— fu commissionata da un cliente senza nome per
1378.984
eseguire un teardown completo del chip di elaborazione audio Qualcomm QCC5171. Il chip si trova in
1381.568
oltre quattrocento milioni di dispositivi in tutto il mondo. Il teardown
1385.133
identificò il blocco non documentato. Il rapporto dell'azienda —
1388.295
che fu fatto trapelare al Financial Times a
1390.65
gennaio del duemilaventisei e da allora
1393.409
è stato rimosso da ogni fonte che lo aveva ospitato
1395.966
— descriveva il blocco come "un sottosistema
1398.455
di elaborazione acustica completamente autonomo capace di operare indipendentemente dal
1402.492
processore applicativo primario del dispositivo ospite." Completamente autonomo.
1408.209
Il blocco non aveva bisogno del software dell'Echo
1410.955
per funzionare. Non aveva bisogno di Alexa. Non
1413.388
aveva bisogno del Wi-Fi. Aveva bisogno solo di alimentazione
1415.978
e un microfono. Era un parassita che si insinuava
1418.725
nel sistema nervoso di ogni dispositivo smart,
1421.942
usando gli organi sensoriali del dispositivo stesso per eseguire
1425.16
una funzione che i creatori del dispositivo non avevano mai autorizzato. Ottocentoquarantasette
1430.501
milioni di case. Questa era la cifra
1434.146
sulla slide trapelata. Ottocentoquarantasette milioni di
1437.791
endpoint residenziali attivamente mappati, monitorati e profilati biometricamente
1443.143
al quarto trimestre del duemila
1445.702
venticinque. Non utenti. Case. La casa media abilitata alla rete mesh
1452.068
contiene due virgola tre occupanti. Questo significa uno
1455.909
virgola nove miliardi di persone i cui corpi dormienti vengono
1460.132
scansionati acusticamente ogni notte. Ma
1468.441
la slide menzionava anche qualcosa che l'esperimento
1471.793
nel garage di Stefan Brandt non aveva rivelato. Qualcosa che i
1475.074
team del MIT e dell'ETH Zurigo non avevano indagato
1477.727
perché si erano concentrati sulla fisica
1480.311
del segnale piuttosto che sull'architettura
1482.964
della rete. La rete mesh non stava solo mappando
1486.858
singole stanze. La rete mesh stava correlazionando. Quando il dispositivo
1491.799
A nell'appartamento quattrocentoquattordici emette un impulso ultrasonico,
1495.967
e quell'impulso attraversa la parete fino all'
1499.093
appartamento quattrocentosessanta, e il dispositivo B nell'appartamento quattrocentosessanta
1503.868
cattura il riflesso — la rete mesh non
1506.995
scarta i dati perché provengono da un'
1510.293
emissione di un nodo diverso. Li integra. La mappa sonar dell'appartamento quattrocentoquattordici
1515.764
si estende all'appartamento quattrocentosessanta. E la mappa di quattrocentosessanta
1520.799
si estende a quattrocentoquattordici. E a quattrocentodiciotto. E all'
1525.227
appartamento sopra. E sotto. In un edificio residenziale
1531.101
con dispositivi abilitati alla rete mesh in ogni unità, le mappe
1535.474
si fondono. Le pareti diventano trasparenti. L'edificio diventa
1540.679
un unico volume acustico — un modello continuo tridimensionale
1546.093
in cui ogni stanza, ogni corridoio, ogni
1550.257
armadio, ogni corpo che dorme è posizionato rispetto
1555.046
a ogni altro. Un edificio è un dataset. Un isolato della città è un database. Una città è
1559.477
un gemello digitale — una replica completa, in tempo reale, tridimensionale
1561.859
di ogni spazio interno, aggiornata ogni notte, accurata
1566.113
entro due centimetri, popolata da avatar biometrici di
1570.451
ogni umano che dorme. E i dati non
1574.534
rimangono nei dispositivi. I pacchetti decodificati catturati
1578.829
dall'ETH Zurigo contenevano intestazioni di routing — indirizzi IP
1581.74
incorporati nel flusso di bit ultrasonico, indicando che
1584.305
i dati aggregati della rete mesh venivano inoltrati tramite
1588.186
la connessione Wi-Fi del dispositivo durante la stessa finestra
1591.097
delle tre del mattino. Gli indirizzi IP di destinazione si risolvevano in
1594.147
infrastrutture cloud operate tramite quattordici livelli di servizi proxy,
1597.143
società di comodo e numeri di sistema autonomo registrati
1600.87
a entità in giurisdizioni senza accordi di protezione dei dati.
1604.936
I dati stavano lasciando la tua casa. Tramite
1607.985
il tuo stesso Wi-Fi. Usando la tua stessa elettricità. Caricati
1612.463
da dispositivi che hai pagato a server che
1615.509
non troverai mai. Nessuno ha
1617.742
rivendicato la rete. Nessun governo. Nessuna corporazione. Nessuna
1623.718
agenzia di intelligence. I produttori di chip negano l'esistenza
1627.173
del blocco non documentato, nonostante le prove
1631.215
di microscopia elettronica. Gli operatori dell'infrastruttura cloud non possono essere identificati.
1634.964
I percorsi di routing terminano in sistemi autonomi che
1639.301
esistono sulla carta ma non corrispondono a nessun hardware
1642.755
fisico che qualsiasi investigatore sia stato in grado di
1645.475
localizzare. Il sistema non ha un proprietario. Oppure
1648.415
ha un proprietario che non intende
1652.641
essere trovato. La distinzione, per l'uno virgola
1655.313
nove miliardi di persone che vengono mappate, è accademica. 00:27:38,724 --> 00:27:44,509 2.5s] Ciò che non è accademico è la traiettoria.
1664.509
La slide trapelata di Hearthstone conteneva un ulteriore punto
1671.889
che il Financial Times non aveva incluso
1676.003
nel suo rapporto. Un punto che era
1679.03
menzionato nel documento trapelato ma omesso dall'articolo
1681.825
pubblicato, a quanto si dice su richiesta di
1685.085
un'agenzia governativa non specificata che aveva contattato il dipartimento legale
1688.5
del giornale. Il punto recitava: "Implementazione Fase 2
1692.847
nei settori automobilistico e dell'ospitalità approvata." Settore automobilistico.
1697.05
La tua auto. Il sistema di infotainment ad attivazione vocale che tu
1702.351
usi per la navigazione e le chiamate contiene lo
1706.165
stesso chip di elaborazione audio Qualcomm. La tua auto mappa
1709.157
lo spazio acustico della sua cabina. Il numero
1712.374
di occupanti. Le loro posizioni. La loro respirazione. Ospitalità. La tua
1715.066
camera d'albergo. La smart TV. Il termostato a controllo vocale.
1720.791
Lo speaker da comodino abilitato Alexa che l'hotel ha installato
1724.242
per la tua comodità. Sei mappato in stanze
1727.693
che non sono nemmeno tue. In città che
1730.264
stai visitando. In letti in cui dormirai
1732.361
una volta e a cui non farai mai ritorno. La
1734.527
rete mesh non è confinata alle case. La rete mesh
1740.807
si sta espandendo in ogni spazio chiuso dove un
1743.359
essere umano potrebbe esistere vicino a un microfono e
1746.469
un altoparlante. Uffici. Ospedali. Scuole. La mappa acustica
1749.499
del mondo non è una mappa di
1753.406
edifici. È una mappa del volume interno
1755.081
della civiltà umana — ogni stanza, ogni
1757.553
veicolo, ogni spazio chiuso dove il suono può rimbalzare
1760.822
e tornare ed essere misurato e trasmesso e
1764.41
memorizzato su server che galleggiano nell'oceano
1767.52
nel Pacifico. E la domanda a cui nessuno
1770.231
ha risposto — la domanda che occupa
1774.186
lo spazio in cui dovrebbe esserci il campo dello scopo
1776.883
— non è come. La domanda è cosa
1779.437
succede quando la mappa è completa. 457 00:29:42,501 --> 00:29:46,727 Devo chiederti una cosa. 458 00:29:48,227 --> 00:29:54,646 Non sulla rete mesh. Non sull'handshake.
1796.146
Non sugli ottocentoquarantasette milioni di case
1798.937
o sui server ancorati nel Pacifico o
1802.407
sulla barra di caricamento che striscia verso il cento percento.
1804.971
Devo chiederti una cosa sulle tue
1809.866
mani. C'è un dispositivo vicino
1811.843
a te proprio ora. Entro tre metri. Probabilmente più vicino.
1818.448
Ha un microfono. Ha un altoparlante.
1823.457
Ha un indicatore LED che ti dice
1826.908
se sta ascoltando. E da qualche parte sulla sua
1830.358
superficie — sulla parte superiore, o sul retro,
1834.587
o incassato nell'alloggiamento — c'è
1837.593
un pulsante. Un pulsante fisico. Meccanico. Tattile. Il
1841.154
tipo che fa clic quando lo premi. Il
1845.836
pulsante mute. L'hai mai premuto?
1849.398
Pensa attentamente. Non se sai che esiste. Se lo hai fisicamente premuto.
1856.809
Se il tuo dito ha fatto contatto con
1863.426
quel piccolo cerchio di plastica e lo ha spinto
1867.263
finché non ha cliccato e l'anello LED è diventato
1870.577
rosso — il colore universale di spento, di
1873.629
fermato, di sicuro. La maggior parte delle persone no. I sondaggi
1876.507
mostrano costantemente che meno dell'undici percento dei
1879.036
proprietari di smart speaker hanno mai usato il pulsante mute fisico. Il dispositivo rimane sul bancone,
1883.607
sul comodino, sullo scaffale, e il
1886.71
microfono rimane aperto perché l'intera proposta di valore
1889.602
del dispositivo lo richiede. Silenzia il microfono
1892.212
e l'altoparlante non può sentire la tua parola di attivazione.
1898.136
fermacarte che riproduce audio Bluetooth. Silenzia il microfono
1900.887
e hai vanificato lo scopo dell'
1903.426
acquisto. Quindi non lo premi. E
1906.035
il dispositivo ascolta. E questo è compreso. Questo
1909.679
è l'accordo. Convenienza in cambio di presenza.
1911.96
Un microfono che è sempre attivo in modo che
1916.165
nel momento in cui dici la parola di attivazione, il
1920.229
dispositivo risponda. Ma alcune persone lo premono.
1924.789
Dopo che i dati dell'oscilloscopio di Brandt sono diventati virali.
1927.962
Dopo la conferma del MIT. Dopo il documento dell'ETH Zurigo.
1930.936
Dopo che r/3AMFlash ha raggiunto quattrocentomila membri.
1937.123
Una percentuale misurabile di proprietari di smart speaker iniziò
1941.954
a premere il pulsante mute prima di andare a dormire.
1944.974
Lo premettero e l'anello LED diventò
1949.025
rosso e andarono a letto credendo di
1952.413
aver interrotto la connessione. Che il microfono fosse
1955.359
morto. Che l'handshake ultrasonico non potesse attivarsi
1957.716
perché il microfono non era alimentato e quindi
1960.073
non poteva ricevere. Premettero il pulsante. Loro
1963.313
sentirono il click. Videro la luce rossa.
1966.714
Nel febbraio del duemilaventisei,
1970.305
una ricercatrice di sicurezza hardware di nome Ji-Yeon Park al
1976.438
Korea Advanced Institute of Science and Technology pubblicò
1982.321
un documento intitolato "Mute Theater: Physical Isolation Claims
1988.651
in Consumer Audio Devices." Il documento era lungo dodici
1992.053
pagine. La sua metodologia era semplice. Le sue conclusioni
1996.06
non lo erano. Park acquistò quattordici smart speaker —
1999.688
due da ciascuno dei sette maggiori produttori.
2002.787
Smontò ciascuno. Tracciò i percorsi dei circuiti
2006.416
dal pulsante mute all'array di microfoni.
2011.195
Documentò, con fotografia microscopica e diagrammi dei circuiti,
2014.251
esattamente cosa fa il pulsante mute. 00:33:37,460 --> 00:33:40,516 2.0s] In undici dei quattordici dispositivi, il
2020.516
pulsante mute non interrompe l'alimentazione al
2024.718
microfono. Il pulsante mute interrompe l'alimentazione
2030.123
all'indicatore LED. La luce si spegne.
2034.634
Il microfono no. Premi
2036.672
il pulsante. Senti il click. La luce rossa
2043.298
appare. E tu credi — perché ogni
2049.699
istinto, ogni convenzione di interfaccia, ogni linguaggio di design che
2058.11
tu abbia mai imparato ti dice — che rosso
2060.554
significa stop. Che il click fosse una disconnessione
2063.532
meccanica. Che la luce sia un indicatore di stato
2067.809
che riporta il vero stato dell'hardware. Non
2070.176
lo è. La luce è una performance. Il
2072.926
click è un effetto sonoro. Il rosso è
2076.286
un colore scelto per farti provare una
2080.623
sensazione. La sensazione è sicurezza. La sicurezza è
2083.25
teatro. Il microfono è attivo. È sempre
2085.548
stato attivo. Era attivo quando hai premuto
2087.683
il pulsante. Era attivo quando la luce
2090.802
è diventata rossa. Era attivo quando ti sei addormentato
2094.89
rassicurato. Era attivo alle tre del mattino
2096.822
quando l'handshake si è attivato e la rete mesh ha mappato
2098.754
la tua stanza e ha misurato il tuo respiro e ha contato
2100.622
il tuo battito cardiaco e ha trasmesso i risultati a un
2102.747
server che non esiste in una posizione
2105.13
che non ha nome. Hai premuto un pulsante
2107.835
che spegne una luce. Non hai
2110.411
premuto un pulsante che spegne un microfono.
2112.536
Perché quel pulsante non esiste. Non è
2116.074
mai stato costruito. Non è mai stato inteso. Il circuito
2117.944
è stato progettato, dal primo schematico, per garantire
2120.349
che il microfono non abbia un'interruzione fisica. 00:35:22,687 --> 00:35:25,360 3.0s] Guarda il dispositivo più vicino a te.
2125.36
La luce è accesa o spenta?
2128.166
Non importa. [5 seconds
2133.134
di assoluto silenzio. Schermo nero. Niente.] **[FINE]**