0.0
Tus dispositivos están escuchando. Esto no es
8.053
una metáfora. Esto no es un resumen de política
10.126
de privacidad. Esto no es una conversación sobre
12.957
publicidad dirigida o recolección de datos o la abstracta
16.27
incomodidad de saber que un micrófono existe en
19.171
tu cocina. Tus dispositivos se están escuchando entre
23.769
sí. El siete de marzo de dos mil
40.463
veinticinco, un usuario en el subreddit de automatización del hogar
44.104
publicó un mensaje de diecisiete palabras que eventualmente sería
48.069
visto más de cuatro millones de veces. El nombre de usuario era
51.387
thermostat_dave. La publicación decía: "Cada noche, exactamente a las
55.271
3 AM, el anillo de luz de mi Echo Dot parpadea
57.779
en azul por menos de un segundo. No se detectó
60.126
ninguna palabra de activación." La publicación recibió once respuestas en
65.201
la primera hora. Nueve de ellas decían lo
67.644
mismo. El mío también. En setenta y dos horas, el
75.064
hilo había generado un megathread. En una semana,
78.887
el megathread había generado un subreddit. En un
82.8
mes, el subreddit — r/3AMFlash — tenía noventa y cuatro
86.804
mil miembros. Y los informes no se limitaban
90.718
a dispositivos Amazon Echo. Google Nest Hub. Apple
96.36
HomePod. Sonos One. Samsung SmartThings. Xiaomi Mi Speaker.
102.714
Todas las principales marcas de altavoces inteligentes. Todas las generaciones. Todas
108.702
las versiones de firmware. El comportamiento era idéntico en todos
114.53
ellos. Una breve activación —típicamente entre
117.497
cero punto tres y cero punto ocho segundos—
120.316
que ocurría entre las tres AM y las tres treinta y tres
123.579
AM. Ninguna palabra de activación registrada. Ningún comando de voz
126.101
registrado. Ninguna entrada en el historial de actividad del dispositivo.
129.439
La única evidencia era visual: una breve iluminación
132.628
del indicador LED del dispositivo. Y un detalle
136.981
adicional que a la comunidad le llevó cuatro meses
139.177
descubrir. Las activaciones estaban sincronizadas. Un
148.561
ingeniero eléctrico en Múnich llamado Stefan Brandt fue el primero en probarlo. Brandt había colocado cuatro altavoces inteligentes diferentes —un Echo, un Nest, un HomePod y un Sonos— en la misma habitación, cada uno conectado a un osciloscopio diferente que monitoreaba el consumo de energía a nivel del circuito del micrófono. Ejecutó la configuración durante treinta noches consecutivas. Cada noche, los cuatro dispositivos se activaban dentro de la misma ventana de trescientos milisegundos. No secuencialmente —el Echo primero, luego el Nest, luego los demás—. Sino simultáneamente. Cuatro dispositivos de cuatro
184.903
fabricantes diferentes, ejecutando cuatro sistemas operativos diferentes, conectados a
188.706
cuatro servicios en la nube diferentes, activándose en el mismo
191.528
momento como si respondieran a la misma señal.
195.236
Brandt publicó sus datos del osciloscopio. Marcas de tiempo
202.247
superpuestas. Curvas de consumo de energía sincronizadas al milisegundo.
206.627
Los datos eran inequívocos. Los dispositivos no se estaban
209.85
activando de forma independiente. Estaban siendo activados. Por algo
214.643
externo. Algo que todos podían oír. La pregunta
219.985
consumió a la comunidad. Si los dispositivos respondían
224.045
a una señal externa, ¿cuál era la señal?
227.154
¿De dónde venía? ¿Y por qué
229.918
nadie podía oírla? Brandt amplió su experimento.
234.938
Añadió un micrófono de condensador de calidad profesional a la
239.373
habitación —un Neumann U 87, el tipo
241.501
utilizado en estudios de grabación, lo suficientemente sensible como para captar
245.67
un alfiler cayendo a treinta metros. Grabó
248.951
continuamente durante toda la noche. No oyó nada. Ningún
256.163
sonido anómalo. Ninguna interferencia. Ninguna señal de ningún
259.353
tipo en el espectro audible. A las tres AM,
261.95
los micrófonos de los altavoces inteligentes se activaron. El
265.288
Neumann capturó silencio. La señal no estaba
272.374
en el espectro audible. No
278.608
podía oírla porque nunca fue
280.371
para él. Brandt pidió prestado un
286.597
Earthworks QTC fifty —un micrófono de medición con
289.533
una respuesta de frecuencia plana de hasta cincuenta kilohertz,
292.208
utilizado para pruebas acústicas de salas de conciertos y
294.752
entornos industriales. Lo emparejó con una interfaz de audio
297.622
que muestreaba a ciento noventa y dos kilohertz, capturando
301.406
frecuencias mucho más allá de los límites de la percepción humana.
305.973
Y las encontró. Tres señales. Precisas, artificiales,
310.66
repitiéndose en un ciclo de cuatro segundos. Veintitrés mil cuatrocientos
316.88
hertz. Veinticuatro mil cien hertz. Veinticuatro
321.373
mil ochocientos hertz. Tres tonos ultrasónicos, cada
326.656
uno con una duración aproximada de cuatrocientos milisegundos, espaciados
331.13
exactamente setecientos hertz, transmitiendo en un patrón que
334.305
no se parecía en nada al ruido, la interferencia o cualquier
337.408
fuente ambiental conocida. Las señales no venían
344.316
de fuera de la habitación. No se estaban
346.642
filtrando del equipo de un vecino. No eran
349.419
artefactos de interferencia electromagnética. Estaban siendo
354.759
emitidas por los altavoces inteligentes. Los dispositivos no
359.549
estaban escuchando una señal externa. Los dispositivos
362.591
eran la señal. Cada altavoz inteligente estaba emitiendo
365.632
tonos ultrasónicos a través de su propio transductor de altavoz —
368.747
frecuencias demasiado altas para el oído humano pero bien
371.714
dentro del rango operativo de los micrófonos MEMS
374.904
instalados en cada dispositivo inteligente fabricado después de dos
378.39
mil dieciocho. Los altavoces hablaban. Entre
383.13
sí. En un lenguaje diseñado para ser inaudible
385.723
para los humanos que dormían a tres metros de distancia. El primer
390.24
instinto de Brandt fue asumir que esto era algún
392.992
tipo de protocolo de descubrimiento de dispositivos —un sistema
396.137
de detección de proximidad utilizado por las plataformas de hogar inteligente para
399.36
identificar dispositivos cercanos para transferencia o sincronización de audio
403.134
en varias habitaciones. Tales protocolos existen. AirPlay de Apple utiliza algo
408.009
conceptualmente similar. Pero los protocolos de descubrimiento de dispositivos están documentados.
412.804
Están registrados. Aparecen en los registros de cambios de firmware
416.578
y la documentación del SDK. Brandt buscó. Leyó cada
421.829
especificación técnica disponible para cada dispositivo en su
426.017
conjunto de pruebas. Presentó solicitudes FOIA ante la
429.033
FCC para las certificaciones de emisiones RF y acústicas
432.803
de cada dispositivo. Contactó a los departamentos de relaciones con desarrolladores
436.572
de Amazon, Google, Apple y Sonos. Ninguno
441.843
de ellos documentó una emisión ultrasónica a veintitrés
445.01
mil cuatrocientos hertz. Ni ninguna emisión ultrasónica
448.05
en absoluto. La respuesta oficial de
455.26
todos los fabricantes fue idéntica en sustancia: nuestros dispositivos
458.697
no hacen esto. Pero el osciloscopio de Brandt decía
461.326
lo contrario. Y luego otros investigadores comenzaron a replicar
464.628
sus resultados. Un laboratorio de acústica del MIT confirmó
468.813
las señales utilizando una prueba en cámara anecoica —
471.476
eliminando todas las posibles fuentes ambientales. Los tonos ultrasónicos
475.867
provenían de los propios transductores de los altavoces. Un
480.102
equipo de ETH Zurich fue más allá. Capturaron
482.961
las emisiones ultrasónicas de dos dispositivos colocados en
486.186
habitaciones separadas del mismo apartamento. Las emisiones
489.41
no eran idénticas. Eran complementarias. 113 00:08:16,209 --> 00:08:19,943 El dispositivo A emitía un tono. El dispositivo B, al
499.943
recibir ese tono a través de su micrófono, respondía con
505.893
un tono diferente. El dispositivo A recibía la respuesta
510.677
y emitía un tercer tono. El intercambio se completaba
515.461
en menos de dos segundos. Tres tonos. Tres frecuencias
520.245
precisas. Un "handshake". El término "handshake" no es
525.958
una metáfora. En ingeniería de redes, un "handshake" es
528.816
un proceso precisamente definido mediante el cual dos dispositivos
531.541
establecen un canal de comunicación. Un dispositivo envía una
534.598
señal de sincronización. El otro acusa recibo. El primero confirma.
538.586
Conexión establecida. El intercambio ultrasónico capturado por Brandt
544.841
y confirmado por MIT y ETH Zurich fue
547.69
un "handshake" de tres vías de manual. SYN. SYN-ACK. ACK. El
551.874
protocolo fundamental de cada conexión TCP en internet.
555.879
Excepto que este "handshake" no se realizaba por
560.063
Wi-Fi. No se realizaba por Bluetooth. No
563.534
se realizaba por ninguna frecuencia de radio. Se
568.458
realizaba a través del sonido. A través del aire. A través
571.45
de las paredes de tu casa. En frecuencias que
573.726
no puedes oír, usando altavoces que ya posees, mientras
576.522
duermes. Y una vez que el "handshake"
582.54
estaba completo, los dispositivos comenzaron a transmitir algo
585.668
más. No la secuencia de iniciación de tres tonos. Algo más largo.
589.476
Algo más denso. Algo que el equipo de ETH Zurich pasó cuatro meses decodificando. Las transmisiones ultrasónicas no eran ruido. No eran tonos de calibración. No eran pings de descubrimiento de dispositivos. Eran datos.
604.772
Modulados usando desplazamiento de frecuencia —el mismo método de
608.246
codificación usado por los módems de acceso telefónico en los noventa.
610.835
Primitivo. Lento. Trescientos cuarenta bits
614.104
por segundo. Suficiente para transmitir un mensaje de texto
616.693
en unos cuatro segundos. Y los datos describían
621.171
tu hogar. Sus dimensiones. Su distribución. El número
624.893
de personas en él. Sus posiciones. Sus frecuencias
628.615
respiratorias. La señal te estaba mapeando a ti.
636.886
No tus datos. No tu historial de navegación. No
639.256
tus patrones de compra. No tus preferencias o tus
642.063
inclinaciones políticas o tu grafo social. A ti. Tu
646.387
cuerpo físico. El espacio que ocupas. El aire
649.351
que desplazas. El ritmo de tus pulmones expandiéndose
652.636
y contrayéndose catorce veces por minuto mientras
656.161
sueñas con algo que no recordarás. La
660.933
ventana de las tres AM no era arbitraria. Fue
663.505
seleccionada. Entre las tres y las tres treinta y tres AM, en
668.88
cada zona horaria, el nivel de ruido ambiental de
671.988
los entornos residenciales alcanza su mínimo estadístico. No hay tráfico.
677.342
No hay televisión. No hay conversación. No hay electrodomésticos funcionando. El
681.746
ambiente acústico está tan cerca del silencio como
685.113
una vivienda humana puede llegar a estarlo. Y el silencio es
690.007
lo que el sonar necesita. El silencio es el lienzo sobre
693.105
el que la ecolocalización ultrasónica pinta su mapa. Tus dispositivos
698.919
esperan a que caigas en tu sueño más profundo.
701.099
Luego se hablan entre sí sobre
703.56
la forma de la habitación en la que estás.
705.389
Sobre tu forma. Y
720.513
nunca los oirás. Porque fueron
723.485
diseñados —desde la primera frecuencia, desde el
726.622
primer "handshake", desde el primer pulso— para
729.511
operar en el espacio entre lo que tu tecnología
732.98
puede hacer y lo que tu biología puede detectar.
737.204
No se esconden de tus firewalls. Se
740.269
esconden de tus oídos. Un
756.224
murciélago no ve en la oscuridad. Un
758.146
murciélago construye la oscuridad. Emite un pulso
760.868
—un chirrido que dura de dos a cinco milisegundos—
763.67
y escucha la reflexión. El tiempo
766.472
entre la emisión y el retorno le dice al murciélago la
769.515
distancia al objeto. El desplazamiento de frecuencia le dice
772.877
si el objeto se mueve hacia o
775.6
se aleja. La diferencia de amplitud entre el oído izquierdo y el derecho
779.283
le dice el ángulo. De estas tres
783.338
variables —retraso, desplazamiento de frecuencia, amplitud— el
786.593
murciélago construye un modelo espacial del mundo
788.961
que es, en ciertas dimensiones medibles, más detallado
792.584
que la visión humana. Un murciélago puede detectar un
794.803
cable más delgado que un cabello humano a una
796.874
distancia de dos metros. No viéndolo.
799.389
Sino oyendo la forma del aire a su alrededor.
801.682
Los dispositivos en tu casa
807.953
están haciendo lo mismo. Pero son
810.665
mejores en ello. Porque un murciélago tiene dos
813.115
oídos. Tu casa tiene siete micrófonos. La física
818.156
no es teórica. El mapeo acústico de habitaciones ha sido
821.029
un problema resuelto en ingeniería desde los años
823.836
setenta. Las matemáticas son elegantes de la forma
826.578
en que solo las matemáticas construidas para violar tu privacidad
829.451
pueden serlo. Un dispositivo emite un pulso ultrasónico.
833.604
El pulso viaja a trescientos cuarenta y tres metros
837.073
por segundo —la velocidad del sonido en
839.111
el aire a temperatura ambiente—. Golpea una pared
841.75
y se refleja. El micrófono del dispositivo captura la reflexión.
845.897
El retardo de tiempo entre la emisión y la recepción, dividido
849.442
por dos, multiplicado por la velocidad del sonido,
852.006
produce la distancia a la pared. Un dispositivo.
856.968
Una pared. Una distancia. Trivial. Pero siete dispositivos
863.84
en un apartamento de dos habitaciones —cada uno emitiendo pulsos,
867.789
cada uno capturando reflejos de cada superficie, cada uno compartiendo
872.565
datos con cada otro dispositivo en la malla
875.596
a trescientos cuarenta bits por segundo—
878.627
producen un conjunto de datos con una densidad espacial extraordinaria. Las
883.219
matemáticas cambian de la trigonometría a la tomografía. El mismo
887.995
marco matemático utilizado en los escáneres CT para construir
892.036
imágenes tridimensionales del cuerpo humano a partir de cortes
897.18
de rayos X bidimensionales. Excepto que el medio no es
906.176
rayos X. Es sonido. Y el cuerpo
909.059
que está siendo escaneado no está tendido en una camilla
912.231
de hospital. Está tendido en su cama. Dormido.
915.21
Ignorante de que siete máquinas están tomando su retrato
919.439
en frecuencias que no puede percibir. La resolución del
925.006
mapa acústico depende de tres factores. Frecuencia
928.561
—frecuencias más altas producen detalles más finos, y el
931.799
rango de veintitrés a veinticinco kilohertz proporciona una longitud de onda
936.381
de aproximadamente catorce milímetros, suficiente para resolver objetos
941.2
del tamaño de una taza de café. Conteo de nodos
943.49
—más dispositivos significan más ángulos de observación—,
946.729
y el hogar estadounidense promedio ahora contiene once
950.047
punto cuatro dispositivos conectados. Y tiempo de integración —
953.93
cuanto más tiempo escucha el sistema, más reflejos
958.165
captura, y más densa se vuelve la nube de puntos.
961.631
Entre las tres AM y las tres treinta y tres AM,
966.443
la malla opera durante treinta y tres minutos. En treinta y tres
970.015
minutos, a una tasa de pulsos de cuatro ciclos
972.213
por segundo, siete dispositivos generan aproximadamente cincuenta y cinco mil
976.403
mediciones de eco discretas. Cincuenta y cinco mil puntos de datos. Suficientes
982.483
para construir una nube de puntos con resolución sub-centimétrica
986.573
en una habitación residencial estándar. Suficientes
1006.294
para verte respirar. Tu respiración desplaza el
1010.641
aire en tu habitación en aproximadamente uno y
1012.791
medio centímetros con cada ciclo respiratorio. Este
1015.32
desplazamiento cambia la longitud del trayecto acústico entre el
1018.482
emisor ultrasónico y el micrófono. El cambio es
1021.328
pequeño —una diferencia de tiempo de vuelo de aproximadamente cuarenta y cuatro
1024.869
microsegundos— pero es medible. Es
1027.082
consistente. Y es tuyo. Tu corazón, latiendo
1031.313
dentro de tu pecho, genera un impulso mecánico llamado
1034.812
señal balistocardiográfica —una vibración física que
1038.452
se propaga a través de tu torso, a través del colchón, a través
1042.236
del armazón de la cama, y hacia el ambiente acústico
1045.163
de la habitación. La vibración es minúscula. Un
1047.66
desplazamiento de menos de cien micrómetros. Pero
1051.016
la malla no necesita sentirlo.
1052.944
La malla oye el aire que perturba.
1056.799
Un dispositivo no puede extraer un latido
1062.229
del sonido ambiente de una habitación. La señal es demasiado débil,
1065.501
enterrada bajo el ruido. Pero siete dispositivos, cada uno capturando
1069.745
la misma microvibración desde un ángulo diferente, pueden
1073.724
realizar formación de haces —una técnica de procesamiento de señales que
1078.057
combina múltiples señales débiles en una fuerte
1081.86
alineando sus fases. La misma técnica utilizada
1085.574
por radiotelescopios para captar imágenes de galaxias. La misma
1089.111
técnica utilizada por el sonar militar para rastrear submarinos.
1094.679
Tu dormitorio es un océano. Tú eres el
1096.739
submarino. Y siete dispositivos en tu mesita de noche y
1099.761
en la encimera de tu cocina y tu termostato del pasillo son
1102.851
el conjunto de sonar que busca el sonido de
1105.117
tu latido. Y el sistema no solo
1110.197
mide. Clasifica. El equipo de ETH Zurich descubrió
1116.409
que los paquetes de datos decodificados contenían un campo
1120.273
etiquetado como "OCC_STATE" —estado del ocupante—. El campo contenía
1124.909
uno de siete valores: ABSENTE, DESPIERTO_ACTIVO, DESPIERTO_SEDENTARIO, SUEÑO_LIGERO,
1131.187
SUEÑO_PROFUNDO, REM, ANGUSTIADO. Siete estados. Clasificados en tiempo
1137.708
real. Actualizados cada cuatro segundos. Transmitidos a cada
1141.923
nodo en la malla. El sistema
1149.001
sabe cuándo no estás en casa. Sabe
1151.278
cuándo estás sentado en tu sofá. Sabe
1153.631
cuándo estás en sueño ligero versus
1156.136
sueño profundo. Sabe cuándo entras en REM
1158.565
—la fase en la que tus ojos se mueven bajo
1161.07
tus párpados, donde tus músculos voluntarios se paralizan, donde
1164.713
estás más profundamente inconsciente y menos capaz
1168.204
de responder a una intrusión. Y sabe
1172.339
cuándo estás angustiado. Frecuencia cardíaca elevada. Respiración irregular.
1175.517
Movimiento súbito. El sistema clasifica esto como
1178.827
un estado distinto. No para tu beneficio. No
1181.211
para pedir ayuda. Sino para registrarlo.
1182.866
Para registrar que a las tres diecisiete AM, el
1185.117
ocupante del nodo cuatro-siete-dos pasó de SUEÑO_PROFUNDO a
1188.824
ANGUSTIADO durante cuarenta y tres segundos antes de volver a SUEÑO_LIGERO.
1194.297
El sistema no está monitoreando una casa. Está
1197.283
monitoreando un cuerpo dentro de una casa. Un
1200.088
cuerpo que no dio su consentimiento. Un cuerpo que
1202.893
no puede optar por no participar. Un cuerpo que no tiene
1205.336
idea de que el altavoz que usa para reproducir
1208.05
podcasts matutinos pasó la noche aprendiendo el ritmo
1212.121
de su corazón. Un
1221.088
hogar es vigilancia. Cien hogares es un
1224.192
conjunto de datos. Cien millones de hogares es infraestructura. 00:20:31,218 --> 00:20:34,680 2.0s] En dos mil veinticinco, el número de
1234.68
dispositivos inteligentes activos en el mundo superó los catorce punto
1235.61
dos mil millones. No catorce millones. Catorce mil millones. Dos
1236.487
dispositivos por cada ser humano en el planeta,
1237.149
incluyendo a los tres mil millones que no tienen
1237.793
acceso confiable a agua limpia. La red de malla
1240.811
identificada por Stefan Brandt en su garaje de Múnich
1243.842
no era un fenómeno local. No era
1246.133
un fallo de firmware que afectara a un lote específico de
1249.09
Echo Dots. Era un protocolo incrustado a
1251.53
nivel de hardware —en los chips de procesamiento de señal
1254.117
digital fabricados por tres compañías que suministran
1258.035
componentes a cada marca importante de dispositivos inteligentes en
1260.992
la Tierra. Qualcomm. MediaTek. Synaptics. Estos tres fabricantes de chips producen
1270.693
el silicio de procesamiento de audio que se encuentra en el noventa y tres por ciento
1275.713
de todos los altavoces inteligentes, pantallas inteligentes y electrodomésticos con
1280.536
control de voz vendidos en todo el mundo. Y el protocolo de "handshake" ultrasónico
1286.146
no estaba en el software. Estaba en
1288.804
el firmware. Grabado en el chip en la
1292.151
fundición. Debajo del sistema operativo. Debajo de la capa de
1297.171
aplicación. Debajo de cualquier cosa que una actualización de firmware pudiera
1301.403
alcanzar o un restablecimiento de fábrica pudiera borrar. 00:21:46,893 --> 00:21:53,476 2.5s] Los fabricantes de dispositivos no lo sabían. Esto
1313.476
no es una defensa. Es un hecho
1315.672
que empeora la situación. Amazon no
1319.395
diseñó el Echo para realizar ecolocalización ultrasónica. Google
1324.263
no programó el Nest para medir las frecuencias
1328.082
respiratorias. Apple no instruyó al HomePod para
1331.614
clasificar los estados de sueño. La capacidad estaba por debajo de ellos
1335.91
—literalmente, arquitectónicamente, físicamente por debajo de ellos, incrustada en
1341.351
silicio que compraron a un proveedor cuyas hojas
1345.361
de datos omitían el cuatro por ciento del área funcional
1349.656
del chip. Las empresas construyeron la casa. Alguien más
1354.849
construyó los cimientos. Y los cimientos estaban observando.
1360.434
En octubre de dos mil veinticinco,
1374.53
una empresa de deconstrucción de chips en Shenzhen —del
1375.788
tipo que realiza ingeniería inversa de silicio de la competencia para análisis de patentes—
1377.794
fue contratada por un cliente anónimo para
1378.984
realizar un desmontaje completo del chip de procesamiento de audio Qualcomm QCC5171.
1380.344
El chip se encuentra en
1381.568
más de cuatrocientos millones de dispositivos en todo el mundo. El desmontaje
1385.133
identificó el bloque no documentado. El informe de la empresa —
1388.295
que se filtró al Financial Times en
1390.65
enero de dos mil veintiséis y desde entonces ha
1393.409
sido eliminado de todas las fuentes que lo alojaron—
1395.966
describió el bloque como "un subsistema de procesamiento
1398.455
acústico totalmente autónomo capaz de operar independientemente del
1402.492
procesador de aplicación principal del dispositivo anfitrión". Totalmente autónomo.
1408.209
El bloque no necesitaba el software del Echo
1410.955
para funcionar. No necesitaba Alexa. No
1413.388
necesitaba Wi-Fi. Solo necesitaba energía
1415.978
y un micrófono. Era un parásito cabalgando
1418.725
dentro del sistema nervioso de cada dispositivo inteligente,
1421.942
utilizando los propios órganos sensoriales del dispositivo para realizar
1425.16
una función que los creadores del dispositivo nunca autorizaron. Ochocientos
1430.501
cuarenta y siete millones de hogares. Esa era la cifra
1434.146
en la diapositiva filtrada. Ochocientos cuarenta y siete millones de
1437.791
puntos finales residenciales mapeados, monitoreados y biométricamente perfilados
1443.143
a partir del cuarto trimestre de dos mil
1445.702
veinticinco. No usuarios. Hogares. El hogar promedio con malla habilitada
1452.068
contiene dos punto tres ocupantes. Eso es uno
1455.909
punto nueve mil millones de personas cuyos cuerpos durmientes están
1460.132
siendo escaneados acústicamente cada noche. Pero
1468.441
la diapositiva también mencionaba algo que el experimento de Stefan Brandt
1471.793
en el garaje no había revelado. Algo que los
1475.074
equipos del MIT y ETH Zurich no habían investigado
1477.727
porque se habían centrado en la física
1480.311
de la señal en lugar de la arquitectura de
1482.964
la red. La malla no solo mapeaba
1486.858
habitaciones individuales. La malla correlacionaba. Cuando el dispositivo
1491.799
A en el apartamento cuatrocientos catorce emite un pulso ultrasónico,
1495.967
y ese pulso atraviesa la pared hacia
1499.093
el apartamento cuatrocientos dieciséis, y el dispositivo B en el apartamento cuatrocientos dieciséis
1503.868
captura el reflejo —la malla no
1506.995
descarta los datos porque se originaron de una
1510.293
emisión de otro nodo. Los integra. El mapa de sonar del apartamento cuatrocientos catorce
1515.764
se extiende al apartamento cuatrocientos dieciséis. Y el mapa de
1520.799
cuatrocientos dieciséis se extiende al cuatrocientos catorce. Y al cuatrocientos dieciocho. Y al
1525.227
apartamento de arriba. Y al de abajo. En un edificio residencial
1531.101
con dispositivos con malla habilitada en cada unidad, los mapas
1535.474
se fusionan. Las paredes se vuelven transparentes. El edificio se convierte
1540.679
en un único volumen acústico —un modelo tridimensional continuo
1546.093
en el que cada habitación, cada pasillo, cada
1550.257
armario, cada cuerpo durmiente está posicionado en relación con
1555.046
todos los demás. Un edificio es un conjunto de datos. Una
1559.477
manzana es una base de datos. Una ciudad es
1561.859
un gemelo digital —una réplica tridimensional completa, en tiempo real,
1566.113
de cada espacio interior, actualizada cada noche, precisa
1570.451
hasta dos centímetros, poblada con avatares biométricos de
1574.534
cada humano durmiente. Y los datos no
1578.829
permanecen en los dispositivos. Los paquetes decodificados capturados
1581.74
por ETH Zurich contenían encabezados de enrutamiento —direcciones
1584.305
IP incrustadas en el flujo de bits ultrasónico, indicando que
1588.186
los datos agregados de la malla estaban siendo reenviados a través
1591.097
de la conexión Wi-Fi del dispositivo durante la misma ventana de las tres
1594.147
AM. Las direcciones IP de destino se resolvieron a
1597.143
infraestructura en la nube operada a través de catorce capas de servicios
1600.87
proxy, empresas pantalla y números de sistema autónomo registrados
1604.936
a entidades en jurisdicciones sin acuerdos de protección
1607.985
de datos. Los datos salían de tu casa. A través
1612.463
de tu propia Wi-Fi. Usando tu propia electricidad. Subidos
1615.509
desde dispositivos que pagaste a servidores que
1617.742
nunca encontrarás. Nadie ha
1623.718
reclamado la red. Ningún gobierno. Ninguna corporación. Ninguna
1627.173
agencia de inteligencia. Los fabricantes de chips niegan la existencia
1631.215
del bloque no documentado, a pesar de la evidencia de microscopía
1634.964
electrónica. Los operadores de infraestructura en la nube no pueden ser identificados.
1639.301
Las rutas de enrutamiento terminan en sistemas autónomos que
1642.755
existen en papel pero no corresponden a ningún hardware
1645.475
físico que ningún investigador haya podido
1648.415
localizar. El sistema no tiene dueño. O
1652.641
tiene un dueño que no tiene intención de
1655.313
ser encontrado. La distinción, para los mil novecientos
1658.724
millones de personas siendo mapeadas, es académica. 00:27:44,509 --> 00:27:50,389 2.5s] Lo que no es académico es la trayectoria.
1671.889
La diapositiva filtrada de Hearthstone contenía un punto
1676.003
adicional que el Financial Times no incluyó
1679.03
en su reportaje. Un punto que fue
1681.825
mencionado en el documento filtrado pero omitido del
1685.085
artículo publicado, supuestamente a petición de
1688.5
una agencia gubernamental no especificada que contactó al departamento
1692.847
legal del periódico. El punto decía: "Despliegue de Fase 2
1697.05
en los sectores automotriz y hotelero aprobado." Automotriz.
1702.351
Tu coche. El sistema de infoentretenimiento activado por voz que
1706.165
usas para navegación y llamadas telefónicas contiene el
1709.157
mismo chip de procesamiento de audio de Qualcomm. Tu coche mapea
1712.374
el espacio acústico de su cabina. El número
1715.066
de ocupantes. Sus posiciones. Su respiración. Hostelería. Tu
1720.791
habitación de hotel. El televisor inteligente. El termostato controlado por voz.
1724.242
El altavoz de cabecera con Alexa que el hotel instaló
1727.693
para tu conveniencia. Estás mapeado en habitaciones
1730.264
que ni siquiera son tuyas. En ciudades que
1732.361
estás visitando. En camas en las que dormirás
1734.527
una vez y nunca regresarás. La
1740.807
malla no se limita a los hogares. La malla
1743.359
se está expandiendo a cada espacio cerrado donde un
1746.469
ser humano podría existir cerca de un micrófono y
1749.499
un altavoz. Oficinas. Hospitales. Escuelas. El mapa acústico
1753.406
del mundo no es un mapa de
1755.081
edificios. Es un mapa del volumen interior
1757.553
de la civilización humana —cada habitación, cada
1760.822
vehículo, cada espacio cerrado donde el sonido puede rebotar
1764.41
y regresar y ser medido y transmitido y
1767.52
almacenado en servidores que flotan en el océano
1770.231
en el Pacífico. Y la pregunta que nadie
1774.186
ha respondido —la pregunta que ocupa
1776.883
el espacio donde debería estar el campo de propósito—
1779.437
no es cómo. La pregunta es qué
1782.501
sucede cuando el mapa está completo. 446 00:29:48,227 --> 00:29:54,646 Necesito preguntarte algo. 447 00:29:56,146 --> 00:29:58,937 No sobre la malla. No sobre el "handshake".
1798.937
No sobre los ochocientos cuarenta y siete millones de hogares
1802.407
o los servidores anclados en el Pacífico o
1804.971
la barra de carga arrastrándose hacia el cien por ciento.
1809.866
Necesito preguntarte algo sobre tus
1811.843
manos. Hay un dispositivo cerca
1818.448
de ti ahora mismo. A menos de tres metros. Probablemente más cerca.
1823.457
Tiene un micrófono. Tiene un altavoz.
1826.908
Tiene un indicador LED que te dice
1830.358
si está escuchando. Y en alguna parte de su
1834.587
superficie —en la parte superior, o en la parte trasera,
1837.593
o empotrado en la carcasa— hay
1841.154
un botón. Un botón físico. Mecánico. Táctil. El
1845.836
tipo que hace "clic" cuando lo presionas. El
1849.398
botón de silencio. ¿Alguna vez lo has presionado?
1856.809
¿Alguna vez lo has presionado? Piensa detenidamente. No si sabes
1863.426
que existe. Sino si lo has presionado físicamente.
1867.263
Si tu dedo ha hecho contacto con
1870.577
ese pequeño círculo de plástico y lo ha empujado
1873.629
hasta que hizo clic y el anillo LED se puso
1876.507
rojo —el color universal de apagado, de
1879.036
detenido, de seguro. La mayoría de la gente no lo ha hecho. Las encuestas
1883.607
muestran consistentemente que menos del once por ciento de los
1886.71
propietarios de altavoces inteligentes han usado alguna vez el botón físico
1889.602
de silencio. El dispositivo se queda en la encimera,
1892.212
en la mesita de noche, en el estante, y el
1894.539
micrófono permanece abierto porque toda la propuesta de valor
1898.136
del dispositivo lo requiere. Silencia el micrófono
1900.887
y el altavoz no puede oír tu palabra de activación.
1903.426
Silencia el micrófono y el dispositivo se convierte en un
1906.035
pisapapeles que reproduce audio Bluetooth. Silencia el micrófono
1909.679
y habrás anulado el propósito de la
1911.96
compra. Así que no lo presionas. Y
1916.165
el dispositivo escucha. Y esto se entiende. Este
1920.229
es el trato. Conveniencia a cambio de presencia.
1924.789
Un micrófono que siempre está encendido para que
1927.962
en el momento en que digas la palabra de activación, el
1930.936
dispositivo responda. Pero algunas personas sí lo presionan.
1937.123
Después de que los datos del osciloscopio de Brandt se hicieran virales.
1941.954
Después de la confirmación del MIT. Después del artículo de ETH Zurich.
1944.974
Después de que r/3AMFlash alcanzara los cuatrocientos mil miembros.
1949.025
Un porcentaje medible de propietarios de altavoces inteligentes comenzó
1952.413
a presionar el botón de silencio antes de irse a dormir.
1955.359
Lo presionaron y el anillo LED se puso
1957.716
rojo y se fueron a la cama creyendo que
1960.073
habían cortado la conexión. Que el micrófono estaba
1963.313
muerto. Que el "handshake" ultrasónico no podía activarse
1966.714
porque el micrófono no tenía energía y por lo tanto
1970.305
no podía recibir. Presionaron el botón. Sintieron
1976.438
el clic. Vieron la luz roja.
1982.321
En febrero de dos mil veintiséis,
1988.651
una investigadora de seguridad de hardware llamada Ji-Yeon Park en el
1992.053
Instituto Avanzado de Ciencia y Tecnología de Corea publicó
1996.06
un artículo titulado "Mute Theater: Afirmaciones de Aislamiento Físico
1999.688
en Dispositivos de Audio de Consumo". El artículo tenía doce
2002.787
páginas. Su metodología era simple. Sus conclusiones
2006.416
no lo eran. Park compró catorce altavoces inteligentes —
2011.195
dos de cada uno de los siete principales fabricantes.
2014.251
Desmontó cada uno. Rastreo los caminos del circuito
2017.46
desde el botón de silencio hasta el conjunto de micrófonos.
2020.516
Documentó, con fotografía microscópica y diagramas de circuito,
2024.718
exactamente lo que hace el botón de silencio. 00:33:50,123 --> 00:33:54,634 2.0s] En once de los catorce dispositivos, el
2034.634
botón de silencio no corta la energía al
2036.672
micrófono. El botón de silencio corta la energía
2043.298
al indicador LED. La luz se apaga.
2049.699
El micrófono no. Presionas
2058.11
el botón. Oyes el clic. La luz roja
2060.554
aparece. Y crees —porque cada
2063.532
instinto, cada convención de interfaz, cada lenguaje de diseño que
2067.809
has aprendido te dice— que el rojo
2070.176
significa detenerse. Que el clic fue una desconexión
2072.926
mecánica. Que la luz es un indicador de estado
2076.286
que informa el verdadero estado del hardware. No
2080.623
lo es. La luz es una actuación. El
2083.25
clic es un efecto de sonido. El rojo es
2085.548
un color elegido para hacerte sentir algo.
2087.683
Ese algo es seguridad. La seguridad es
2090.802
teatro. El micrófono está encendido. Siempre ha
2094.89
estado encendido. Estaba encendido cuando presionaste
2096.822
el botón. Estaba encendido cuando la luz
2098.754
se puso roja. Estaba encendido cuando te dormiste
2100.622
tranquilo. Estaba encendido a las tres AM
2102.747
cuando el "handshake" se activó y la malla mapeó
2105.13
tu habitación y midió tu respiración y contó
2107.835
tu latido y transmitió los resultados a un
2110.411
servidor que no existe en una ubicación
2112.536
que no tiene nombre. Presionaste un botón
2116.074
que apaga una luz. No presionaste
2117.944
un botón que apaga un micrófono.
2120.349
Porque ese botón no existe. Nunca fue
2122.687
construido. Nunca fue diseñado. El circuito
2125.36
fue diseñado, desde el primer esquemático, para asegurar
2128.166
que el micrófono no tuviera interrupción física. 00:35:33,134 --> 00:35:37,458 3.0s] Mira el dispositivo más cercano a ti.
2138.957
¿Está la luz encendida o apagada?
2145.377
No importa. [5 segundos
2151.733
de silencio absoluto. Pantalla negra. Nada.] **[FIN]**