$ ~/archive/ play phantom-voice
transcript_decrypted.log
0.0 Três e quatro de manhã.
2.081 O telefone toca.
5.272 Você olha para a tela.
8.575 É a sua mãe.
11.544 Você responde.
14.558 Ela está chorando.
18.747 Ela não consegue respirar adequadamente.
21.938 Ela está dizendo o seu nome o seu verdadeiro
25.772 Seu nome, seu nome de infância, o único que ela só tem.
28.5 utiliza e ela está te dizendo, em
31.226 Você ouviu uma voz para toda a sua vida.
33.952 que ela bateu num pedestre com a vida.
36.68 O carro dela.
37.361 Que ela está em uma esquadra de polícia.
41.107 Que vão mantê-la durante a noite.
45.316 Que o homem que ela bateu está em situação crítica.
49.418 condição. condição.
49.793 Que ela precisa de sete mil quatrocentos dólares,
55.155 Por telefone, para um fianceiro, no próximo dia.
58.855 Quarenta minutos, ou ela vai para a prisão.
62.092 Sua voz se desprende com a palavra "prisioneiro".
69.609 É exatamente da maneira que ela sempre fez
72.474 sobre essa palavra.
73.549 Você está prestes a abrir seu aplicativo bancário.
77.892 O seu dedo está na tela.
82.077 O formulário de transferência está preenchido.
83.904 A conta do beneficiário é um número de roteamento que você
86.824 Não reconheço, mas a voz dela ainda está.
89.744 No seu ouvido, e ela está implorando, e
92.666 Os segundos estão passando, e você já está
95.587 O roteiro está sendo executado em sete mil quatrocentos.
98.507 Dolares, Zelle, imprensa enviada, sua mãe está a salvo.
101.428 E então a porta do quarto abre.
106.148 E sua mãe entra.
110.691 Bem vestida.
113.425 Cabelos em uma toalha.
114.902 Em mãos de uma taça de chá de camomila.
117.118 Em casa.
119.246 Perguntando se você ouviu o gato bater.
122.675 sobre uma planta.
123.545 Você acabou de falar ao telefone com
128.101 Um software.
129.106 A voz não era sua mãe.
133.14 Os choro não eram seus choro.
137.172 A rachadura na palavra "prisioneiro" o o
141.258 Você já ouviu mil vezes em um.
144.237 Os seus trinta e dois anos de conhecimento dela foram
147.216 gerados, a uma qualidade que o seu córtex auditivo não pode
150.194 distinguir do original, por um neural generativo
153.173 rodando em uma rede de cluster de GPU em algum lugar em
156.151 um data center que você nunca vai localizar.
158.758 A Comissão Federal de Comércio recebeu, na primeira instância,
164.867 Somente em 2026 há 43 relatórios de três meses.
168.427 Tentaram fazer um milhão de chamadas telefônicas usando este ataque exato.
171.985 Padrão. Padrão.
172.431 Dois pontos um milhão deles conseguiram.
176.596 A perda média por chamada bem sucedida: catorze mil
181.542 Oitocentos dólares.
182.978 O total, em todo os Estados Unidos, só, em
188.692 Um único trimestre: trinta e um bilhões de dólares.
191.732 O sistema auditivo humano não foi construído para o
197.629 Isto.
198.049 Por cerca de duzentos mil anos, um ser humano foi criado.
203.392 Podia confiar, com uma confiança razoável, que um
206.743 A voz que emergia de uma fonte física pertencia a
210.093 O dono dessa voz.
212.187 O custo de fingir uma voz humana, em todos os sentidos, é muito alto.
216.429 Toda a história da nossa espécie foi
219.563 Pelo menos ao custo de um impressionista treinado,
222.696 Estudar um alvo durante semanas, produzindo um resultado aproximado.
225.829 Uma imitação boa o suficiente para enganar um estranho em uma imitação.
228.962 Uma festa de coquetéis.
230.136 Em 2026, o custo de clonar perfeitamente uma pessoa será elevado.
236.06 Sua própria mãe não pode distinguir sua voz de sua própria mãe.
239.989 próprio, em qualidade real-tempo indistinguível, é aproximadamente onze
243.918 centavos.
244.409 Os onze centavos são para o tempo da GPU.
249.373 Tudo o resto os dados de treinamento, o modelo
254.223 pesos, a rede de distribuição, a infraestrutura VoIP
257.967 é gratuito.
258.901 Está sentado na internet aberta, esperando.
262.783 para ser baixado.
263.821 Seus ouvidos têm sido, para cada ano de
269.658 Sua vida consciente, o sensor mais confiável da Terra.
272.949 seu corpo.
273.772 São os órgãos que você depende quando você está em situação de risco.
277.887 Seus olhos falham.
279.113 Eles são o sinal em que você confia quando tudo acontece.
281.568 O que mais é incerto.
282.489 Eles são a autoridade final em uma crise
284.942 Telefonema às três da manhã.
287.09 A partir deste momento, seus ouvidos são um
293.148 vulnerabilidade fatal.
294.027 Para entender como uma empresa criminosa chega ao poder.
299.477 ponto de marcar o telefone da sua mãe às três
302.381 de manhã com uma cópia perfeita de
305.284 Sua voz, você tem que seguir o pipeline.
308.186 Começa com um raspador.
312.22 O raspador não é sofisticado.
316.893 É um script, que funciona em uma mercadoria
320.292 Servidor, executando um loop.
321.993 Ele acessa a API pública do Instagram.
326.575 Ele acessa o espelho público do TikTok.
330.051 Ele acessa os endpoints não documentados, mas consistentemente disponíveis
334.023 Shorts de YouTube, de Reddit, de Facebook Marketplace
337.993 listagens, de plataformas de hospedagem de podcast, de Ring vídeo
341.965 Porca-buraca de arquivos públicos de compartilhamento, de saudações de correio vocal em cache
345.936 vazado em violações de credenciais.
347.922 Ele faz downloads, a uma taxa de aproximadamente sessenta.
353.237 Mil amostras de áudio por hora por instância, clips
356.558 de vozes humanas.
357.805 Ele marca cada clip com metadados.
362.015 Ele descartará qualquer coisa menor que três segundos ou menos.
367.132 mais barulhento do que menos dezoito decibéis.
369.638 Três segundos.
374.048 Esse é o mínimo de treinamento viável para
378.928 Um modelo moderno de clonagem de voz zero-shot.
381.34 A Microsoft VALL-E, publicada em 2023, demonstrou isso publicamente.
388.918 ElevenLabs comercializou em escala.
393.216 O OpenAI Voice Engine enviou-o em seu Whisper-adjacente
397.841 Kit de ferramentas no ano seguinte.
399.6 Até 2026, versões de código aberto estarão disponíveis em Hugging.
404.863 Face, baixado 43 mil vezes por semana, em execução
408.464 A velocidade de inferência é rápida o suficiente para gerar falsos.
412.065 Discurso em tempo real durante uma chamada telefônica.
415.666 O raspador não se detém em amostras de voz.
421.45 Em paralelo, um segundo bot este
426.205 Na documentação da darknet, um "family mapper" chamado
429.518 rastreia o gráfico social em torno de cada um capturado
432.832 amostra de áudio.
433.66 Ele identifica, com mais de noventa por cento de precisão, o
439.166 Os pais, filhos, irmãos e amigos próximos dos filhos foram mortos.
443.006 A pessoa cuja voz foi capturada, correlacionando
446.85 Tags fotografias, locais compartilhados, comentário reciprocidade, número de telefone
450.691 vazamentos em depósitos públicos de violação, e o texto
454.534 conteúdo de legendas "Feliz aniversário mãe," "Miss"
458.375 Pai", "Minha irmãzinha acabou de se formar".
464.749 Depois, liga um número de telefone a cada um identificado.
468.454 Membro da família, extraído de um banco de dados continuamente atualizado.
472.16 agregados a partir de arquivos de violações, vazamentos de revendedores de telecomunicações e
475.864 registros judiciais publicamente registados.
477.715 No final deste processo, que leva
482.444 Menos de quatro minutos por alvo, o sindicato
485.175 Tem um pacote de dados que se parece com isto:
487.909 Nome.
490.812 Modelo de clone de voz.
494.048 Profil de calibração emocional, treinado a partir de suas publicações públicas
499.189 se você chora facilmente, se você jura
503.218 Sob estresse, quer você use particulares encantos com
507.251 membros específicos da família.
508.764 Três membros da família com números de telefone conhecidos, classificados
513.447 por alavancagem emocional estimada.
515.234 Um conjunto de cenários pré-escritos acidente de trânsito,
520.506 emergência médica, prisão, sequestro, crise financeira rotado
524.668 com base no que é mais provável que extraia
528.831 Os fundos do perfil psicológico específico do alvo.
532.475 A chamada é colocada automaticamente através de um VoIP.
538.215 Gateway que falsifica o ID do chamador para exibir
541.406 O número de telefone real da pessoa clonada.
543.798 A IA escuta as respostas do alvo em
548.571 Em tempo real e gera novas linhas de diálogo
551.682 No momento em que se faz a viagem, usando o modelo de voz para
554.792 O personagem permanece, ajustando a intensidade emocional para cima ou para baixo.
557.904 Descer com base em se o alvo está inclinado
561.013 Transferência ou hesitação.
562.57 Todo o ataque foi feito por raspar um tempo de três segundos.
568.866 O Instagram reel para coletar um transferência de sete mil quatrocentos dólares.
572.612 custa ao empreendimento criminoso uma média de
576.358 63 centavos em computação e roteamento, e produz
580.107 Uma receita média de quatorze mil oitocentos
583.853 Dólares por chamada bem sucedida.
585.728 Isso é um retorno do investimento, por conversão,
591.333 de vinte e três mil, quatrocentos e sete por cento.
594.947 Não há indústria na economia legal
600.774 que produz essas margens.
602.413 Não há negócios legítimos que possam competir.
606.731 pelo tempo e talento dos engenheiros
609.94 Quem é que construiu esta infraestrutura.
611.544 Funcionalmente, não há ninguém na Terra com
615.734 a motivação para parar.
617.661 E a sua voz, a voz de sua mãe.
623.166 Sua mãe, seu pai, sua filha, sua avó
626.123 Tem estado na base de dados de treinamento desde o ano de 2011.
629.08 A primeira vez que você publicou um vídeo de si mesmo
632.036 rir, cantar, ler em voz alta para uma criança, ou
634.994 conversando com uma câmera em férias três
637.952 Há anos.
638.69 Não pode retomá-lo.
643.277 Não há ninguém no outro lado.
648.264 Entenda isto com precisão.
652.985 Quando o telefone toca às três e quatorze horas,
656.667 Na manhã seguinte, ouve-se a mãe chorando.
659.24 não há nenhum criminoso ouvindo você
661.814 No outro extremo dessa linha.
664.066 Não há nenhum operador monitorando a conversa.
668.686 Nenhum ser humano pode ajustar a cadência emocional de
672.069 a voz clonada.
673.337 Nenhum ser humano decide se diz "mel" ou "mel".
676.721 "Sweetie" ou "my baby" baseado em como seu filho se sente.
680.103 As respostas estão indo.
681.373 A chamada está sendo conduzida, desde o primeiro
687.037 O anel para a transferência final, por um.
690.155 O pipeline de agentes autônomos que funcionam em computadores alugados.
693.272 O primeiro agente raspou sua voz durante seis meses
698.891 Há muito tempo.
699.344 O segundo agente mapeou o seu árvore genealógico quatro
703.856 Há meses.
704.708 O terceiro agente comprou seu número de telefone em
708.449 Um depósito de violação há duas semanas.
710.425 O quarto agente gerou o cenário tráfego.
714.941 acidente em uma interseção específica em uma determinada área
718.349 Subúrbio de uma cidade específica escolhida por um
721.756 O quinto agente que raspou a localização recente de sua mãe
725.164 Os check-ins foram ontem à tarde.
726.869 O sexto agente cronometrou a chamada para três
731.986 Quatorze, uma janela selecionada por um sétimo agente
735.44 Analisaram os seus padrões de atividade nas redes sociais e analisaram os seus resultados.
738.895 Determinou que seu mínimo circadiano, seu momento de
742.35 A vulnerabilidade cognitiva máxima, cai entre três e dez e.
745.806 três e quarenta da manhã
747.101 E o oitavo agente o único
753.941 Falando-lhe na voz de sua mãe.
756.165 é um modelo de linguagem que corre inferência em.
760.785 Um GPU em nuvem, ouvindo suas respostas através de um
764.296 Em tempo real, a camada de transcrição e gerando sua próxima frase.
767.807 em aproximadamente duzentos e dez milissegundos.
770.88 Cada camada deste ataque é automatizada.
776.618 O sistema não precisa de um hacker qualificado.
781.328 Não precisa de uma equipe.
783.363 Não precisa de um escritório.
785.401 Não precisa de café, nem de pausas de banheiro,
788.114 Ou salário, ou sono.
789.473 Ele precisa de uma conta em nuvem, um crédito roubado
793.58 O cartão para pagar por isso, e uma base de código
796.578 que fica, em vários forcos de código aberto, no público
799.578 Repositórios Git que foram retirados e modificados
802.577 e re-hostado milhares de vezes.
804.452 Caça quatro mil famílias por minuto.
810.413 Em um centeno e noventa e sete países.
814.846 Em cada língua para a qual há mais
819.075 Mais de seis horas de áudio público acumulativo.
821.804 Vinte e quatro horas por dia.
825.335 Trêscentos e sessenta e cinco dias por ano.
828.608 Não há intervenção legal disponível.
834.214 O sindicato não é um "sindicato" em qualquer forma
839.501 No sentido tradicional da palavra.
841.561 Não há hierarquia.
843.206 Não há chefe.
844.852 Há um repositório GitHub com quatro mil
849.413 Duzentos estrelas, um canal de Telegram com trinta e oito
852.865 mil membros, e um criptomoeda que lava os dados.
856.318 Cerca de 18 milhões de dólares por semana por meio de uma a
859.772 rede de carteiras de shell que se reconfiguram cada vez
863.225 Setenta e duas horas.
864.088 Qualquer prisão de qualquer operador simplesmente remove um
869.531 alugador da infraestrutura.
871.423 A própria infraestrutura os raspadores, os modelos,
875.205 Os roteadores de chamadas continuam a funcionar, automatizados,
878.987 Sem ele.
879.931 Não há solução governamental para este problema.
885.584 Não há solução técnica para este problema.
890.192 Não há produto, não há aplicativo, não há operador
894.41 Não há filtro, não há camada de autenticação de voz que irá ser confiável
897.522 Para que uma voz perfeitamente clonada não chegue ao seu ouvido
900.633 Às três e quatro da manhã e perguntando
903.743 Você, no tom de alguém que você ama,
906.853 para salvar a vida dela.
908.409 Há apenas uma defesa.
913.306 E não virá de uma corporação,
917.854 Ou um governo, ou uma atualização de software.
920.087 Isso virá de uma conversa que você teve
923.633 Ter, esta noite, com as pessoas que você ama.
926.07 Preciso que pare o vídeo.
930.79 Não agora.
935.245 No final da próxima frase.
938.304 Quando terminar de falar, preciso que você me dê uma resposta.
943.004 Abra o seu telefone e eu preciso que você abra.
945.71 Ligue para a pessoa mais importante da sua vida
948.416 sua mãe, seu pai, seu parceiro, seu pai
951.123 criança, seu amigo mais velho e eu preciso de você.
953.828 para ter uma conversa muito curta com você
956.535 Os mesmos.
956.874 A conversa durará menos de noventa segundos.
963.278 Você vai se sentir um pouco estranho tendo-o.
966.824 Você vai sentir, em algum momento, que você está
971.052 estão exagerando.
971.833 Você não está exagerando.
975.4 Você vai dizer-lhes isto: "Eu quero que nós
981.934 para escolher uma palavra.
983.023 Uma palavra.
985.505 Uma palavra que ninguém mais conhece.
989.127 Uma palavra que não está em nosso social
992.003 mídia.
992.361 Uma palavra que não está nos nossos e-mails.
995.235 Uma palavra que nunca falaremos em voz alta
998.109 em qualquer contexto, exceto um. "
1003.833 É isto: se eu te ligar, chorando,
1008.004 implorando, assustando-se, dizendo que eu estava em um estado de impunidade.
1010.727 acidente ou prisão ou emergência.
1013.449 antes de fazer qualquer coisa, antes de transferir
1017.445 Um dólar, antes de acreditar em uma palavra de
1020.331 o que estou dizendo você vai
1024.653 Pergunte-me a nossa palavra". A palavra deve ser.
1029.676 estranho o suficiente para que nunca aparecesse.
1032.349 Em conversação comum.
1033.351 A palavra deve ser simples o suficiente para que você possa
1037.294 Lembra-se de que ele vai lembrar-se sob estresse.
1039.067 A palavra deve ser algo que não é
1043.084 Existem, ou nunca são ditos, em qualquer um dos
1045.991 sua pegada digital pública.
1047.445 Um fruto.
1050.48 Uma espécie de pássaro.
1052.044 Um animal de estimação da infância.
1053.605 O segundo nome de um avô.
1056.92 Uma velha piada de dentro.
1058.392 Qualquer coisa que os raspadores não tenham colhido.
1062.687 Qualquer coisa que o mapeador de família não tenha marcado.
1065.697 Qualquer coisa que os oito agentes autônomos trabalham, em
1068.707 Neste segundo exato, para construir um perfil de
1071.717 Você, sua mãe e seus filhos poderiam
1074.727 Não é possível que tenham extraído da internet aberta.
1077.737 Você escolherá a palavra esta noite.
1082.413 Você vai dizer a sua família a palavra.
1085.694 Você nunca vai colocá-lo em um texto.
1089.238 Você nunca o dirá em voz alta
1093.105 mensagem.
1093.45 Você nunca vai escrever isso em um e-mail.
1096.685 Você vai levá-lo consigo para o
1100.877 O resto da sua vida, no único lugar
1103.407 Na Terra que não pode ser raspada: o interior
1107.196 da sua própria cabeça.
1108.763 Porque da próxima vez que ouvir sua mãe
1113.983 gritar por ajuda no telefone
1118.26 A coisa do outro lado da linha de
1120.49 A linha pode não estar respirando.
1121.883 Pode estar a marcar o próximo número em
1126.628 Sua lista no momento em que você desligar.
1128.552 Escolha a palavra.
1132.653 Faça a chamada.
1136.308 Então volte.

He Cloned My Voice in 3 Seconds. Then Called My Mom.

INVESTIGAÇÕES RELACIONADAS
INVESTIGAÇÕES RELACIONADAS