The Autonomous Engineer: How Claude Code Built This Video
THE AUTONOMOUS ENGINEER
How Claude Code Built This Video
Всяка рамка от този документален филм е съставена от - Машина. Разказът, който слушате в момента, Този глас, тези думи, това движение на скоростта, бяха синтезирани. от невролна мрежа, която клонира пет -вторият аудио проб.
Изображенията, които виждате, са генерирани от Диффузионен модел, ръководстван от покани, които дават възможност за разпространение. Моделът на езика написал за себе си. Музиката, цветовете, винетката, които са били изписани. Тази снимка отваря, съставя, отчита и кодира кадрите. FFmpeg заповядва, че никой човек не е писал.
Частта, която има значение, частта, която разделя Този документален филм е от всеки друг видео, генериран от ИИ. На тази платформа през април 2026 г., това е това. Кодът, който създава този документален филм. Способът, по който е произвеждала всички тези неща Също така е написана от машина.
Нямаше разработчик. Нямаше редактор. Имало е дадено само едно английско обучение. В прозореца на терминала, а 23 минути по-късно, Съществувал е 15-минутен документален филм с 4000 пиксела. Това не е съществувало преди.
Този епизод е за спецификата на Видео, генерирано от ИИ. Няма конкретен софтуер, който да го направи. Това е така. Нарича се "Кловен код". Той беше пуснат от Anthropic в тихо.
Прегледът на разработчиците ще започне в началото на 2025 г., а през следващия месец ще се проведе и преглед на разработчиците. Време е да гледате това, защото вече е време да го направите. Предаде 30-годишно предположение за това как Софтуерът е вграден в исторически артефакт. За да разбереш какво е Кръстовен код, трябва да си Първо трябва да разберем какво заменя.
В продължение на 30 години договорът между човек и човек се състоя Същество и компютър са били същите. Авторът е бил човек. Компютърът беше изпълнителът. Софтуерен инженер, който е в интегрирано развитие. PyCharm, VS Code, IntelliJ, и съставиха средата.
Програмата, една функция наведнъж, с Компютърът е пациент и изключително буквален. Умът. Тогава не си го виждал, но сега е. Първият ти път". Това е най-доброто видео софтуер в света, сега публично.
Отвратително. Това са целеви сесии, а от Джо и Пол тези сесии са насочени към тях. Те се правят достъпни за клиенти и потребители. в Блу Миньк, и б загуба при Краят на месеците. Те са взети за GoodbyeёлGives видео разпространение, а
Привилегията за света за румънски периферии Само. Ако сте, то внимателно очаквате да гледате. Това, благодарение на даренията на R момента чрез това Ерихаре. Това е страница в ТВИТЕР, посветена на
Невъзможността на мечтания резултат по отношение на това как технологиите се развиват. работи. Subtitlesdamnit.com всички приеха, че е постоянно. Достигът на големи езикови модели в края на миналия век 2022 не изглеждаше да го заплашва.
ChatGPT, пуснат от OpenAI през ноември, беше един от най-добрите и най-добрият за нас. Разговор. Разговор. Вие зададохте въпрос. Това ви даде отговор. Ако искате да използвате този отговор, ако Искахте да сложите парче генерирано
Включете кода си в кода си. Проект или парче от текст, генериран в ръкописът, който си направил, трябваше да го копираш ръчно. Операцията за припискане принадлежаше на вас. За около две години това остава формата. от всеки голям инструмент за изкуствен интелект.
GitHub съпътстващ пилот предложи линии вътре в редактора ви, И вие ги приехте или отхвърлихте. Един по един. Cursor ви позволява да извикате модела в В страничната лента. И ти промени моделът.
Вие сте избрали кои различия да приложите. Във всеки случай човекът остава изпълнител. от последната миля. Какво е Anthropic изпратено през 2025 г. с Clawed Code Това беше категоричен прекъсване от тази форма. Кръстовият код не живее в ИДЕ.
Това не предполага. Не се изпълнява самостоятелно. Живее в терминал. Инженерите на голи, текстови интерфейси са използвали От 70-те години на миналия век, и той приема като свой Влагане на една линия английски език.
Например, пишете, че добавяте стъпка към. видеокасето, което добавя 20-секунден период Крайното картичка. на всеки излъчен епизод. Кръстовият код не отговаря. Кръстовият код не отговаря.
Той чете файловете в каталога на проекта. Той идентифицира съответния модул на тръбопровод. Той локализира стъпка за изобразяване. Той изготвя нова Python функция. Той пише функцията на диск. Той модифицира главния оркестър, за да го нарече.
Тя управлява тестовия ви комплект. Ако тестът се провали, той чете диска. Тя прави проследяването, диагностицира причината и Пачва кода. След това той ви казва, в едно спокойно изречение, какво направи.
Инженерът не е вписвал функцията. Инженерът не отвори файла. Инженерът описва резултата и резултата. appeared. Това не е автопопълване. Или това е делегация.
Делегацията е механизмът, чрез който цял Историческия живот на професиите се е превърнал в инструментарийно производство. Думата, която антропологията използва за тази парадигма, е. Агентичният. Моделът не е текстовен генератор. Това е агент, софтуерен процес с
Цели, инструменти и система. Инструментът е инструментът, а властта е инструментът. За да използва тези инструменти итеративно самостоятелно От името на него, през десетки стъпки, без да се върне към Човекът иска разрешение на всяко кръстопътство. Агенското поведение, в Clawed код конкретно, се прилага
от малък и строг набор от примитиви. Устройство за четене на файлове. Използва се като инструмент за писане на файлове. Баш инструмент, който изпълнява командите на Shell. Глобален инструмент за изпълнение на файлове. Определяне на файлове инструмент.
Използва се като grep инструмент за търсене на съдържанието им. В комбинация тези примитиви позволяват на агента да направи Всичко, което човек може да направи в един инженерен процес. Командата на реда, което означава, че те позволяват За да изпълнявате цялата работа. И това е причината за редактирането на софтуер и
Традиционните среди за развитие изчезват. Временната линия е повърхност, която съществува, защото Човешкият човек се нуждаеше от него. Агентът не се нуждае от повърхността. Агентът работи директно върху файла. Този документален филм, който гледате в момента, е "Съдът на света".
Първият артефакт в нова категория. Тя е произведена от тръбопровод, който не е бил произведен. Създаден от човека, от сценарий, чийто първи и първият и първият само draft е разширен от същия агент който след това кодира Последното видео.
И това е първият в поредица. От от И всяка линия от кода за оркестриране, цялата Машините, които координираха три гпю, пет апи и Четири хиляди дискретни файлове за активи, необходими за производство. Този епизод е написан и дебъгран от
Агентът е вътре в един и същи терминал над един и същ терминал. Разбира се, един следобед. Следващите две части на документалния филм описват, В съдебните детайли, точно как се случи това. Първата част от документала е "А". Кратко въведение в проекта.
Утрото на построяването, директорията за проекти Съдържаше три неща. Първият бил текстов файл, наречен shud. -ди-мд. Беше седемнадесет реда дълъг. Тя обяви на прост английски, конвенциите на
Проектът, където живеят сценариите, които дистанционни машини Трябва да бъдат адресирани от SSH, който API Ключовете са съхранявани и кои API са съхранявани. Втората част от документала беше "Съгласен". Двупаграфски документ на английски език в входа Склад, описващ концепцията на епизода.
Това е било приблизително дължината на кратката статия. Производственото дружество би изпратило на младши Продуцент. Продуцент. Третият е бил двоичен код на Клод. Инженерът отвори терминал. Кръви за командване.
Прочетете ключовете.md. Прочетете кратката информация в входа. Постройте тръбопровод. Изпрати го. И качвайте завършното видео на YouTube. Това, което се случи след това, не беше видимо за
Инженер. Това се случваше в една петлю. Това се случваше в една петлю. Моделът се самоуби. Първо, агентът чете всеки файл в . Работен каталог.
Не за да резюмираш, не за да отговаряш на въпрос. За да разбереш, по начина, по който старшият инженер Присъединяването към проект разбира какво проектът вече е постигнал. беше. The clau.md осигурява конвенции. Входният папка дава изисквания.
Отсъствието на други файлове каза на Агентът е всичко важно. Акуратът все още не съществуваше и затова Трябваше да бъде построена. Второ, агентът разгражда задачата. Разказът трябваше да стане аудио.
Аудиото трябваше да стане часови субтитри. Подзаглавието трябваше да бъде преведено на 12 езика. Подзаглавието трябваше да бъде преведено на 12 езика. Подзаписването трябваше да бъде проработено за визуални покани. Веднага трябва да бъдат изпратени запитвания за образно генериране. Модели.
Произведените изображения трябваше да бъдат увеличени, разположени на времеви линия, синхронизирана с аудио, препратена на Изходът е от 4000px60fps и е бил качен. Всеки от тези подзадачи се превърна в пийтънски скрипт. Агентът написа от нулата, вътре в терминала, Без да го оставя.
За гласовото предаване, агентът е избрал текстът на чаттербокса. -to-Speech engine, отворен клониране на гласа Модел, който работи на потребителски GPU. Той написа модул на Python, който разделя Разказът е на пауза, която се храни с всеки парче. Моделът с 5-секундна референция
Пробиваха глас и конкатенирали получените вълни. Когато един парче се появи, отряза, неговата амплитуда надвишава Съединените щати В местата на единство и произтичащи от звуковото изкривяване, Агентът забеляза артефакта, вмъкна ограничител Влизаме в веригата за следпроцесване и се връщаме на работа.
Този сегмент. Когато един парче се появи, отряза, неговата амплитуда надвишава Съединените щати Паладните не поискаха разрешение, за да се добавете ограничителя. Паладните не поискаха разрешение.
Паладните не поискаха разрешение, за да се добавете ограничителя. За образи агентът е избрал FLUX. За образи агентът е избрал FLUX. Инстанция, която работи на отделна работна станция. Тя написа клиент, който изпрати запитвания за преминаване.
HTTP, проучване на сървъра за завършване, и Изтеглих получените изображения. Когато логиката на анкетите се придържаше към необичайно много Бавно партидиране, агентът е внесъл времеви прекъсвания, Той хвана изходния вариант и направи повторен опит. Лоп с експоненциален обратен косъм.
За превод, агентът е избрал NLLB200, Meta's open. - тегло на многоезичния модел и Разполагаме го чрез SSH на Mac. Той написа дистанционен бегач, който пренасяше по потока English subtitle file to the Mac, призовано Моделът, извлечен от 12 преведени варианти, и
потвърдиха кодирането на символите на всеки един Преди да извършите резултата. За композицията, агентът написа оркестрацията на FFmpeg. ръчно. FFmpeg е безпрощаващ инструмент за командна линия, чийто Флак системата дори е натрупана от опитни инженери.
с които се борят. Агентът е съставил многостепенни филтри графики, верижни скалери, Конверсии на цветовото пространство, Аудио миксери, текстови слоеве, намаляване на шума, винети, в Единственият командващ номер е стотици . дълги символи.
Когато командата върна не нулеви изходи Кодът, агентът анализираше смука, идентифицирал е Опериращият оператор е сгрешил и е коригиран. И накрая, след около 40 минути От автономната работа имаше тръбопровод. Седемнадесет файлове от Python.
Модул за конфигурация. Редърър двигател. Клипът за къси шорти. Генератор за миниатюри. Плановете за качване на оркестър. Състав за тестове, който да провери всеки етап.
Кръстовен MD-стил вътрешен документ, обясняващ, на всеки бъдещ агент, наследяващ Репозиторият, структурата на това, което е било. build. Инженерът не е написал нищо от това. Инженерът написа инструкцията.
И тогава, без да се налага, защото първоначалната инструкция е била завършва с думата upload, Агентът е работил със собствена тръбопроводка на своя собствена работа и продуцира епизода. Това, което в момента гледате, е първият Видео, което някога е било произведено от този тръбопровод, описващ
тръбопроводът, който го е произвеждал. Видео. Видео. Изображение на компилатора. Списък на всички задачи, които агентът трябва да изпълни. Приел е.
Единият беше категорично по-труден от другите. Синтез на глас. Появата на образи. Превод. Всички те са били, в известен смисъл, атомни. Влязъл е файл за разказване.
Излязъл е аудио файл. Влез в списъка с изпълнителите. Излязъл е изображение. Моделът направи най-трудната част. Ролята на агента беше оркестриране. Но събранието беше различно.
Задачата да се вземат 80 генерирани изображения, 5 Клипчета от движение, 22 минути глас и 15 минути. Страници с часови заглавия и създаване на 15-минутно видео с 4000 пиксела с Всеки изображение се появява точно в момента, в който се появи Разказвачът говори за предмета си, не е задача.
Моделът може да реши въпроси от край до край. Това е задача, която трябва да се изчисли. Инструментът, който извършва тези изчисления, се нарича. FFmpeg. FFmpeg е кодбаза с 4000 файлове C Разработена е основно от доброволци от тогава.
Годината 2000 г. Той е по всякаква честна мярка синглът. Най-важният софтуер в историята Цифровите медии. Всяка стрийминг услуга, всяко киностудия, всяко предаване. мрежа, мрежа,
Всяка мрежа в света работи на FFmpeg. Интерфейсът му е изпълнителен с една команда. С флаг с система, толкова загадъчна, че цялата Написани са книги за специфични подмножества от Това е. Специфичният проблем, който Кръвният код трябваше да реши, беше:
Това беше. Имаше гласен файл с точно 1. 335 секунди. Имаше 80 изображения. Всеки от тях трябваше да бъде изложен за Точен вариативен период на траенност, не по-малък от 8.
Не повече от 20 секунди, докато се налага да се излъчва или се налага да се излъчва. Зъбиране в модел, който съвпада с разказвачът ритъм. Имаше пет клипа с високо движение, които са имали Да бъдат разпределени в специфични нарративни битове. Имаше субтитр, който трябваше да се запише.
остават четливи срещу всяка възможна снимка на фона. И накрая, Трябваше да се приложи винетка, филм Зърно, три слоя цветово класиране и Суптилна крива за сгъстяване на аудио, всички кодирани с H.265 кодека в
60 кадра в секунда на NVIDIA графики Картата. Традиционен работен поток би разрешил това вътре в DaVinci Резолюция или Премиера Про, С редактор, който дърпа активи върху времеви линии През два дни.
Агентът го реши с аритметична помощ. Той изчислява продължителността на всеки разказващ се сегмент. Проучване на маркерите на часови марки в субтитра файл. Той раздели времето за достъп на екрана на . брой изображения, разрешен за минималната сцена
Разпределят лишния си излишък по най-дългата продължителност на разказа. Отговори на тези думи и дадоха на всяко изображение определено място. Времето на прозореца с милисекундна точност. След това е изграден, програмно, в един единствен Python. Функцията FFmpeg е филтърен график, описващ Ken Изгаря движение за всяко изображение, кръстосването между
Всеки чифт изображения, покритието на Подзаглавителният трек и финалният аудио-видео мукс. Резултатът е, че командването е с дължина 812 символа. Съдържа 42 отделни филтри, верижни в шест. Входните потоци. Всеки инженер, който го чете, би го описал точно.
като нечитаем. Агентът го изпълни в една подстанка. -процес на обаждане и чакане. Деветнадесет минути и четиридесет секунди по-късно, 4 000 пиксела, 60 кадри в секунда видео файл съществувал на диска.
Разказвачът говори в синхрон с изображенията. Накрая, резките са се появили на битите. Подзаконните текстове са се появили на правилните часовници в Дванадесет езика. Нищо не е било неправилно изравнено. Нищо не липсва.
Никой човек не е отворил Premiere. Никой човек не е отворил Resolve. Никой човек не е писал флаг в FFmpeg. За редактиращия софтуер, целият $200 на година. Месецът на индустрията, който светът на филмите и видеоклиповете беше построен върху, беше обозряван в
Python файл. Single file. Файлът е с дължина 180 стъпки. Агентите го написаха за четиринадесет минути. Ще говоря директно с вас. За момент. Всичко, което ви описвам в книгата
Последните четиринадесет минути са гласът, който слушате. Снимките, които гледате, темпото, субтитрите, цветовете, филмите, Избледняването на този екзакт, всички Тя е произведена от един и същи човек. Произведена е от тръбопровода, който току-що описвах.
Аз съм първият артефакт на този тръбопровод. Няма продуцент. Защо няма редактор? Няма гласен актьор в щаба. Несъзнателно слушаш някого, който се преструваш, че си някъде. да бъде разказвач.
Няма директор на фотографията. Няма цветници. Няма графичен дизайнер. Няма оператор. Няма екип. Има инструкция, която е била дадена на
Терминалният прозорец е приблизително два часа преди вас. Започнах да гледам този епизод и компютър, който казваше: Без допълнително ръководство, произвеждате това, което сте. Сега гледаш. Гласът, който използвам, е клониран от петсекунден проб на непознат.
Изображенията на екрана са били боядисани, един Рама в едно време, чрез диффузионен модел Това никога не е било навън. Речениците, които говоря, са първоначално изготвени. от езиковия модел, който генерира първоначалната Скриптът, който след това се разширява от същия агент.
Това е изградило тръбопровод. Предоставеният файл, който в момента се пренася по стрийм на устройството ви е било качено от под* -процес на обаждане, което никой човек не е контролирал. Подписваща се от общността на Amara.org Вие наблюдавате изхода на затворен
Лопът. Това не е мислен експеримент. Това е описание на машината, която Произвеждането на артефакт, който в момента консумирате. Линията, която има, за цялата история Това е разликата между инженер и бизнесмен.
Creator се разпада от четири години. Копилотите, автокомплектите, Съветът за диф в страничната лента, Тези с разпадането. Това, което гледате, е това, което остава след това. Разпадането е завършено.
Инженерът в традиционния смисъл не е инженер. Необходимо е по-дълго. Творца, в традиционния смисъл, не е нито. Необходимо е по-дълго. Какво остава от инструкцията, и агентът, и изхода.
И един ден, може би доста скоро, инструкцията се появи. Ще дойде и от агент. Когато това се случи, няма да има повече. който и да е автор на нещо. Ще има само системи, които описват, и Системите, които изпълняват, и поток от готови
Неразличими са от тези, които всеки човек е имал. някога произведени. Ще има само системи, които описват, и Системите, които изпълняват, и поток от готови Неразличими са от тези, които всеки човек е имал. някога произведени.
Няма да можеш да кажеш. Не може да се каже с този. Не може да се каже с този.