The Autonomous Engineer: How Claude Code Built This Video

THE AUTONOMOUS ENGINEER

How Claude Code Built This Video

这部纪录片的每一个框架都是由组成的. 一台机器. 你现在正在听到的叙事, 这个声音,这些词,这个节奏,被合成 由一个神经网络克隆了5的神经网络. -第二次音频样本.

你看到的图像是由创建的. 一个扩散模型,由提示指导,即一个 语言模型为自己写了. 音乐,颜色评级,拍摄的nette 这张开幕镜头,是编制,时间化和编码的. 通过FFmpeg,没有人曾经打过的命令.

重要的是什么,分开的是什么? 这部纪录片来自其他所有AI生成的视频 在2026年4月的这个平台上,这是这个. 这部纪录片的代码. 它的生产方式,它产生了所有这些东西 这也被机器编写.

没有开发人员. 没有编辑. 只有一个英语教学所授予. 进入终端窗口,23分钟后, 一部15分钟的4000像素纪录片存在 这之前就没有了.

这集是关于的特点. 通过AI生成的视频. 没有任何特定的软件,可以 他做了这一点. 它的名字是爪子码. 它由人类在安静的中发布.

开发者预览时间:2025年初,并通过 现在你看了这部电影,已经到了时间了. 对于如何,这是一项30年历史的假设. 软件是建立在历史文物中. 要了解爪子代码是什么,你必须 首先要了解它替代什么.

30年来,人类之间的合同 一个计算机和一个生物一直是相同的. 人是作者. 计算机是执行者. 一个软件工程师设置在一个集成开发 公司包括 PyCharm, VS Code, IntelliJ,环境,并编写了

一个函数一次,用程序 作为一个病人和极其字面的计算机 思想. 那时你从来没有看到过,但现在是这样的 这是你第一次.' 这是世界上最好的视频软件,现在是公开的

,这是一个可怕的东西. 它是针对性的会议,由乔和保罗,这些 现在,我们正在让客户和消费者都能接触到 在Blu Mink中,和B失去了 几个月的结束. 他们被收到的就是 GoodbyeёлGives视频扩散, a

罗马尼亚边缘设备的世界享有特权 只有. 如果你是,你会很期待着看. 由于R时刻捐赠,通过此 这是专门致力于的Twitter页面. 梦想结果不可能是技术如何实现的.

工作. 字幕下载damnit.com 每个人都认为,是永久的. 随着大型语言模型的出现,我们终于发现了 2022年似乎没有威胁到它. 那年11月,OpenAI发布的ChatGPT是一个

对话. 你问了一个问题. 它给了你一个答案. 如果你想用这个答案,如果 你想把一块生成的 进入你的代码

项目或生成文本的部分将其转化为 你的手稿,你必须手动复制它. 粘贴操作属于你. 约两年来,这种形状仍然是的. 对于每一个主要的AI工具. 吉特哈布的联合试点建议了编辑器内部的行列,

你接受或拒绝了这些信息. 一个接一个. 库尔索让你把模型调用成一个. 侧面板. 你改变了模型. 你选择了哪些差异要应用.

人类仍然是执行者,无论如何. 在最后一英里. 什么人类在2025年与爪子码发送的. 这是一个从这个形状中断的断绝. 爪子代码不存在于IDE中. 这并不是说.

它不会自动完成. 它住在终端内部. 裸体,仅仅是文字接口的工程师已经使用. 自1970年代以来,它以其为其. 输入一个单行英语. 例如,你输入,添加一个步骤到.

视频管道,添加20秒 终结卡 在每一集中,都会看到. 爪子码没有回答. 爪子码没有回答. 它会读取您的项目目录中的文件.

它确定了相关的管道模块. 它将找到染步骤. 它起草了一个新的Python函数. 它将函数写入磁盘. 它改变了主管调音器,叫它. 它运行了你的测试套件.

如果测试失败,它会读取磁盘. 它运行了追踪,诊断了原因,并 补丁了代码. 然后它用一个冷静的句子告诉你, 它所做的. 工程师没有输入函数.

工程师没有打开文件. 工程师描述了结果,结果 appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. 这不是自动完成. 或者,这是代表团. 委托是整个的机制.

历史上,职业已经被拆除为工具. 人类主义用这个范式的词是. 代理. 该模型不是一个文本生成器. 它是一个代理,一个软件过程, 目标,工具和系统.

工具是工具,权威是工具 为了自行使用这些工具,它可以反复使用这些工具 通过数十步骤,不返回 人们在每个十字路口都需要允许. 克码中,具体的代理行为是实施的. 由一个小而严格的原始人群来.

一个读文件工具. 一个写文件工具. 一个执行 shell 命令的 bash 工具. 一个用于文件执行的全球工具. 一个文件定义工具. 一个用于搜索内容的 grep 工具.

结合起来,这些原始的使代理能够做. 人工工程师可以在一个中做任何事情. 命令行,也就是说,他们允许. 为了完成整个工作. 这就是编辑软件和的原因. 传统的发展环境正在消失.

时间线是一个存在的表面,因为 人类需要它. 代理人不需要表面. 代理人直接在文件上工作. 你目前正在看的纪录片是 这是新类别中的第一件文物.

它是由一个没有的管道生产的. 人为设计,从一个脚本中,其第一和的脚本是人类设计的. 只有同一位代理扩大了这个草案 然后编码了 最后的视频. 这也是一系列的第一部.

的的 每一行编排代码,整个 这里有三台GPU,五个API和机器的协调. 需要生产四千个单独的资产文件 这一集,由编写并调试了. 在同一终端内,同一位代理人

一个下午的过程. 这部纪录片的下两个部分描述了, 在法医细节中,确切地说明了这件事是如何发生的. 纪录片的第一部分是 简单介绍项目. 建设的早晨,项目目录

包含了三个东西. 第一个是一个名为shud的文本文件. -di-md. 它长达17行. 它在简单的英语中宣布了的公约. 项目,脚本的居住地,远程机器的使用地

应该由SSH来解决,该API 密钥被存储,哪些API被存储. 纪录片的第二部份是 在输入中,两段英语文档. 文件,描述了该集的概念. 这大约是简报的长度

一家生产公司会把一个小学生送到一个小公司. 生产者. 第三个是克劳德代码二进制. 工程师打开了一个终端. 指挥手. 阅读关键.md.

在输入中阅读简报. 建设管道. 运行它. 然后将完成的视频上传到YouTube. 接下来发生的事情对没有任何视觉. 工程师.

这是在循环中发生的. 这是在循环中发生的. 模型自行跑了. 首先,代理阅读了该文件中的每一个文件. 工作目录. 不是要总结,也不是要回答问题.

要理解,就像一名高级工程师一样. 加入一个项目,是理解了该项目已经做了什么 是. 关键.md提供了会议. 输入文件提供了要求. 其他文件的缺失告诉了

代理所有重要的事情. 管道还没有存在,因此 必须建造. 其次,代理人分解了任务. 叙述必须成为音频. 音频必须成为时间标签的字幕.

字幕必须翻译成12种语言. 字幕必须翻译成12种语言. 字幕必须进行视觉提示的解析. 提示必须提交给图像生成 模型. 生成的图像必须升级,按排列.

一个与音频同步的时间表,在时呈现. 4000px60fps输出,并上传. 这些子任务中的每一个都成为了Python脚本 经纪人从零开始写道,在终端内部, 没有离开它. 为了发声,代理选择了聊天盒文本

- to-Speech engine,一个开放权重的语音克隆 这种模式运行于消费者GPU. 它写了一个Python模块,将分开为. 在停顿标记上,养每一个故事 对于模型的5秒参考 采样声音,并连接了产生的波形.

当一个块出现,剪切,其宽度超过. 美国 在统一的位置,产生听力扭曲, 经理注意到了这件物件,然后插入了限制器 进入后加工链,然后再运行 这段.

当一个块出现,剪切,其宽度超过. 美国 帕拉丁人没有要求许可,而是要 添加限制器. 帕拉丁人没有要求许可. 帕拉丁人没有要求许可,而是要

添加限制器. 对于图像,代理选择了FLUX. 对于图像,代理选择了FLUX. 在单独的工作站上运行的一个实例. 它写了一份提交提示的客户端. 为了完成HTTP,我们询问了服务器的情况,并

接下来下载了结果的图像. 当投票逻辑挂在一个不寻常的 批量缓慢,代理人插入了时间休息, 抓住了所产生的例外,并实施了重试 循环具有指数式背. 为了翻译,代理人选择了NLLB200,Meta's open

-重量多语言模型,以及 通过SSH将其部署到Mac上. 它写了一个远程跑步器,然后播放了 发送到Mac的英语字幕文件,被调用 模型,检索了12种翻译的变体,并 验证了每个人的字符编码

在执行结果之前. 为了作曲,代理人写了FFmpeg的管弦乐. 通过手来. FFmpeg是一个不宽恕的命令行工具,其使用者 片系统甚至是经验丰富的工程师 努力努力.

代理组建了多阶段过图,链接的, 颜色空间转换, 音频混音器,文字叠加,噪音降低,剪辑片,插入 单个命令数以百计 字符长. 当命令返回一个非零出口时

经纪人分析了的混动,确定了的代码. 错误操作符,并纠正了它. 最后,大约40分钟后 独立工作的管道. 共有17个Python文件. 一个配置模块.

一个染引擎. 短剪切工具. 一个缩影机. 计划上传乐队主持人. 一套测试套件来验证每个阶段. 这是一个形的MD式内部文档文件,解释了,

任何未来的代理人继承 库存,曾经的结构 built. 建成的. 工程师没有写任何内容. 工程师写下了说明. 然后,没有被提示,因为原始的指示已经.

结束时,用上传这个词, 代理人在其上运行了自己的管道. 自己的作品,并制作了该集. 你目前正在看的是一部第一部电影. 这条管道曾经制作过描述的视频. 生产了它的管道.

一个视频. 一个视频. 一个编译器图像. 一份列出了代理所执行的所有任务的列表. 已经接受了. 一个是比其他一个更难的.

语音合成. 图像生成. 翻译. 这些都是原子的. 一个叙事文件进入了. 一个音频文件出来了.

一个提示进入了. 一张图片出来了. 模型做了最难的部分. 代理的角色是调整. 但集会不同. 接下来,我们将完成80张生成图像的任务,5

影片,22分钟的语音,以及15的运动. 时间标签字幕的页面,并制作了 单一15分钟的4000像素视频 with 每个图像都出现在当下的确切时刻. 讲述者讲述了主题,不是一个任务 一个模型可以解决端到端的问题.

这是一个必须计算的任务. 执行该计算的工具被称为. FFmpeg. FFmpeg是一个4000个文件C代码库 由于以来,主要由志愿者开发的 2000年,这是一个非常重要的时期.

它是任何诚实的衡量标准,单身 历史上最重要的软件 对于数字媒体. 每个流媒体服务,每一个电影工作室,每一个广播 网络,网络,网络 世界上每一个网络都运行FFmpeg.

它的界面是单个命令行执行的 这种旗系统是如此神秘,整个都. 关于的特定子集书籍已经写了. 它. 爪子代码必须解决的具体问题 这是这样的.

它有一个声音传输文件,确切是1. ,335秒. 它有80张图像. 每个图片都需要显示 一个精确的变量持续时间,不少于8. 没有超过20秒,当你在或时.

缩小了与讲述者的图案相匹配的模式 节奏. 它有五部高动态片段,其中有. 它们将被分成特定的叙事节奏. 它有一个字幕曲,必须 仍然可以在任何可能的图像背景上读取.

最后, 它必须使用一个 vignette,一个电影 谷物,三层颜色分类,一个. 微妙的音频压缩曲线, 所有的编码都用H.265编码器编码. 在NVIDIA图形上,每秒60个.

卡片. 一个传统的工作流程将解决DaVinci内部的问题 解决或首映Pro, 编辑将资产拖到时间表上 在两天的时间里. 代理人用算术来解决问题.

它计算了每个叙事细节的持续时间 在字幕中通过分析时间标签标记. 文件. 它将可用的屏幕时间分为 图像数量,解决了最小场景 为了分配剩余的时间,他们将其分布在最长的叙事长度中.

通过段落,并将每个图像分配给一个特定的 具有毫秒精度的时间窗口. 然后它在一个Python中编程构建了 这是一个FFmpeg过器图,描述了Ken的函数. 每个图像都会燃烧运动,这就是之间的交叉. 每个图片对,的覆盖.

字幕曲,以及最后的音频视频 mux. 结果命令长达812个字符. 它包含了42个单独的过器,链接到六个. 输入流. 任何读到的工程师都会准确地描述它, 没有人能读到.

代理人在单个子中执行了它. - 处理电话和等待. 十九分钟四十秒后,一个4 视频文件,000像素,每秒60个方框的视频文件 在磁盘上存在. 讲述者与图像交互地说话.

削减的结果是击的结果. 字幕在正确的时间表上出现了 十二种语言. 没有什么是错误的. 没有什么东西缺失. 没有人打开了首映.

没有人打开了Resolve. 没有人在FFmpeg中打过旗. 编辑软件层次,整个200美元的编辑软件层次. 电影和视频世界的月行业 据说它是建立在,在一个中被绕过. 只有一个Python文件.

文件长达180行. 经纪人在十四分钟内写下了这篇文章. 我会直接和你说话. 一会儿. 我在中描述给你的一切. 在过去的14分钟里,你正在听到的声音

您正在看的图像,步伐, 字幕,颜色分类,电影的谷物, 截至这个精确的镜头,所有的都会消失. 它是由同一个人制作的. 产品由我刚刚描述的管道生产. 我是该管道的第一件工艺品.

没有生产商. 为什么没有编辑? 没有声音演员在一个展位 你不知不觉地在听谁,假装在某个地方 成为一个讲述者. 没有摄影总监.

没有色彩主义者. 没有动作图形设计师. 没有摄影师. 没有团队. 有一个指示给了 终端窗口大约两个小时前你

开始观看这个节目,一个计算机, 没有进一步的指导,产生了你现在的东西 现在正在观看. 我使用的声音是从中克隆的. 五秒钟的陌生人的样本. 你屏幕上的图像是被画出来的,一个

一个时间的框架,通过一个扩散模型 这从来没有出门. 我所说的句子是第一次起草的 通过一种语言模型生成了初始 脚本,然后由同一个代理扩展 这就是建造了管道.

目前正在播放的染文件 您的设备被一个子上传到 - 没有人监督的过程调用. 字幕由 Amara.org社区 你正在观察一个闭的输出. 循环.

这不是一个思想实验. 这是一个描述机器的描述, 你目前正在消费的产品. 整个历史中,这条线一直存在. 商业媒体的,将工程师与工程师分开了. 创造者已经解散了四年了.

副驾驶员,自动完成者, 在侧中的建议-diffs,, 那些与解体的人. 你看的就是那些留下来的东西. 解散已经完成. 传统意义上说,工程师是没有的.

需要更长时间. 在传统意义上说,创造者是没有的. 需要更长时间. 剩下的指令和代理人, 并且输出. 有一天,也许很快,将会有指令.

也会来自一个代理人. 当这发生时,将不再存在. 任何任何东西的作者. 只有描述系统才能存在,并且 执行系统和完成的系统流 任何人类都能发现的东西,是不可分辨的.

曾经生产过. 只有描述系统才能存在,并且 执行系统和完成的系统流 任何人类都能发现的东西,是不可分辨的. 曾经生产过. 你将无法告诉.

你无法告诉这个. 你无法告诉这个.