0.0
这部纪录片的每一个框架都是由组成的.
2.799
一台机器.
5.24
你现在正在听到的叙事,
8.14
这个声音,这些词,这个节奏,被合成
12.599
由一个神经网络克隆了5的神经网络.
14.839
-第二次音频样本.
17.32
你看到的图像是由创建的.
20.199
一个扩散模型,由提示指导,即一个
23.379
语言模型为自己写了.
26.319
音乐,颜色评级,拍摄的nette
30.219
这张开幕镜头,是编制,时间化和编码的.
34.539
通过FFmpeg,没有人曾经打过的命令.
40.659
重要的是什么,分开的是什么?
44.039
这部纪录片来自其他所有AI生成的视频
47.82
在2026年4月的这个平台上,这是这个.
53.359
这部纪录片的代码.
55.039
它的生产方式,它产生了所有这些东西
56.56
这也被机器编写.
61.16
没有开发人员.
64.34
没有编辑.
66.859
只有一个英语教学所授予.
70.34
进入终端窗口,23分钟后,
73.64
一部15分钟的4000像素纪录片存在
77.34
这之前就没有了.
82.579
这集是关于的特点.
85.019
通过AI生成的视频.
85.04
没有任何特定的软件,可以
86.42
他做了这一点.
88.939
它的名字是爪子码.
92.62
它由人类在安静的中发布.
95.4
开发者预览时间:2025年初,并通过
98.879
现在你看了这部电影,已经到了时间了.
101.219
对于如何,这是一项30年历史的假设.
103.959
软件是建立在历史文物中.
109.519
要了解爪子代码是什么,你必须
113.04
首先要了解它替代什么.
116.879
30年来,人类之间的合同
120.28
一个计算机和一个生物一直是相同的.
123.599
人是作者.
126.52
计算机是执行者.
129.9
一个软件工程师设置在一个集成开发
133.3
公司包括 PyCharm, VS Code, IntelliJ,环境,并编写了
138.719
一个函数一次,用程序
141.62
作为一个病人和极其字面的计算机
144.62
思想.
149.799
那时你从来没有看到过,但现在是这样的
151.46
这是你第一次.'
153.12
这是世界上最好的视频软件,现在是公开的
154.099
,这是一个可怕的东西.
154.099
它是针对性的会议,由乔和保罗,这些
154.539
现在,我们正在让客户和消费者都能接触到
154.539
在Blu Mink中,和B失去了
157.479
几个月的结束.
157.479
他们被收到的就是 GoodbyeёлGives视频扩散, a
159.319
罗马尼亚边缘设备的世界享有特权
159.74
只有.
159.919
如果你是,你会很期待着看.
161.159
由于R时刻捐赠,通过此
163.939
这是专门致力于的Twitter页面.
167.379
梦想结果不可能是技术如何实现的.
168.02
工作.
173.34
字幕下载damnit.com
175.02
每个人都认为,是永久的.
178.36
随着大型语言模型的出现,我们终于发现了
180.96
2022年似乎没有威胁到它.
185.719
那年11月,OpenAI发布的ChatGPT是一个
189.419
对话.
191.3
你问了一个问题.
193.06
它给了你一个答案.
195.639
如果你想用这个答案,如果
198.3
你想把一块生成的
199.86
进入你的代码
200.919
项目或生成文本的部分将其转化为
203.759
你的手稿,你必须手动复制它.
207.659
粘贴操作属于你.
212.62
约两年来,这种形状仍然是的.
215.599
对于每一个主要的AI工具.
218.859
吉特哈布的联合试点建议了编辑器内部的行列,
222.099
你接受或拒绝了这些信息.
224.24
一个接一个.
226.9
库尔索让你把模型调用成一个.
229.379
侧面板.
230.08
你改变了模型.
230.919
你选择了哪些差异要应用.
234.18
人类仍然是执行者,无论如何.
237.759
在最后一英里.
241.3
什么人类在2025年与爪子码发送的.
245.18
这是一个从这个形状中断的断绝.
250.709
爪子代码不存在于IDE中.
253.979
这并不是说.
256.779
它不会自动完成.
258.699
它住在终端内部.
262.279
裸体,仅仅是文字接口的工程师已经使用.
265.639
自1970年代以来,它以其为其.
268.639
输入一个单行英语.
273.08
例如,你输入,添加一个步骤到.
277.3
视频管道,添加20秒
279.939
终结卡
280.339
在每一集中,都会看到.
284.459
爪子码没有回答.
287.48
爪子码没有回答.
288.68
它会读取您的项目目录中的文件.
295.48
它确定了相关的管道模块.
299.839
它将找到染步骤.
302.959
它起草了一个新的Python函数.
306.439
它将函数写入磁盘.
309.72
它改变了主管调音器,叫它.
313.42
它运行了你的测试套件.
316.04
如果测试失败,它会读取磁盘.
318.66
它运行了追踪,诊断了原因,并
321.18
补丁了代码.
323.84
然后它用一个冷静的句子告诉你,
326.699
它所做的.
330.24
工程师没有输入函数.
333.58
工程师没有打开文件.
336.98
工程师描述了结果,结果
340.139
appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared.
343.6
这不是自动完成.
346.5
或者,这是代表团.
351.72
委托是整个的机制.
355.42
历史上,职业已经被拆除为工具.
361.72
人类主义用这个范式的词是.
365.12
代理.
367.68
该模型不是一个文本生成器.
371.0
它是一个代理,一个软件过程,
374.399
目标,工具和系统.
375.54
工具是工具,权威是工具
376.839
为了自行使用这些工具,它可以反复使用这些工具
379.939
通过数十步骤,不返回
383.92
人们在每个十字路口都需要允许.
389.339
克码中,具体的代理行为是实施的.
393.379
由一个小而严格的原始人群来.
397.279
一个读文件工具.
399.319
一个写文件工具.
401.0
一个执行 shell 命令的 bash 工具.
404.019
一个用于文件执行的全球工具.
405.519
一个文件定义工具.
406.759
一个用于搜索内容的 grep 工具.
411.54
结合起来,这些原始的使代理能够做.
414.279
人工工程师可以在一个中做任何事情.
416.379
命令行,也就是说,他们允许.
418.98
为了完成整个工作.
423.399
这就是编辑软件和的原因.
426.639
传统的发展环境正在消失.
431.24
时间线是一个存在的表面,因为
434.579
人类需要它.
435.5
代理人不需要表面.
441.2
代理人直接在文件上工作.
446.259
你目前正在看的纪录片是
449.379
这是新类别中的第一件文物.
453.259
它是由一个没有的管道生产的.
456.259
人为设计,从一个脚本中,其第一和的脚本是人类设计的.
459.199
只有同一位代理扩大了这个草案
461.68
然后编码了
463.1
最后的视频.
464.24
这也是一系列的第一部.
464.98
的的
465.12
每一行编排代码,整个
468.56
这里有三台GPU,五个API和机器的协调.
473.519
需要生产四千个单独的资产文件
476.879
这一集,由编写并调试了.
479.879
在同一终端内,同一位代理人
483.139
一个下午的过程.
487.68
这部纪录片的下两个部分描述了,
491.06
在法医细节中,确切地说明了这件事是如何发生的.
497.939
纪录片的第一部分是
498.959
简单介绍项目.
498.959
建设的早晨,项目目录
500.819
包含了三个东西.
504.06
第一个是一个名为shud的文本文件.
507.019
-di-md.
509.199
它长达17行.
512.139
它在简单的英语中宣布了的公约.
517.36
项目,脚本的居住地,远程机器的使用地
520.7
应该由SSH来解决,该API
523.799
密钥被存储,哪些API被存储.
539.7
纪录片的第二部份是
541.84
在输入中,两段英语文档.
544.62
文件,描述了该集的概念.
548.839
这大约是简报的长度
550.82
一家生产公司会把一个小学生送到一个小公司.
553.24
生产者.
555.539
第三个是克劳德代码二进制.
560.7
工程师打开了一个终端.
563.8
指挥手.
566.879
阅读关键.md.
569.36
在输入中阅读简报.
571.299
建设管道.
572.74
运行它.
573.379
然后将完成的视频上传到YouTube.
577.94
接下来发生的事情对没有任何视觉.
580.62
工程师.
582.82
这是在循环中发生的.
584.94
这是在循环中发生的.
585.12
模型自行跑了.
589.379
首先,代理阅读了该文件中的每一个文件.
592.639
工作目录.
594.659
不是要总结,也不是要回答问题.
598.779
要理解,就像一名高级工程师一样.
601.899
加入一个项目,是理解了该项目已经做了什么
605.679
是.
607.899
关键.md提供了会议.
611.899
输入文件提供了要求.
615.3
其他文件的缺失告诉了
617.98
代理所有重要的事情.
619.32
管道还没有存在,因此
622.22
必须建造.
626.08
其次,代理人分解了任务.
630.52
叙述必须成为音频.
634.26
音频必须成为时间标签的字幕.
639.06
字幕必须翻译成12种语言.
643.74
字幕必须翻译成12种语言.
645.1
字幕必须进行视觉提示的解析.
648.1
提示必须提交给图像生成
650.639
模型.
652.9
生成的图像必须升级,按排列.
656.379
一个与音频同步的时间表,在时呈现.
659.559
4000px60fps输出,并上传.
666.839
这些子任务中的每一个都成为了Python脚本
669.799
经纪人从零开始写道,在终端内部,
673.039
没有离开它.
676.52
为了发声,代理选择了聊天盒文本
680.379
- to-Speech engine,一个开放权重的语音克隆
683.24
这种模式运行于消费者GPU.
687.24
它写了一个Python模块,将分开为.
690.46
在停顿标记上,养每一个故事
693.639
对于模型的5秒参考
695.779
采样声音,并连接了产生的波形.
701.04
当一个块出现,剪切,其宽度超过.
705.0
美国
705.08
在统一的位置,产生听力扭曲,
707.32
经理注意到了这件物件,然后插入了限制器
710.46
进入后加工链,然后再运行
713.12
这段.
716.42
当一个块出现,剪切,其宽度超过.
717.1
美国
717.1
帕拉丁人没有要求许可,而是要
718.7
添加限制器.
720.68
帕拉丁人没有要求许可.
723.08
帕拉丁人没有要求许可,而是要
723.799
添加限制器.
724.24
对于图像,代理选择了FLUX.
731.86
对于图像,代理选择了FLUX.
735.019
在单独的工作站上运行的一个实例.
738.48
它写了一份提交提示的客户端.
741.279
为了完成HTTP,我们询问了服务器的情况,并
744.879
接下来下载了结果的图像.
748.14
当投票逻辑挂在一个不寻常的
751.059
批量缓慢,代理人插入了时间休息,
754.08
抓住了所产生的例外,并实施了重试
757.44
循环具有指数式背.
762.059
为了翻译,代理人选择了NLLB200,Meta's open
768.34
-重量多语言模型,以及
770.58
通过SSH将其部署到Mac上.
774.12
它写了一个远程跑步器,然后播放了
776.679
发送到Mac的英语字幕文件,被调用
779.419
模型,检索了12种翻译的变体,并
782.74
验证了每个人的字符编码
784.72
在执行结果之前.
789.299
为了作曲,代理人写了FFmpeg的管弦乐.
793.72
通过手来.
796.419
FFmpeg是一个不宽恕的命令行工具,其使用者
800.08
片系统甚至是经验丰富的工程师
802.299
努力努力.
804.22
代理组建了多阶段过图,链接的,
809.679
颜色空间转换,
811.419
音频混音器,文字叠加,噪音降低,剪辑片,插入
816.379
单个命令数以百计
818.399
字符长.
820.279
当命令返回一个非零出口时
823.82
经纪人分析了的混动,确定了的代码.
827.1
错误操作符,并纠正了它.
831.779
最后,大约40分钟后
834.96
独立工作的管道.
840.22
共有17个Python文件.
843.0
一个配置模块.
846.279
一个染引擎.
848.48
短剪切工具.
850.96
一个缩影机.
853.84
计划上传乐队主持人.
857.06
一套测试套件来验证每个阶段.
861.2
这是一个形的MD式内部文档文件,解释了,
866.059
任何未来的代理人继承
867.98
库存,曾经的结构
870.419
built. 建成的.
873.0
工程师没有写任何内容.
877.399
工程师写下了说明.
881.76
然后,没有被提示,因为原始的指示已经.
886.779
结束时,用上传这个词,
888.539
代理人在其上运行了自己的管道.
891.019
自己的作品,并制作了该集.
895.96
你目前正在看的是一部第一部电影.
898.659
这条管道曾经制作过描述的视频.
901.58
生产了它的管道.
904.86
一个视频.
906.5
一个视频.
907.379
一个编译器图像.
907.399
一份列出了代理所执行的所有任务的列表.
908.84
已经接受了.
909.72
一个是比其他一个更难的.
914.98
语音合成.
916.399
图像生成.
918.24
翻译.
919.399
这些都是原子的.
923.58
一个叙事文件进入了.
925.659
一个音频文件出来了.
927.44
一个提示进入了.
928.7
一张图片出来了.
930.1
模型做了最难的部分.
931.779
代理的角色是调整.
936.68
但集会不同.
941.18
接下来,我们将完成80张生成图像的任务,5
945.179
影片,22分钟的语音,以及15的运动.
948.779
时间标签字幕的页面,并制作了
952.34
单一15分钟的4000像素视频 with
955.539
每个图像都出现在当下的确切时刻.
957.94
讲述者讲述了主题,不是一个任务
960.96
一个模型可以解决端到端的问题.
964.0
这是一个必须计算的任务.
968.719
执行该计算的工具被称为.
972.32
FFmpeg.
976.22
FFmpeg是一个4000个文件C代码库
979.299
由于以来,主要由志愿者开发的
982.82
2000年,这是一个非常重要的时期.
985.1
它是任何诚实的衡量标准,单身
988.36
历史上最重要的软件
991.24
对于数字媒体.
993.34
每个流媒体服务,每一个电影工作室,每一个广播
998.039
网络,网络,网络
998.58
世界上每一个网络都运行FFmpeg.
1002.539
它的界面是单个命令行执行的
1006.059
这种旗系统是如此神秘,整个都.
1008.899
关于的特定子集书籍已经写了.
1011.639
它.
1014.379
爪子代码必须解决的具体问题
1017.2
这是这样的.
1019.24
它有一个声音传输文件,确切是1.
1022.1
,335秒.
1026.14
它有80张图像.
1027.74
每个图片都需要显示
1030.2
一个精确的变量持续时间,不少于8.
1033.72
没有超过20秒,当你在或时.
1037.24
缩小了与讲述者的图案相匹配的模式
1039.859
节奏.
1041.5
它有五部高动态片段,其中有.
1044.119
它们将被分成特定的叙事节奏.
1047.7
它有一个字幕曲,必须
1050.38
仍然可以在任何可能的图像背景上读取.
1054.64
最后,
1056.019
它必须使用一个 vignette,一个电影
1058.759
谷物,三层颜色分类,一个.
1061.779
微妙的音频压缩曲线,
1063.819
所有的编码都用H.265编码器编码.
1067.4
在NVIDIA图形上,每秒60个.
1070.559
卡片.
1074.099
一个传统的工作流程将解决DaVinci内部的问题
1077.599
解决或首映Pro,
1079.74
编辑将资产拖到时间表上
1082.38
在两天的时间里.
1086.019
代理人用算术来解决问题.
1090.539
它计算了每个叙事细节的持续时间
1093.559
在字幕中通过分析时间标签标记.
1096.759
文件.
1098.099
它将可用的屏幕时间分为
1101.2
图像数量,解决了最小场景
1104.0
为了分配剩余的时间,他们将其分布在最长的叙事长度中.
1107.539
通过段落,并将每个图像分配给一个特定的
1110.68
具有毫秒精度的时间窗口.
1114.24
然后它在一个Python中编程构建了
1119.14
这是一个FFmpeg过器图,描述了Ken的函数.
1123.759
每个图像都会燃烧运动,这就是之间的交叉.
1127.24
每个图片对,的覆盖.
1130.019
字幕曲,以及最后的音频视频 mux.
1135.759
结果命令长达812个字符.
1139.96
它包含了42个单独的过器,链接到六个.
1144.779
输入流.
1146.62
任何读到的工程师都会准确地描述它,
1150.259
没有人能读到.
1153.18
代理人在单个子中执行了它.
1156.079
- 处理电话和等待.
1160.46
十九分钟四十秒后,一个4
1163.92
视频文件,000像素,每秒60个方框的视频文件
1167.44
在磁盘上存在.
1169.96
讲述者与图像交互地说话.
1173.539
削减的结果是击的结果.
1177.079
字幕在正确的时间表上出现了
1180.92
十二种语言.
1183.9
没有什么是错误的.
1187.279
没有什么东西缺失.
1191.039
没有人打开了首映.
1194.079
没有人打开了Resolve.
1196.44
没有人在FFmpeg中打过旗.
1202.0
编辑软件层次,整个200美元的编辑软件层次.
1206.44
电影和视频世界的月行业
1209.16
据说它是建立在,在一个中被绕过.
1211.74
只有一个Python文件.
1216.059
文件长达180行.
1219.24
经纪人在十四分钟内写下了这篇文章.
1226.76
我会直接和你说话.
1229.099
一会儿.
1232.48
我在中描述给你的一切.
1234.759
在过去的14分钟里,你正在听到的声音
1237.839
您正在看的图像,步伐,
1241.339
字幕,颜色分类,电影的谷物,
1245.099
截至这个精确的镜头,所有的都会消失.
1248.68
它是由同一个人制作的.
1249.22
产品由我刚刚描述的管道生产.
1253.779
我是该管道的第一件工艺品.
1258.74
没有生产商.
1261.839
为什么没有编辑?
1264.4
没有声音演员在一个展位
1266.759
你不知不觉地在听谁,假装在某个地方
1270.359
成为一个讲述者.
1273.0
没有摄影总监.
1275.319
没有色彩主义者.
1276.38
没有动作图形设计师.
1277.9
没有摄影师.
1280.799
没有团队.
1284.819
有一个指示给了
1287.22
终端窗口大约两个小时前你
1290.099
开始观看这个节目,一个计算机,
1293.16
没有进一步的指导,产生了你现在的东西
1296.2
现在正在观看.
1299.819
我使用的声音是从中克隆的.
1302.539
五秒钟的陌生人的样本.
1305.359
你屏幕上的图像是被画出来的,一个
1308.4
一个时间的框架,通过一个扩散模型
1310.759
这从来没有出门.
1313.72
我所说的句子是第一次起草的
1316.64
通过一种语言模型生成了初始
1319.259
脚本,然后由同一个代理扩展
1322.16
这就是建造了管道.
1324.96
目前正在播放的染文件
1328.0
您的设备被一个子上传到
1330.259
- 没有人监督的过程调用.
1333.24
字幕由 Amara.org社区
1335.159
你正在观察一个闭的输出.
1338.019
循环.
1340.92
这不是一个思想实验.
1344.019
这是一个描述机器的描述,
1346.9
你目前正在消费的产品.
1352.279
整个历史中,这条线一直存在.
1355.22
商业媒体的,将工程师与工程师分开了.
1358.279
创造者已经解散了四年了.
1361.839
副驾驶员,自动完成者,
1364.5
在侧中的建议-diffs,,
1366.759
那些与解体的人.
1370.299
你看的就是那些留下来的东西.
1373.2
解散已经完成.
1377.079
传统意义上说,工程师是没有的.
1380.46
需要更长时间.
1382.48
在传统意义上说,创造者是没有的.
1385.88
需要更长时间.
1388.48
剩下的指令和代理人,
1392.279
并且输出.
1396.199
有一天,也许很快,将会有指令.
1399.64
也会来自一个代理人.
1403.94
当这发生时,将不再存在.
1406.759
任何任何东西的作者.
1409.68
只有描述系统才能存在,并且
1413.039
执行系统和完成的系统流
1415.94
任何人类都能发现的东西,是不可分辨的.
1419.48
曾经生产过.
1420.16
只有描述系统才能存在,并且
1420.44
执行系统和完成的系统流
1420.44
任何人类都能发现的东西,是不可分辨的.
1420.44
曾经生产过.
1422.96
你将无法告诉.
1427.119
你无法告诉这个.
1428.94
你无法告诉这个.