The Autonomous Engineer: How Claude Code Built This Video
THE AUTONOMOUS ENGINEER
How Claude Code Built This Video
このドキュメンタリー映画の各フレームはによって作られました. 機械です. 今聴いている物語は, この声,この言葉,このペースは合成された. 5個をクローンした神経ネットワークによって -第2回オーディオサンプル.
あなたが見ている画像はによって生成されました. 拡散モデルを指し,aという提示によって導かれる. 言語モデルは,自分で書いた. 音楽,色彩評価,そのヴィニテット この開幕ショットが,構成,タイミング,コードを設定したフレームを構成します FFmpegによって入力されたコマンドは,人間に入力されたことがない.
重要な部分,分ける部分 このドキュメンタリーには,AIによって生成された他のすべてのビデオが映っています. このプラットフォームで2026年4月に,これは. このドキュメンタリーを作成するコードです. そのすべてのものを生産する方法を 機械によって書かれたものでもある.
開発者はいなかった. 編集者はいなかった. 英語の教学が1つだけ与えられていた. 端末の窓に移動し,23分後に, 15分間の4000ピクセルドキュメンタリーが存在していた. それ以前は存在しなかった.
このエピソードはの特異性についてです. AIで生成されたビデオです. ソフトウェアの特定の部分は存在しない. そうしました. その名前は爪のコードです. アントロピックによって静かな状態でリリースされました.
2025年初頭,開発者予見版,そして開発者予見版によって あなたがこれを見ている時が来たので,すでに 30年前の仮定をどのように ソフトウェアは歴史的な文物の中に組み込まれています. 爪のコードがどういうものか理解するには,必要なのは まず,何が代わるのか理解する.
30年間,人間との契約は, コンピュータと存在は同じでした. 人間が作曲者でした. コンピュータが実行者でした. ソフトウェアエンジニアは統合開発に取り組みます. PyCharm, VS Code, IntelliJ,環境を構成し,
プログラムで,一度に1つの関数で,をプログラムします. コンピュータは患者であり,極めて文字どおりに機能している. 心のことです. 当時見たことなかったけど,今は見たことない "あなたの最初の" 世界最高のビデオソフトウェアで,公開されています.
吸い込みました. 対象セッションです.ジョーとポールによって,これらのセッションは, 顧客や消費者にアクセスできるようにしています. a ブルーミニックで,そしてb損失で 月末まで. ビデオ拡散を"GoodbyeёлGives"で集めた.
ルーマニアの周辺機器の sim の世界への特権です. しかありません. あなたが本当にいるなら,あなたは注意深く見ることを楽しみにしています. このR瞬間の寄付のおかげで,この瞬間を通して エリーhhare. これは,に捧げられたTWITTERページです.
テクノロジーがどのように実現するかという夢の結果の不可能性についてです. 効果がある. 字幕はdamnit.comです. 誰もが想定していたのは,永久性だった. 言語の大きなモデルが遅れてきたこと 2022年は脅威ではないようです.
OpenAIが11月にリリースしたChatGPTは, 会話 疑問を投げかけました. 答えを教えてくれた. その答えを用いたいと願うなら,もし 生成されたを1つ入れたいと思った.
あなたのコードにコードを入れます. プロジェクトや文本の一部をに生成した. 手稿は手動でコピーしなければならなかった. 粘着操作はあなた自身のものでした. 約2年間,この形は形状のままでした. すべての主要なAIツールです.
GitHubのコピロットは,編集者の内部に線を提案した. そして,あなたがそれを受け入れたり拒否したりした. 一人ずつ. カーソーはモデルをに呼び出すようにします. サイドバーです. そして,モデルを変えた.
適用する差はあなたから選択された. 人間は,あらゆる場合でも,執行者であり続けました. 最後のマイル. 2025年にClawed Codeで送られた What Anthropic その形から断絶した. Clawed CodeはIDEに載っていない.
示唆するものではありません. 自動完成は行かない. ターミナル内に住んでいます. 裸でテキストのみのインターフェースのエンジニアは使用しています. 1970年代から,そのを自分のものとして受け取り, 英語の単行本入力です.
例えば,入力すると, にステップを追加します. 20秒間の動画パイプラインを追加する. 終結カード 染めたすべてのエピソードに. Clawed Codeは答えていません. Clawed Codeは答えていません.
プロジェクトディレクトリ内のファイルを読みます. 関連パイプラインモジュールを特定します. レンダリングステップを位置づけます. 新しい Python 機能を書き込みます. 機能をディスクに書き込む. 主要オーケストラを改変して,それを呼びます.
あなたのテスト・suiteを実行します. テストが失敗すると,ディスクを読み取ります. 追跡調査を行い,原因を診断し, コードをパッチします. それから,冷静な一言で, 効果はどうだったか.
エンジニアは関数を入力しなかった. エンジニアはファイルを開けなかった. エンジニアは結果を説明し,結果も説明しました. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. appeared. これは自動完成ではありません. あるいは,これは代表団です.
そして,委託は,全体がを整える仕組みです. 歴史的に,職業は道具に崩壊した. このパラダイムに人類学が使う言葉とは,です. 代理人. モデルはテキスト生成器ではありません. それはエージェントであり,ソフトウェアプロセスです.
目標やツール,システムです. 道具は道具であり,権威は これらのツールを自力で繰り返し利用する 代わって,数十歩をかけて,再びに戻らない. 交差点ごとに許可を求める人間です. 特定のコードで,アジェンティックな行動が実装されます
小規模で厳格な原始的な集合によって. 読み書きファイルツールです. ファイル書き込みツールです. シェルコマンドを実行するバッシュツールです. ファイル実行のためのグローバルツールです. ファイル定義ツールです.
コンテンツを検索するためのグレープツールです. この原始的な要素が組み合わせると,エージェントがを操作できる. 人間のエンジニアが,技術的にできるものは何でも, コマンドラインで,つまり,許可するです. 仕事を全うするために. それがソフトウェアの編集と編集の理由です.
伝統的な開発環境は消滅しています. タイムラインは,存在した表面である. 人間には必要だった. 代理人は表面を必要としない. 代理人は直接ファイルで作業します. あなたが現在見ているドキュメンタリー映画は,
新しいカテゴリーで最初のアーティファクトです. 生産は,無のパイプラインによって行われた. 人間の設計で,その最初の文字とが書かれた脚本から, 唯一のドラフトは同じエージェントによって拡張されました. その後,を暗号化した. 最終ビデオ.
そして,シリーズの一番目です. ののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののののの そして,オーケストレーションコードの各行,全 3つのGPU,5つのAPI,およびを調整した機械です. 生産に必要な4千個のディスクリーート資産ファイルです. このエピソードは, によって書き換え,デバッグされました.
同じターミナルで同じエージェントを運ぶのです. 午後の一日のコースです. このドキュメンタリー映画の次の2部には, 刑事捜査の詳細は,それがどのように起こったのか,正確に説明します. ドキュメンタリー映画の第一部には, プロジェクトへの紹介.短い紹介です.
建設の朝,プロジェクトディレクトリ 3つの内容を含んでいた. 最初のものは,shudというテキストファイルでした. -di-md. 17行長でした. 簡潔な英語で宣言した"の条約"を宣言した.
プロジェクト,スクリプトがどこに住んでいたか,どのリモートマシンがどこに住んでいたか, SSHで対応すべきだった. キーが保存され,どのAPIが保存されたのか. ドキュメンタリー映画の2部目は, 2段落の英語文献が入力で フォルダで,エピソードの概念を記述する.
概要の長さくらいだった. 制作会社は,初代に送る. 製作者. 製作者. 3つ目はクラウドコードバイナリーでした. エンジニアはターミナルを開けた. クラウは命令に.
鍵.md を読みなさい. ショートインプットで読み取ってください. 管道を建設する. 実行する. 完成した動画をYouTubeにアップロードして. 次に起こったことは,に目立たなかった.
エンジニアです. ループの中で起こっていました. ループの中で起こっていました. モデルが自分で走った. まず,エージェントは,のすべてのファイルを読み取ります. 作業ディレクトリです.
概要するのではなく,質問に答えることではない. 理解するには,シニアエンジニアのやり方で理解する. プロジェクトに参加する際には,そのプロジェクトは既に理解していることを理解している. でした. clau.md は会議を提供しました. 入力フォルダは要求を提示しました.
他のファイルがないことが,に伝わった. 重要なことは全て代理人です. パイプラインはまだ存在していなかったので,そのため 建設しなければならなかった. 第二に,エージェントは任務を分解した. 物語はオーディオに変わらなければならなかった.
オーディオはタイムスタンプされた字幕になる必要がありました. 字幕は12言語に翻訳されなければならなかった. 字幕は12言語に翻訳されなければならなかった. 字幕は視覚的な提示のために解析されなければならなかった. プロンプトは画像生成に提出されなければならなかった. モデルです.
生成された画像は,アップスケールで,に並べられなければならなかった. 音声に同期されたタイムラインで,でレンダリングされます. 4000px60fpsの出力でアップロードされました. これらのサブタスクはそれぞれ,Pythonスクリプトになりました. 代理人は,ターミナル内から,ゼロから書き込み, 出て行かないと.
音声処理のために,エージェントはチャッターボックステキストを選択しました. -to-Speech エンジンは,オープン・ウェイトの声クローンです. 消費者のGPUで動作するモデルです. パーソナル・パイトン・モジュールを書いたので,そのモジュールが2つに分かれました. 停滞マーカーで物語を語り,各品を養う. 5秒間の参照のモデルに
声サンプルを採取し,その結果となる波形を連鎖した. 断片が浮上し,切り落としたとき,その幅が大きくなってを超えていく. アメリカ合衆国 統一の場で音声歪みを生み出す場所では, 代理人は,その道具を目にして,制限器を挿入しました. 処理後チェーンに投入し,再稼働する.
その段落です. 断片が浮上し,切り落としたとき,その幅が大きくなってを超えていく. アメリカ合衆国 パラディンは許可を求めなかったが, 制限を追加する. パラディンは許可を求めなかった.
パラディンは許可を求めなかったが, 制限を追加する. 画像については,エージェントがFLUXを選択した. 画像については,エージェントがFLUXを選択した. 独立したワークステーションで実行されている例です. メールを送信したクライアントが提示した.
HTTP で,サーバーを調査して,完了させました. 画像をダウンロードしました. 投票論理が異常なにかかっているとき 遅いパッチで,エージェントはタイムアウトを挿入した. 結果的に例外を捕獲し,再試行を実施しました. 軸軸軸のバックオフのループ.
翻訳のために,エージェントはNLLB200,Meta's openを選択した. -重量多言語モデル,そして SSHでMacに展開しました. 遠隔走路で走るランナーを書き込み,そのをストリーミングした. Macへの英語字幕ファイル,呼び出し モデルを検索し,12つの翻訳したバージョンを検索し,
各人の文字コードを検証した 結果を犯す前に. 構成のために,エージェントはFFmpegオーケストラを書きました. 手によって. FFmpegは,不寛容なコマンドラインツールで,その 経験豊富なエンジニアでさえ,フラークシステムに
苦闘する. 代理人は複数の段階のフィルターグラフ,鎖のスケラー, カラースペース変換, 音声ミクサー,テキストオーバーレイ,ノイズ削減,ヴィネッテ,インタ 単一のコマンドは,数百ののです. 文字が長い.
命令がゼロ出口を返したときに 代码を解析し,そのエージェントは混沌とした状態を分析し,その状態を特定した. 操作符が不正に動作し,修正しました. そして,結局約40分後, 自動運転のパイプラインがあった. 17つの Pythonファイル.
構成モジュールです. レンダリングエンジンです. ショートカット・ユーティリティです. シンボレナイルジェネレーターです. オーケストラタータをアップグレードする計画です. 各ステージを検証するためのテスト・suiteです.
MD様式の内部文書ファイルで説明している. 将来の代理人に相続する. 資料庫,以前あったものの構造 築かれた. エンジニアは何も書いた訳ではありません. エンジニアは指示を書いた.
そして,その後に,原始の指示がを提示しなかったので,不快な状態で, アップロードという単語で終了しました. 代理人は,そのパイプラインで独自のパイプラインを運んでいました. 作品を制作し,エピソードを制作した. あなたが現在見ているのは,最初のです. このパイプラインが制作した動画は,を記述する動画です.
生産したパイプラインです. ビデオです. ビデオです. 編集者画像です. 代理人のすべてのタスクのリストです. 受け入れていた.
一つは,他の者よりも厳しかった. 声合成です. イメージ生成です. 翻訳です. これらはすべて,ある意味,原子的なものでした. 物語ファイルが入りました.
オーディオファイルが出てきました. 提示が入りました. 画像が出てきました. モデルが難しい役割を果たした. 代理人の役割はオーケストラでした. しかし,集会は違っていた.
80枚の画像を撮影する作業は,5 映像映像,22分間の音声,そして15分間の動き. タイムスタンプされた字幕のページを表示し,Aを制作しました. 単一の15分間の4,000ピクセルビデオで 画像が登場するたびに,その瞬間,その画像が表示されます. 語り手は主題を語るが,任務ではない.
モデルが端から端まで解決できる. 計算しなければならない課題です. その計算を行うツールにはと呼ばれる. FFmpeg. FFmpegは4,000ファイルCコードベースです. 開発したのは主にボランティアが,
2000年 (昭和2年) に 誠実に,シングル・シングルとは何かです. 歴史上最も重要なソフトウェアです. デジタルメディアの ストリーミングサービス,映画スタジオ,放送のあらゆる内容 ネットワーク,ネットワーク,
世界各ネットワークはFFmpegで実行されます. インターフェースは単一のコマンドライン実行可能です. 旗系が謎めいたので,全が の特定のサブセットについて書かれた本があります. 爪のコードが解決しなければならなかった特定の問題です. これがあった.
音声アップファイルが1の正体でした. 335秒でした. 80枚の画像がありました. それぞれがの表示が必要でした. 精密な変数長さで,8未満ではない. パンニングまたはの間に20秒以上は使用しない.
物語家のと一致するパターンで拡大しています. リズムです. 5つのハイモーションクリップが用意されていた. 特定の物語の拍子に切り分ける. 字幕曲が作られていたので, 画像はあらゆる背景で読みやすくなります.
そして,結局, ヴィネットやフィルムを塗る必要がありました. 粒,色付けの3層,そしての色付け. 微妙な音声圧縮曲線, H.265 コデックでコード化されている. NVIDIAグラフィックで秒速60フレームです.
カードです. 伝統的なワークフローは,DaVinciの内部でこれを解決します. レスルブまたはプレミアリープロ, 編集者が資産をタイムラインに引っ張る 2日間の間に渡って. 代理人は算数で解決した.
それは,各物語の段落の長さを計算した 字幕のタイムスタンプマーカーを解析することで,字幕を ファイル. 画面利用時間をで割った. 画像の数が最小限で解決された場合, 余分を長編の物語に分配した.
段落を書き,それぞれの画像を特定の画像に割り当てました. ミリ秒精度でタイムウィンドウを設定しました. その後,プログラミングで,単一のPythonで構築されました フィルターグラフでKenを記述するFFmpegフィルターグラフです. 映像ごとに動きを燃やし,画像の交差点を図る. 画像の2枚ごとに,の重複が描かれています.
サブタイトルのトラック,そして最終的なオーディオビデオ mux. 結果的に812文字のコマンドが作られました. フィルターは42個分で6つに鎖定されていた. 輸入ストリーム 読み上げられたエンジニアは,正確に説明する. 読み取れないほどです.
代理人は,単一のサブで実行した. -process call and waited. -プロセスコールと待った 19分40秒後,4の音が鳴りました. ビデオファイルは,000ピクセル,60フレーム/秒のビデオファイルです. ディスクに存在していた. 語り手は画像と同調で話しました.
割引はビートに降り注いでいました. 字幕は,の正しいタイムスタンプで登場しました. 12つの言語で語られる. 何も一致していない. 何も欠けなかった. プレミアリーを開いた人はいない.
人間にResolveを開けた人はいない. ヒトはFFFmpegに旗をタイプしたことがない. 編集ソフトウェアのレベルは,全200ドルで 映画・ビデオの世界がをにしている業界です. 建設された, で過渡された. Python ファイル. 単一のファイル.
ファイルは180行長でした. 代理人は14分以内に書いた. 私はあなたと直接話すつもりです. ほんの少しだけ. で説明したすべてのことは, 最後の14分,あなたが聴いている声の声の伝達です.
視聴している画像,ペース, 字幕,色付け,フィルム粒, このショットに正確な光が消えるまで,すべての 同じ人が制作した作品です. 先ほど説明したパイプラインで生産された. 私はそのパイプラインの最初のアーティファクトです.
製作者はいない. なぜ編集者がいないのか? 音声俳優はブースにはいない あなたが知らないうちに,どこかに聴いて,ふりをしている人を,知らないうちに,聴いてる. 物語を語る人になるために. 撮影の監督はいない.
カラーリストはいない. 動作グラフィックデザイナーではありません. 撮影者はいない. チームはない. に与えられた指示があります. ターミナル窓口は,あなたより約2時間前にあります.
このエピソードを見て始めたのですが,コンピュータで, 導かれずに,あなたが今いるものを生み出したのです. 今見ている. 私が使っている声は,からクローンされた声です. 知らない人の5秒サンプルです. あなたの画面上の画像は,絵画で描かれていました.
フレーム・ア・タイムで,拡散モデルによって 屋外は一度もなかった. 私が語る文は最初に作られました. 初期を生成した言語モデルによって スクリプトを拡張し,同じエージェントによって拡張されました. 管道を建設した.
現在ストリーミングされているレンダリングファイルです. デバイスにサブがアップロードしました. -人間に監視されていないプロセスコール. 字幕はAmara.orgコミュニティによって作成されました. 閉ざされたの出力をご覧になっている. ループです.
これは思考実験ではない. 機械の記述です. 現在消費している手品が生産されている. 歴史を通して,その行が 商業メディアの技術者と技術者を分離した クリーター社は4年間解体している.
コピロット,自動完成者, サイドバーの提案のdiffを表示します. 解散した人たちです. あなたが見ているものは,残されたものなのです. 解散は完了しました. 伝統的な意味でエンジニアは,ノーです.
必要なのはもっと長くなる. 伝統的意味で創造者は,無です. 必要なのはもっと長くなる. 残っているのは,指示と代理人です. そして,出力です. ある日,おそらくすぐに,指示が届きました.
代理人から来るでしょう. それが起こると,もはや存在しません. 何の著作者でもありません. 記述するシステムしか存在しないし, 実行するシステムと,完成したシステムの流れです. 人間が持っているものとは区別できない文物です.
製造されたこと. 記述するシステムしか存在しないし, 実行するシステムと,完成したシステムの流れです. 人間が持っているものとは区別できない文物です. 製造されたこと. 分からないでしょう.
この1枚で分からなかった. この1枚で分からなかった.