The Autonomous Engineer: How Claude Code Built This Video

THE AUTONOMOUS ENGINEER

How Claude Code Built This Video

كل إطار لهذا الفيلم الوثائقي تم تصنيفه بواسطة آلة. الرواية التي تستمع إليها الآن، تم تجميع هذا الصوت، هذه الكلمات، هذا التنقل، بواسطة شبكة عصبية تم تجميع خمسة -مثال صوتي ثانوي.

الصور التي ترونها تم إنشاؤها من قبل نموذج انتشار، يتوجّه إلى طلبات تظهر على الفور. وقد كتب نموذج اللغة لنفسه. الموسيقى، وتصنيف الألوان، والفصل الذي يُسجل يُصوّر هذا الصور الافتتاحي، ويتكون، ويتم توقيتها، ويتم تشفيرها ويقوم FFmpeg بإعطاء أوامر لم يكتبها أي إنسان من قبل.

الجزء المهم، والجزء الذي يفصل هذا الوثائقي من كل فيديو آخر الذي تم إنشاؤه بواسطة الذكاء الاصطناعي على هذه المنصة في أبريل 2026، هو هذا. الرمز الذي يخلق هذا الفيلم الوثائقي. الطريقة التي أنتجت بها كل هذه الأشياء كما أن هذا الكتاب قد كتب بواسطة آلة.

لم يكن هناك مطور. لم يكن هناك محرر. كان هناك تعليم واحد للغة الإنجليزية المقدمة إلى نافذة محطة، وبعد 23 دقيقة، كان هناك مستند يبلغ من المدة 15 دقيقة يبلغ طوله 4000 بكسل لم يكن هناك شيء من هذا القبيل من قبل.

هذا الحلقة تتعلق بتفاصيل المشكلة الخاصة بالمرأة الفيديو الذي تم إنشاؤه بواسطة الذكاء الاصطناعي. لا توجد قطعة خاصة من البرمجيات التي يمكن أن تُستخدمها فعل ذلك. اسمها هو الرمز الملتفاز. تم إصدارها بواسطة Anthropic في صمتٍ هادئٍ

المبدئية في بداية عام 2025، ومن قبل المطورين. لقد حان الوقت لتشاهد هذا، لقد حان الوقت بالفعل وقد أعلن افتراضًا عمره 30 عامًا حول كيفية ويتم بناء البرمجيات في أثرية تاريخية. لفهم ما هو الرمز الملتفاز، يجب عليك أن تكون أولاً، فهم ما يحل محلها.

على مدى 30 عاماً، كان العقد بين الإنسان وكان الكمبيوتر هو نفسه. كان البشر هو المؤلف. كان الكمبيوتر هو المُنفذ. مهندس برمجيات يستخدم تطوير متكامل وكتب PyCharm و VS Code و IntelliJ و Environment و

يُمكن أن يكون هناك عمل واحد في كل مرة، مع البرنامج يُعدّ الكمبيوتر المريض والحرفيّ للغاية العقل. لم تكن قد رأيتها حينها، ولكن الآن هي الآن أول مرة في حياتك.' إنه أفضل برنامج فيديو في العالم، أصبح عامًا الآن

إنه مقرف. إنها جلسات مستهدفة، وبحسب جو وبول، هذه الجلسات يتم جعل العملاء والمستهلكين متاحين في بلوو مينك، وبي خسارة في نهاية الأشهر. لقد تم التقاطهم ل GoodbyeёлGives فيديو انتشار، a

امتياز للعالم على أجهزة الحاجز الرومانية فقط. إذا كنتم ترون، فإنكم تتطلعون بعناية إلى مشاهدة هذا، بفضل التبرعات اللحظة R من خلال هذا إيريهار. هذا هو صفحة تويتر المخصصة للـ

مستحيل تحقيق النتيجة الحلمية فيما يتعلق بكيفية استخدام التكنولوجيا يعمل. الفرقيةdamnit.com واعتبر الجميع أن هذا كان دائمًا. ووصول نماذج لغة كبيرة في أواخر القرن الماضي ولم يبدو أن 2022 قد يهددها.

كان ChatGPT، الذي أطلق عليه OpenAI في نوفمبر من ذلك العام، هو نوع من التفاصيل. المحادثة. لقد طرحت على الأمر سؤالًا. لقد أعطاكِ إجابة. إذا كنت ترغب في استخدام هذه الإجابة، إذا أردت وضع قطعة من المنتج

في رمزك أو قطعة من النص المولود في مشروع أو متن كان عليك نسخ مخططك يدوياً. كانت عملية التلويغ لك. لمدة عامين تقريباً، ظل هذا الشكل على النحو نفسه. من كل أداة ذكاء اصطناعي رئيسية.

اقترح GitHub co-pilot خطوط داخل محرركك، و قد قبلتهم أو رفضتهم واحد في كل مرة. السلطان يسمح لك بإدعاء النموذج إلى a شريط الجانب. وقد غيرت النموذج.

لقد اخترت أي اختلافات ستطبق. وبقيت الإنسان، في كل الأحوال، المُعدّم. من آخر ميل. ما أرسلت شركة أنثروبيك في عام 2025 مع رمز المسامير كان هناك انفصال فوري عن هذا الشكل. لا يعيش Code Clawed Code في إدارة التشغيل الإلكتروني.

لا يقتترح ذلك. لا يكتمل الذات. إنه يعيش داخل محطة. وقد استخدم مهندسو واجهة الرماد والنص فقط منذ سبعينيات القرن الماضي، ويعتبر هذا الأمر بمثابة أهمية خاصة به. إدخال خط واحد من اللغة الإنجليزية.

يمكنك كتابة، على سبيل المثال، إضافة خطوة إلى أنبوب الفيديو الذي يضيف 20 ثانية بطاقة نهاية إلى كل حلقة تم عرضها. لا يجيب كود المسامير. لا يجيب كود المسامير.

يقرأ الملفات في دليل المشروع الخاص بك. يحدد هذا النظام ماودول خط الأنابيب المعني. يحدد موقع خطوة الإصدار. وهو يصمم وظيفة Python الجديدة. يكتب هذا العمل على القرص. يغير الموسيقي الرئيسي ليتسم به.

إنه يدير مجموعة الاختبارات الخاصة بك. إذا فشل اختبار، فإنه يقرأ القرص. ويقوم بتعقب المشكلة ويقوم بتشخيص السبب وراء ذلك. يصلح الرمز. ثم يخبرك، في جملة هادئة واحدة، ما فعلته.

لم يكتب المهندس الوظيفة. لم يفتح المهندس الملف. وصف المهندس النتيجة، والنتيجة ظهرت. هذا ليس كاملاً ذاتيًا. أو، هذه هي وفد.

والمنصب هو الآلية التي يستخدمها الكامل وقد انهيت المهن، تاريخيا، إلى أدوات. كلمة استخدامات الأنثروبية لهذه النموذج هي وكالة. النموذج ليس مولداً نصياً. إنه وكيل، عملية برمجيّة مع

أهداف وأدوات ونظام. الأداة هي الأداة، والسلطة هي الأداة. لاستخدام هذه الأدوات بشكل متكرر على حدة على سبيل المثال، عبر عشرات الخطوات، دون العودة إلى ويتم إصدار الطلبات البشرية للحصول على إذن في كل صفح. يتم تنفيذ سلوك منخفض، في الرمز المسموم بشكل خاص،

بواسطة مجموعة صغيرة وصعبة من البدائيين. أداة قراءة الملفات. أداة كتابة ملفات. أداة بش التي تنفذ أوامر القبو. أداة عالمية لتنفيذ الملفات. أداة تحديد الملفات.

أداة إضافية للبحث عن محتوياتهم. وبالجمع، هذه الأسباب البدائية تسمح للوكيل بفعل أي شيء يمكن أن يفعله مهندس إنسان في مرحلة خط الأوامر، أي أنهم يسمحون ليفعلوا العمل بأكمله. وهذا هو السبب في تحرير البرمجيات والتحرير.

وتختفي بيئات التنمية التقليدية. وتعتبر الخط الزمني سطحاً كان موجوداً لأنه كان الإنسان بحاجة إليها. لا يحتاج الوكيل إلى السطح. يعمل العميل مباشرة على الملف. هذا الوثائقي الذي تراه حاليا هو فيلم

أول قطعة في فئة جديدة. وقد تم إنتاجه بواسطة خط أنابيب لا يمكن أن يصل إليه صمم من قبل الإنسان، من نص الذي أول و تم توسيع مسودة المشاريع فقط من قبل نفس الوكيل ثم قام هذا بتشفير الفيديو النهائي.

وهذه هي أول سلسلة من السلسلة من من من وكل خط من رموز التنسيق، والكل الآلات التي تنسق ثلاث GPUs، وخمس APIs، و أربعة آلاف ملف من أصول منفصلة مطلوبة لإنتاج هذا الحلقة، تم كتابتها وإبثاره من قبل الموقع

وكيل داخل نفس المحطة فوق نفس المحطة بالطبع من بعد ظهر واحد. يصف الجزءين التاليين من هذا الفيلم الوثائقي، في التفاصيل الطبية الجنائية، بالضبط كيف حدث ذلك. الجزء الأول من الفيلم الوثائقي هو قصة مقدمة قصيرة للمشروع.

صباح البناء، دليل المشروع يحتوي على ثلاثة أشياء. كان الأول ملف نصي يدعى شود -di-md. كان طوله سبعة عشر سطراً. وأعلنت، باللغة الإنجليزية المُبسطة، اتفاقيات

المشروع، حيث عاش النصوص، والآليات النائية كان من المفترض أن يتم التعامل معها بواسطة SSH ، والتي تتم استخدامها في API تم تخزين المفاتيح، وأي APIs تم تخزينها. كان الجزء الثاني من الفيلم الوثائقي وثيقة لغة إنجليزية ذات أحاديثين في المدخل المجلد، يصف مفهوم الحلقة.

كان هذا تقريباً طول المقالة المختصرة ستقوم شركة إنتاج بإرسال شخص صغير إلى شركة إنتاجية المنتج. المنتج. والثالث كان رمز كلود الثنائي. فتح المهندس محطة. القمّة على الإرشاد.

اقرأ الموقع.md. اقرأ المختصر في المدخل. بناء خط الأنابيب. أطلقها. ثم قم بتحميل الفيديو النهائي إلى يوتيوب. ما حدث بعد ذلك لم يكن مرئيًا للجنة

مهندس. كان يحدث داخل حلقة. كان يحدث داخل حلقة. وقد ركضت النموذج بنفسها. أولاً، قرأ الوكيل كل ملف في الملف. المجلة العاملة.

لا تلخيص، لا تجيب على سؤال. لفهمها، بالطريقة التي يستخدمها مهندس كبير في مجال الهندسة الانضمام إلى مشروع يفهم، ما يفهمه المشروع بالفعل كان. وقدمت clau.md اتفاقيات. وقد قدم المجلد المدخل المتطلبات.

وقال غياب أي ملفات أخرى لـ كل شيء مهم وكيل. لم يكن خط الأنابيب موجودًا بعد، وبالتالي كان يجب أن يتم بناؤه. ثانياً، قام العميل بتفكيك المهمة. كان يجب أن يصبح السرد رواية.

كان على الصوت أن يصبح مضيفاً معتمداً على الوقت. كان يجب أن يتم ترجمة الترجمة إلى 12 لغة. كان يجب أن يتم ترجمة الترجمة إلى 12 لغة. كان يجب تحليل الترجمة لتحديد الإشارات البصرية. كان يجب تقديم الطلبات إلى إنتاج الصور النماذج.

كان على الصور المولدة أن تكون عالية النطاق، وتنظيمها على خط زمني متزامن مع الصوت، يتم تقديمه في إنتاج 4000px60fps، وتحميل. كل من هذه المهام الفرعية أصبحت نص Python كتب العميل من البداية، داخل المحطة، دون تركها.

للفصل الصوتي، اختار الوكيل متن Chatterbox Text محرك -لـ Speech، وهو نسخ صوتي مفتوح الوزن نموذج يعمل على GPU المستهلك. كتب هذا ماودول Python الذي ينفصل بين وتحدث عن التفاصيل عند علامات التوقف، وتغذية كل قطعة على النموذج مع مرجع 5 ثوانٍ

عينة صوتية، وتحديد الموجات الناتجة. عندما ظهر قطعة، وقطعت، ومتجاوزت ضخامتها الولايات المتحدة الأمريكية وفي أماكن الوحدة وتنتج التشوهات السمعية، لاحظ العميل الفن، ووضع مقيّدًا إلى سلسلة ما بعد المعالجة، وإعادة تشغيل

هذا القطاع. عندما ظهر قطعة، وقطعت، ومتجاوزت ضخامتها الولايات المتحدة الأمريكية لم يطلب الفردان الإذن، بل طلبوا الإذن. إضافة الحدّ. لم يطلب الفردان الإذن.

لم يطلب الفردان الإذن، بل طلبوا الإذن. إضافة الحدّ. بالنسبة للصور، اختار الوكيل FLUX. بالنسبة للصور، اختار الوكيل FLUX. مثالاً يعمل على محطة عمل منفصلة. كتبت العميل الذي قدم طلبات حول

وذلك بعد أن قاموا بإجراء استطلاع على الخادم لإكمالها، وذلك على شكل HTTP. تم تنزيل الصور الناتجة. عندما كان منطق الاقتراع معلقاً على طريقة غير عادية اللحظة البطيئة، قام العميل بإدخال وقت وقف، واصطاد الاستثناء الناتج، وطبق محاولة إعادة حلقة مع تعريض تعريض.

لترجمة، اختار الوكيل NLLB200، Open Meta's -النموذج متعدد اللغات، و ونشرتها عبر SSH إلى Mac. كتب ذلك مسيرًا بعيدًا يُبث على الهواء البريطاني الملف الموضح باللغة الإنجليزية إلى ماك، استدعاء وقد استعاد النموذج، واسترد 12 فريبة ترجمة، و

وافقت على تشفير كل شخصية قبل أن تقوم بتنفيذ النتيجة. بالنسبة إلى التركيب، كتب الوكيل ترقيم FFmpeg. يدوياً. FFmpeg هو أداة خط الأوامر التي لا تغفر لها حتى مهندسين ذوي الخبرة في نظام الـ flake system

مع صراع مع. وقد قام العميل بتكوين الرسوم البيانية المعدنية للفائض المتعددة المراحل، والسلاسل المتسلسلة، تحويلات مساحة الألوان، مزاجات الصوت، وتداول النص، وتقليل الضوضاء، والخريطات الصوتية، والإدخال إلى أمر واحد مئات من حرف طويل.

عندما أعاد أمر خروج غير صفر وذلك عندما قام العميل بتحليل المزاج، واكتشف الرمز قاموا بتصحيح عامل خطأ، واصححوه. وفي النهاية، بعد حوالي 40 دقيقة من العمل الذاتي، كان هناك خط أنابيب. سبعة عشر ملفات بيثون.

وحدة تكوين. محرك التصوير. خدمة قطع القصص. مولد الصور الصغيرة. خطة تحميل الموسيقي. مجموعة اختبار للتحقق من كل مرحلة.

ملف وثائق داخلية في نمط MD المضخم يشرح، إلى أي وكيل مستقبلي يرث المخبز، وهيكل ما كان عليه تم بناء. لم يكتب المهندس أي منهما. وقد كتب المهندس التعليمات.

ومن ثم، دون تلقاء، لأن التعليمات الأصلية كانت تتميز ب انتهى بالكلمة "تحميل" كان العميل يدير خط الأنابيب الخاص به على قاعدة التدريب الخاصة به. عملت على نفسها وإنشأت الحلقة. ما تراه حالياً هو أول فيلم فيديو تم إنتاجه من قبل هذا النظام الذي يصف

أنابيب الإنتاج التي أنتجتها. فيديو. فيديو. صورة للمجمّع. قائمة بجميع المهام التي يقوم بها الوكيل كان قد اتخذت.

كان واحد منهم صعب بشكل واضح على الآخرين. التوليد الصوتي. إنتاج الصور. ترجمة. وكانت هذه كلها، في معنىٍ ما، ذرية. دخلت ملف رواية.

خرج ملف صوتي. دخلت إشعار. خرجت صورة. وقد قام النموذج بالجزء الصعب. كان دور العميل هو تنظيم. لكن الجمعية كانت مختلفة.

مهمة أخذ 80 صورة تم إنشاؤها، 5 مقاطع الحركة، 22 دقيقة من الصوت، و15 وذلك من خلال إعداد صفحة من المخطوطات المختومة بالوقت، وإنتاج المخطوطات. فيديو واحد لمدة 15 دقيقة يبلغ 4000 بكسل مع كل صورة تظهر في اللحظة الدقيقة التي يظهر فيها الصورة يتحدث الناطق عن الموضوع، وليس مهمة

يمكن لنموذج حل نهاية إلى نهاية. إنها مهمة يجب تحسّبها. ويتم تطبيق أداة تقوم بهذه الحسابات باسم FFmpeg. FFmpeg هو قاعدة شفرة C ذات 4,000 ملف وقد تم تطويرها بشكل رئيسي من قبل المتطوعين منذ

عام 2000. إنه من أي مقياس صادق هو واحد أهم قطعة من البرمجيات في التاريخ من وسائل الإعلام الرقمية. كل خدمة بث، كل استوديو سينمائي، كل بث شبكة،

كل شبكة في العالم تعمل على FFmpeg. واجهته هي خط قيادة واحد يمكن تنفيذها نظام علمي غامض جداً، يُمكن أن يُعَدّ كاملًا وقد كتبت كتب عن مجموعات فرعية محددة من ذلك. المشكلة المحددة التي كان على Clawed Code حل بها

كان هذا. كان له ملف صوتي من بالضبط 1 335 ثانية. كان هناك 80 صورة. كل منها كان يجب أن يظهر على العرض من أجل مدة متغيرة دقيقة، لا تقل عن 8

لا يزيد عن 20 ثانية، أثناء التشويش أو التشويش. زوم في نمط يطابق مع رواية القرّي الإيقاع. كان هناك خمسة مقاطع عالية الحركة التي كانت تتميز بـ يجب أن يتم تحديدها إلى ضربات روائية محددة. كان هناك مسرحية تحت عنوان كان عليها أن تتم

تبقى قابلة للقراءة ضد كل خلفية ممكنة من الصور. وفي النهاية، كان يجب أن يطبق على الفيلم، أو الفيلم. الحبوب، ثلاث طبقات من تصنيف الألوان، و منحنى ضغط الصوت الملموس، جميعها مرموزة بمعاقل H.265 في جميع أنحاء

60 إطار في الثانية على رسومات NVIDIA بطاقة. سير العمل التقليدي سيحل هذا داخل دافينشي حل أو بريمير برو، مع محرر يجذب الأصول إلى جدول زمني على مدى يومين.

وقد حلّ العامل الأمر بالعدل. وقد حاسبت مدة كل قطاع روائي من خلال تحليل علامات العلامة الزمنية في الترجمة الفرعية الملف. وقد قامت بتقسيم وقت الشاشة المتاحة بالـ عدد الصور، وحل لحد أدنى من المشهد

ويقومون بتوزيع الفائض على أطول طول رواية الممرات، ويعطي كل صورة إلى صورة محددة نافذة زمنية مع دقة ميل ثانية. ثم بنيت، برنامجيا، في بيثون واحد وظيفة FFmpeg، وهي رسمية مرشحات FFmpeg تصفية لـ Ken يحرق الحركة لكل صورة، والتحليق بين الصور.

كل زوج من الصور، والانكماش من الصور المسار الفرعي، والصوت الفيديو النهائي mux. وكانت الأوامر الناتجة 812 حرفاً طويلاً. كان يحتوي على 42 مرشح منفصلة متسلسلة عبر ستة وتدفقات المدخلات. أي مهندس يقرأها سيصفها بدقة،

غير قراءة. قام العميل بتنفيذها في فرع واحد -العملية المكالمة والانتظار. بعد تسعة عشر دقيقة وأربعين ثانية، كان هناك 4 000 بكسل، 60 إطار في الثانية في ملف الفيديو كان موجوداً على القرص.

تحدث الراوي بالتزامن مع الصور. ووصلت القطع إلى النتائج. ظهرت الفرقية على العلامات الزمنية الصحيحة في اثني عشر لغة. لم يكن هناك أي شيء غير مصحوب. لم يفتقد أي شيء.

لم يفتح أي إنسان Premiere. لم يفتح أي إنسان "ريزولف". لم يكن هناك أي إنسان قد كتب علم في FFmpeg. وذلك في فئة البرمجيات التحرير، حيث يتم دفع كل 200 دولار أمريكي في كل عام. الشهر الصناعي الذي يشهده عالم الأفلام والفيديو كان مبنيًا على، وكان قد تم تجاوزه في حلقة

ملف Python واحد. كان الملف 180 سطرًا طويلاً. وقد كتب العميل ذلك في غضون أربعة عشر دقيقة. سأتكلم معك مباشرة لبعض الوقت. كل ما وصفته لك في المقالة

في الأربعة عشر دقيقة الأخيرة، فإن الصوت الذي تستمع إليه هو الصوت الذي تستمع إليه. إلى الصور التي تراقبها، والحركة، والترجمة، والصفوف اللونية، والحبة من الفيلم، وذلك في حالة التلاشى إلى هذه اللقطة بالضبط، كل شيء وقد تم إنتاجه من قبل نفس الشخص. إنتاجها خط الأنابيب الذي وصفته للتو.

أنا أول أثاث في هذا النزيل. لا يوجد منتج. لماذا لا يوجد محرر؟ لا يوجد ممثل صوتي في الكشك ومن الذي تستمع إليه دون أن تعرفه، وتظاهر في مكان ما أن تكون راويًا.

لا يوجد مدير للفوتوغرافية. لا يوجد ملون. لا مصمم رسوم متحركة. لا يوجد مصور سينمائي. لا يوجد فريق. هناك تعليمات أعطيت ل

ونظيفة المحطة قبل ساعتين تقريباً من قبلك بدأ مشاهدة هذا الحلقة، وكمبيوتر يقول، بدون إرشاد آخر، أنتجت الشيء الذي أنت عليه. الآن تراقب. لقد تم استنساخ الصوت الذي أستخدم منه عينة خمس ثوانٍ من الغريب.

تم رسم الصور على شاشتك، واحدة الإطار في وقت واحد، بواسطة نموذج الانتشار لم يكن هذا أبداً في الخارج. كانت الجمل التي أتحدث عنها هي الأولى التي تم إعدادها من قبل نموذج لغة تولى البداية النص، ومن ثم تم توسيعه بواسطة نفس الوكيل

الذي بنى خط الأنابيب. الملف المُرسل الذي يتم بثه حالياً تم تحميل جهازك من قبل فرعية -تصل العملية التي لا يراقبها أي إنسان. المخطوطات من قبل مجتمع Amara.org أنت تراقب إصدارات الموقع المغلق

حلقة. هذه ليست تجربة تفكير. إنه وصف للآلة التي الفن الذي أنتجته حالياً. الخط الذي كان له، على مدى التاريخ بأكمله من وسائل الإعلام التجارية، ففرقت المهندس عن المهندس.

لقد كان المبدع يذوب منذ أربع سنوات. الطيارين المشتركين والمتكملين السيارات التداخلات المرجحة في شريط الجانب، أولئك الذين لديهم الإختراق. ما تشاهده هو ما تبقى بعد ذلك. إن الانفصال قد اكتمل.

المهندس، في المعنى التقليدي، هو لا لا بد من أن يكون الأمر ضروريًا أكثر. إن المبدع، في المعنى التقليدي، ليس هو لا لا بد من أن يكون الأمر ضروريًا أكثر. ما يبقى هو التعليمات والوكيل، والخروج.

وفي يوم ما، ربما قريب جدا، سيتم إعطاء التعليمات. وسوف تأتي من وكيل، أيضا. عندما يحدث ذلك، لن يكون هناك أيّة إعلانات أخرى. أي مؤلف لأي شيء على الإطلاق. سيكون هناك أنظمة تصف فقط، و أنظمة تنفيذية، وتدفق من المنتهيات

الأثاث التي لا يمكن التمييز عنها عن الأثاث التي يمتلكها أي إنسان وقد تم إنتاجها من قبل. سيكون هناك أنظمة تصف فقط، و أنظمة تنفيذية، وتدفق من المنتهيات الأثاث التي لا يمكن التمييز عنها عن الأثاث التي يمتلكها أي إنسان وقد تم إنتاجها من قبل.

لن تكون قادراً على معرفة ذلك. لم يكن هناك أي خبر بهذا. لم يكن هناك أي خبر بهذا.