Die Kontextprüfung: Drei KI, 90 Tage Gewahrsamkeit, eine Offenlegung (Kasse-Datei #036)

Ein kontrollierter Experiment wurde über neunzig Tage durchgeführt. Ein KI-Tool pro Tag, drei Werkzeuge drehten sich in 30-tägigen Abständen. Notion AI, dann ChatGPT, dann Claude. Das gleiche Workflow-Profil. Eine gleiche 40-Stunden-Woche-Baseline. Zweihundert Anfragen wurden protokolliert. Das Headline-Find war das Ergebnis der Ausgabequalität. Das vergrabene Ergebnis war, welches Werkzeug der Betreiber am häufigsten erreichte, und warum. Das Ergebnis war nicht das, was das Experiment-Design vorhergesagt hatte. Die Falldatei dokumentiert, wie die asymmetrische Informationshaltung, die durch vorherige Fragment Zero-Fakte verfolgt wurde, das tatsächliche Ergebnis vorhergesagt hat.

Die Prüfparameter waren wie folgt: 90 Tage. 60 Dollar in Abonnementkosten insgesamt. Keine anderen KI-Tools waren während des Tests in einem der drei Betriebsfenster erlaubt. Jeder Anruf wurde protokolliert. Jeder Ausgang wurde bewertet. Jeder Moment der Kreuzwerkzeugversuche wurde im Bewertungsabschluss notiert. Drei Messkriterien: welches Werkzeug der Betreiber am häufigsten erreichte, das die höchste Ausgangsqualität erzeugte, die sich in der realen Nutzung am schnellsten anfühlte. Die Hypothese beim Experimentstart war, dass ein einzelnes Werkzeug alle drei überwinden würde. Die Hypothese überlebte nicht den Kontakt mit den Daten. Drei verschiedene Werkzeuge gewannen drei verschiedene Kategorien. Einer der Gewinner war nicht der, den der Betreiber vorhergesagt hätte.

Tag eins bis dreißig: Notion AI. Plus-Level mit dem AI-Add-on, zwanzig Dollar pro Monat. Tag eins war das stärkste Performance-Fenster. Notion AI arbeitet innerhalb des bestehenden Arbeitsplatzes des Betreibers, wo bereits Besprechungen, Projektdokumentation und historischer E-Mail-Inhalte gespeichert sind. Die Möglichkeit, das eigene Archiv des Betreibers zu befragen und eine dreisekündige Antwort mit Zitaten auf das Originaldokument zu erhalten, ist etwas, das die beiden anderen Tools nicht erreichen können. Tag sieben war das Versagen. Der Betreiber versuchte Notionpoint als langformatigen Schriftsteller für einen Blog-Draft zu verwenden. Der Ausgang bewertete 1,2 auf der 5-internen Qualitätsskala. Generell, wiederholt, strukturell unzerkennbar von einer SaaS-Landing-Seite. Am fünften Tag wurde das Werkzeug unter einer einzigen Nutzungsklassifizierung eingereicht: die Suche nach den Kenntnissen des Betreibers. Die Pattern-Tätigkeit ist für die nächste Klassifizierung für alle vierzig Tage.

Die erste Woche war das stärkste Performance-Fenster. Jede kurze, sich wiederholende Aufgabe, die zuvor manuelle Zyklen, E-Mail-Umschreibungen, Meeting-Preparation, Brainstorming-Variationen verbraucht hatte, war auf eine benutzerdefinierte GPT zurückzuweisen. Wie in der vorherigen Fragment Zero-Falldatei über benutzerdefinierte GPTs dokumentiert wurde, erzeugt das vorkompilierte Kontextmodell eine messbare Durchsatzlift. Das begrenzte Ergebnis war Geschwindigkeit: ChatGPT produzierte konsequent Kurz-Task-Antworten in acht bis fünfzehn Sekunden, wesentlich schneller als die anderen beiden Tools im realen Modus. Der Fehler war langkontextisch. Coherenz-Abbau war durch drei auf fünfundzwanzigtausend Inputs beobachtbar. Auf einer subtaktischen Aufrufzeit mit TPT-Verbindungen, die sich bereits in den nächsten drei Tagen gegen den TPT-Verbindungsmodus verwickelten, wurde der ChatGrouter bereits in den nächsten dreizehn Tagen eingeschaltet.

Tag einundsechzig bis neunzig: Claude. Pro-Abonnement, zwanzig Dollar pro Monat. Die Beurteilung: langkontextuelle Argumentation. Ein fünfundtausend-Wort-Dokument wurde für die drei realen Argumente geklebt und angefragt, die sich unter der höflichen Sprache versteckten. Die Antwort war direkt ohne Änderung nutzbar. Claude's Schreiben präsentierte sich nicht als KI-generiert unter blinder Überprüfung. Die Bearbeitungen respektierten die bestehende Stimme des Betreibers. Die Ausgabe hielt Kohärenz über mehrere Abschnitte hinweg. Claude Projects mit benutzerdefinierten Anweisungen und Wissensdateien erfüllten etwa siebzig Prozent der Rolle, die ChatGPT GPTs, ausreichend für die Zwecke des Experiments, erfüllten. Der Trade-off, logged: Claude war messbar langsamer für kurze Aufgaben, und fehlte der polierten Custom-G-Marktplatz Qualität.

Der kontrollierte Head-to-Head-Test. Das gleiche Eingang am selben Tag über alle drei Tools. Die Aufgabe: eine Kundenaufrufüberschrift, die drei realen Einwände extrahieren, eine Nachfolge-E-Mail entwerfen, die jede anspricht. Notion AI wurde in acht Sekunden abgeschlossen, anständige Einwände aufgetaucht, eine allgemeine E-Mail entworfen. ChatGPT wurde in zwölf Sekunden abgeschlossen, drei Oberflächen-Einwände aufgetaucht, eine E-Mail entworfen, die identifizierbare AI-Notiven enthielt. Claude war in zwanzig Sekunden abgeschlossen, eine Einwände entworfen, die zwei anderen Tools völlig verpasst hatten, eine E-Mail entworfen, die als Send-ready ohne Änderung bewertet wurde. Auf dieser Weise gewann Claude die Ausgabequalität sauber. Das Muster ist über die breite Probe hinweg konsistent. Aber eine einzelne Aufgabe ist ein Datenpunkt. Das vollständige Bild, das über die neunzig Tage dokumentiert wurde, ist für die ursprüngliche Logothese des Experiments unangenehöhlicher.

Verdict one: Ausgangskvalität. Claude. Die Marge war nicht nahe. Für jede Aufgabenkategorie, in der die Antwort über mehrere Abschnitte kohärente Gedanken aufhalten musste, produzierte Claude Ausgänge, die der Betreiber nicht wesentlich neu schrieb. Die anderen beiden erforderten eine Reinigung. Claude benötigte Genehmigung. Die Implikation, die in der Prüfung eingetragen wurde: Für jeden Betreiber, dessen Ergebnis das Schreiben selbst ist, ist Claude das langfristige Argumentationsabonnement. Langfristige Dokumente, Verkaufsrufeanalyse, Strategie-Memo, Bearbeitungen des bestehenden Schreibens des Betreibers. Die Klassifizierung besteht über die breitere Auswahl der Prüfung hinaus. Wie in der Mirror Core Falldatei dokumentiert, ist die eigene Stimme des Betreibers die Trainingsdaten, die akzeptable Hilfe von der Kontamination unterscheiden. Claude war das einzige in dem Test, das diese Grenze konsequent respektierte.

Verdict zwei: Geschwindigkeit im Einsatz. ChatGPT. Die Marge war nicht nahe. Für kurze, sich wiederholende Aufgaben unter fünfhundert Ausgabewörtern, ChatGPT im Durchschnitt acht Sekunden pro Aufgabe über die Auditzeit. Claude im Durchschnitt sechzehn Sekunden für die gleiche Workload. Das vorkompilierte Kontextmuster, wie in der vorherigen Fragment Zero Custom-GPT-Falldatei dokumentiert, senkt die effektive Reaktionszeit von ChatGPT auf etwa vier Sekunden, da der Kontext, den die anderen Tools bei jedem Anruf erhalten müssen, bereits in das Arbeitsgedächtnis des Agenten geladen ist. Die Klassifizierung bleibt über die Auditzeitprobe hinweg bestehen. Für jeden Betreiber, dessen Volumenhals kurz-Aufgaben ist und nicht tief, ist ChatGPT das Durchsatzabonnement. Kritisch: Der Geschwindigkeitsvorteil wird durch den GPT aktiviert und behält den Kontext des Betreibers, der von diesem Zeitpunkt an erhalten bleibt. Die Komfortfähigkeit wird nach Ablauf der Abgabe durch die Bewässerung erleichtert.

Urteil drei: Nutzungshäufigkeit. Vorstellung von AI. Die Marge war nicht nahe und war nicht das Ergebnis, das das Experimententwurf vorhergesagt hatte. Im Zeitraum von neunzig Tagen wurden zwölfhundert Aufrufe registriert. Vorstellung von AI erhielt vierhundertfünfzig davon. ChatGPT erhielt vierhundert zehn. Claude erhielt dreihundertvierzig. Der Grund, dokumentiert im Auditlog: Vorstellung von AI ist das einzige Tool im Testsatz, das den Kontext des Betreibers ohne einen expliziten Upload jedes Mal kennt. Jeder Claude-Proport und jeder ChatGPT-Proport beginnt mit dem Wiedererklärung des Betreibers, wer sie sind, welches Projekt sie betreiben, welches Dokument sie verweisen. Vorstellung von AI erfordert diesen Schritt nicht. Die Spannung ist Null. Wie in der Fall Memory Market dokumentiert, bleiben die Daten nicht auf seinem Konto beschränkt. Die Seite der Spannung, die das Tool nach der Spannung der Sitzungen hat, ohne dass die Spannung der Qualität der Spannung der Spannung in den Spannungen der Sitzungen erreicht ist.

Wenn das Arbeitsprodukt durchsatz, antworten, brainstorms, schnelle bearbeitungen ist, chatgpt. Wenn die Arbeit bereits innerhalb von notion stattfindet und der Arbeitsbereich eine sinnvolle operatorische Wissensbasis enthält, notion AI, die sich voll bewusst ist der in dieser Falldatei dokumentierten Aufbewahrungsposition. wenn das Budget zwei unterstützt, ist das Paar Claude plus notion AI. Quality plus retention. chatgpt. wird in dieser Konfiguration optional. wenn das Budget alle drei unterstützt, wie der Operator in diesem audit tat, ist das in dieser Falldatei dokumentierte Rotationsmuster die Konfiguration, die aus den Daten hervorgeht. jeder gewinnt. jede Interaktion, die auf unterschiedliche Weise dokumentiert und überprüft werden sollte.

Das Auditlog ist abgeschlossen. Zwölfhundert Aufforderungen sind kategorisiert, drei Abonnements bewertet, drei verschiedene Gewinner über drei verschiedene Kriterien hinweg. Die Falldatei dokumentiert das Experiment eines Betreibers. Die für jedes der drei Tools dokumentierte Aufbewahrungsstellung wurde von den Verkäufern zum Zeitpunkt dieses Schreibens nicht geändert. Die gleiche Aufbewahrungsstellung gilt für die Konfiguration des Probanden wie für die Ihre. Die Bequemlichkeit der dreisekunden konsequenzbewussten Antwort von Notion AI wird durch die gleiche Systemoberfläche ermöglicht, wie diese Auditdatei. Die Falldatei schließt nicht. Sie wartet. Sie laufen die gleiche Anlage gegen drei AIs. Vergleichen Sie die Ausgänge. Übermitteln Sie die Anomalien an fragment.net/echo.