0.0
Um experimento controlado foi realizado durante 90 dias.
3.6
Uma ferramenta de IA por dia, três ferramentas rotadas
6.839
em intervalos de 30 dias.
8.619
Noção de IA, então ChatGPT, então Clawed.
12.22
O mesmo perfil de fluxo de trabalho, a mesma linha de base de 40 horas por semana,
16.239
1.200 pedidos foram registrados.
18.14
A conclusão principal foi o veredicto de qualidade de saída.
21.32
O achado enterrado era qual a ferramenta que o operador
23.739
alcançou com mais frequência e por quê.
26.039
O veredicto não foi o que o experimento fez.
28.12
O design foi previsto.
29.219
O arquivo do caso documenta como a informação assimétrica
32.299
A postura foi rastreada através de arquivos de casos anteriores do Fragmento 0.
36.02
Previu o resultado real.
39.74
Os parâmetros de auditoria eram os seguintes.
42.7
90 dias.
44.14
$60 no custo total de assinatura.
46.719
Nenhum outro instrumento de IA permitido em qualquer um dos
49.6
as três janelas operacionais durante o teste.
51.899
Todos os pedidos foram registrados.
53.38
Cada saída classificada.
54.78
Cada momento de tentação de ferramenta cruzada foi notado em
57.619
o log de avaliação.
59.219
Três critérios de medição, que a ferramenta que o operador alcançou.
62.439
Na maioria das vezes, o que produziu a maior saída
65.56
qualidade, que se sentiu mais rápido em uso real.
68.54
A hipótese no início do experimento era que um
71.26
Uma única ferramenta ganharia em todas as três.
73.719
A hipótese não sobreviveu ao contato com o
76.68
dados. dados.
77.26
Três ferramentas diferentes ganharam três categorias diferentes.
80.54
Um dos vencedores não foi o .
82.299
Os resultados não foram tão bons quanto os resultados.
83.26
Os resultados do experimento.
83.579
Dias 1-30.
85.519
Noção de IA.
86.68
Mais um nível com o ad-on de IA.
88.9
20 dólares por mês.
90.26
O Dia 1 foi a janela de desempenho mais forte.
92.62
Noção de IA opera dentro do espaço de trabalho existente do operador,
96.359
onde as notas de reunião, a documentação do projeto e o e-mail histórico
99.799
O conteúdo já está armazenado.
101.56
A capacidade de consultar o próprio arquivo do operador
104.26
e receber uma resposta de três segundos com citações
106.879
O documento original é algo que o outro não consegue ver
109.12
duas ferramentas não podem combinar.
110.62
O dia 7 foi o evento de falha.
112.459
O operador tentou usar a Noção de IA como
114.879
um escritor de longa duração para um esboço de blog.
116.939
A saída foi avaliada como 1.2.
118.84
.
118.879
O menos que um carpo.
124.92
Pois a resposta exata deve ser ainda desvantagem
127.359
Cuomo aceitará.
134.3
O The
134.599
O protagonista é o protagonista.
135.099
próprio own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own own
135.199
De sete em sete
135.62
O fim.
136.099
A primeira semana foi a janela de desempenho mais forte.
138.52
Cada tarefa curta e repetitiva que consumiu anteriormente.
141.46
ciclos manuais, reescrituras de e-mail, reunião
144.319
Preparar, fazer variações de brainstorming, foi reassignável a um custom.
148.28
GPT.
149.06
Como documentado no caso anterior Fragment 0
151.78
Arquivo sobre GPTs personalizados, o contexto pré-compilado
154.819
O modelo produz um elevador de transmissão mensurável.
157.259
O limite foi a velocidade.
159.36
O Chat GPT produziu consistentemente respostas curtas de tarefas em.
162.759
8-15 segundos, materialmente mais rápido
165.08
do que as outras duas ferramentas em uso real.
167.18
O modo de falha foi o longo raciocínio contextual.
171.16
Dia 61 a 90, Claude.
174.02
Assinatura Pro, $20 por mês.
176.62
A capacidade de avaliação, o raciocínio longo do contexto.
180.199
Um documento de 15.000 palavras foi colado e foi colocado em uma tela de arco.
183.24
Perguntado pelos três argumentos reais escondidos sob
186.02
a linguagem educada.
187.06
A resposta foi diretamente utilizável sem modificações.
190.46
A escrita de Claude não se apresentou como gerada por IA
193.199
sob revisão cega.
194.439
Na sua primeira tentativa, a IA não estava em condições de fazer isso.
195.06
capaz de ler o texto.
195.06
Os resultados não foram tão claros quanto esperado.
196.9
A saída manteve coerência em várias seções.
200.379
Claude projetos com instruções personalizadas e arquivos de conhecimento
203.259
Aproximadamente 70% dos prejuízos foram preenchidos.
205.4
O papel que os GPTs personalizados Chat GPTs servem,
208.199
Suficientes para os fins do experimento.
210.219
O trade-off, registrado, Claude foi mensurável mais lento
213.479
do que as outras duas ferramentas.
215.199
O teste controlado de cabeça para cabeça.
217.4
A mesma entrada no mesmo dia em todos os países
220.08
Três ferramentas.
221.26
A tarefa, uma transcrição de chamada de cliente.
235.319
O personagem, perdido.
251.12
1985 a O oulder's
252.92
O nome em código é vida
252.96
25 25
252.979
85 por cento.
253.02
67 por cento.
253.06
80 por cento.
253.239
sistemas % sistemas
253.319
O que é que você tem de fazer? 60
253.34
60 por cento.
253.379
O que é que você tem?
253.419
modificação.
254.36
Nesta tarefa, Claude ganhou a qualidade de saída.
258.92
Veredicto 1.
260.079
Qualidade de saída.
261.879
Claude.
262.74
A margem não foi próxima.
264.819
Para qualquer categoria de tarefas onde a resposta tivesse
267.379
manter coerente
268.319
Em várias seções, Claude produziu os resultados do pensamento.
272.019
O operador não reescreveu substancialmente.
274.48
Os outros dois precisaram de limpeza.
276.439
Claude precisava de aprovação.
278.42
A implicação, registada na auditoria,
280.779
para qualquer operador cujo deliverable é o writing.
283.399
Claude é o próprio long-form
285.72
subscrição de raciocínio.
287.0
Documentos de formato longo, análise de chamadas de vendas, memorandos de estratégia,
291.12
edições para
291.759
A escrita existente do operador.
293.459
A classificação persiste em toda a amostra mais ampla da auditoria.
297.16
Como documentado no arquivo do caso do núcleo do espelho,
299.899
O operador é o próprio operador.
302.78
Veredicto 2.
303.759
Velocidade em uso.
305.199
Chat GPT. Chat GPT.
306.62
A margem não foi próxima.
308.819
Para tarefas curtas repetitivas
310.259
Sob o mesmo nome, Claude era o único
310.759
Alguém que pudesse entregar a auditoria.
310.759
A auditoria não foi realizada
310.759
500 palavras de saída.
312.279
O GPT de chat teve uma média de 8 segundos por tarefa em todo o mundo.
315.06
a auditoria.
315.8
Claude teve uma média de 16.
316.98
segundos para a mesma carga de trabalho.
318.86
O padrão de contexto pré-compilado, como documentado em.
321.779
o anterior
322.22
Fragmento 0 de um arquivo de caso GPT personalizado, que deixa cair o Chat
325.62
O tempo de resposta eficaz do GPT é de aproximadamente 4 segundos
328.959
porque o contexto que as outras ferramentas devem receber
331.379
Cada pedido de resposta já está carregado no.
333.72
O agente do agente
334.1
Memória de trabalho.
334.959
A classificação persiste em toda a amostra de rendimento da auditoria.
338.199
Para qualquer operador
339.12
cujo gargalo é curto-tarefa, o operador é curto
340.74
-tasked response time é aproximadamente 4
340.74
Segundo por tarefa.
341.899
O editor
342.139
Comp galcool
369.32
Ggil gam
366.939
Afinal, não é o caso.
370.72
Sabe o contexto do operador sem um upload explícito
373.699
Todas as vezes.
374.519
Todos os garras são pregadas
375.339
E cada prompt de bate-papo GPT começa com.
377.959
O operador re-explicando quem eles são.
379.639
Eles são, em que projeto estão, em que documento
382.199
Eles estão fazendo referências.
383.16
O The
383.399
A fricção é zero.
384.48
Como documentado no arquivo de casos do mercado de memória,
386.939
Os dados são dados por um grupo de dados.
387.579
Não fique confinado à matriz de decisão de compra
391.68
derivados da auditoria para o
393.74
operador que deve assinar apenas um.
396.139
Se a palavra produto está se escrevendo,
398.139
livros, artigos, documentos de estratégia, contratos, cravados.
402.22
Se o produto de trabalho for
403.459
throughput, respostas, brainstorms, edições rápidas, chat GPT.
407.36
Se o trabalho já está em curso
408.3
Noção dentro do espaço de trabalho e no espaço de trabalho contém um acontece.
411.42
conhecimento significativo do operador
412.6
Base, noção de IA, com plena consciência da base.
415.399
A postura de retenção documentada neste retorno
417.199
O processo de caso.
417.939
Se o orçamento suporta dois, o par é
420.18
cravado mais noção de IA, qualidade
422.439
Além disso, a retenção.
423.68
O chat GPT torna-se opcional nessa configuração.
426.72
Se o orçamento for necessário
427.56
Suporta dois, o par é cravado mais Noção
428.12
IA, qualidade e retenção.
428.12
O chat GPT torna-se opcional nessa configuração.
428.12
Se o orçamento apoiar
428.12
Os três, como operador nesta auditoria
430.16
fez, o padrão de rotação documentado
432.279
de acordo com isso.
433.879
O registro de auditoria está completo.
436.22
1200 pedidos de resposta
437.399
Categorizados, três assinaturas avaliadas, três vencedores diferentes em todos os pontos.
441.899
Três critérios diferentes.
443.54
O arquivo de caso documenta o experimento de um operador.
446.959
O The
447.399
A postura de retenção documentada para cada um dos três
449.839
as ferramentas não foi modificada por
452.079
Os vendedores, no momento em que escrevo.
453.779
A mesma postura de retenção é aplicável no teste
456.54
Os sujeitos têm sua própria configuração.
457.839
Se o orçamento suporta os três, o operador
458.1
Neste caso
458.1
O arquivo de caso não está incluído.
458.54
O arquivo de caso documenta o experimento de um operador.
458.54
O The
458.54
O resultado é o resultado de uma única aplicação
458.54
como se aplica no seu.
460.0
A conveniência de
461.42
Noção de IA's três segundos conteúdo consciente resposta é
465.04
habilitado pela mesma superfície do sistema
467.019
que esta auditoria documenta.
468.72
O processo não se fecha.
470.98
Ele espera.
472.04
Execute o mesmo prompt
473.42
contra três IAs.
475.1
Compare o resultado.