Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
A Greptile acaba de lançar um "Relatório sobre o Estado da Programação em IA 2025", uma empresa que realiza análises de códigos de IA, cujos clientes vão desde startups de destaque como PostHog e Brex até empresas da Fortune 500. Cerca de um bilhão de linhas de código passam pelo sistema deles todo mês, então eles têm bastante informação em primeira mão à disposição.
Um trecho do conjunto de números do relatório: O número de linhas de código produzidas por desenvolvedores por mês aumentou de 4.450 para 7.839, um aumento de 76%. O volume de PR também está crescendo, com a mediana subindo de 57 para 76 linhas. O aumento para times de médio porte é ainda mais exagerado, chegando a 89%.
Na verdade, já reclamei antes que muitas pessoas gostam de medir a produtividade pelo número de linhas de código, porque código não é um ativo, mas uma desvantagem, e mais código significa mais difícil de manter, e mais código gerado por IA significa mais bugs para manter.
A distribuição dos benefícios das ferramentas de programação por IA é extremamente desigual. Em projetos que já têm boa cobertura de testes e limites claros dos módulos, a IA é uma ótima adição. No entanto, em cenários onde sistemas legados complexos exigem conhecimento aprofundado do domínio, sua ajuda limitada pode até ser ineficaz.
Mas enfim, agora a IA torna o código inflacionário, isso é um fato.
A IA aumentou o número de linhas de código, então a qualidade melhorou?
Infelizmente, o relatório não menciona isso, afinal, linhas de código são boas estatísticas, e a qualidade do código não é fácil de medir.
Os dados do relatório ainda podem ser consultados.
Em termos de ecologia de ferramentas, o mercado de bancos de dados vetoriais está atualmente competindo com o cervo, com a Weaviate liderando com 25% de participação, mas as próximas seis ou sete empresas estão todas entre 10% e 25%, e o vencedor ainda não foi determinado. o mem0 representa 59% do pacote de memória da IA, bem à frente. Em termos de arquivos de regras, o CLAUDE .md liderou a lista com uma taxa de adoção de 67%, indicando que de fato há muitos desenvolvedores que usam Claude como agentes de programação.
A tendência dos downloads de SDKs é ainda mais interessante. A OpenAI ainda é a líder absoluta, com 130 milhões de downloads por mês. Mas a taxa de crescimento da Anthropic tem sido impressionante, aumentando 1.547 vezes de abril de 2023 até agora, e agora está estável em 43 milhões. A proporção de downloads OpenAI vs. Anthropic diminuiu de 47:1 no início de 2024 para 4,2:1 atualmente. O SDK GenAI do Google ainda está em 13,6 milhões, significativamente atrás.
Na seção de comparação de desempenho de modelos, foram testados GPT-5.1, GPT-5-Codex, Claude Sonnet 4.5, Claude Opus 4.5 e Gemini 3 Pro. Vários achados são dignos de nota.
O tempo de resposta do primeiro token é inferior a 2,5 segundos para ambos os modelos Anthropic, enquanto os outros três são mais que o dobro. Não subestime esses poucos segundos – em cenários de programação interativa, seu pensamento será interrompido se você esperar muito tempo, e você terá que reentrar no estado.
Em termos de throughput, os dois modelos da OpenAI são os mais rápidos, com uma mediana de 60-70 tokens por segundo. Anthropic está entre 17-20 anos e Gêmeos está apenas 4-5. Mas alta taxa de transferência não significa tudo, depende se seu cenário de uso realmente precisa ser tão rápido.
A comparação de custos é definida para 1x com base no Códice GPT-5, GPT-5.1 também é 1x, Gemini 3 Pro é 1.4x, Claude Sonnet 4.5 é 2x e Claude Opus 4.5 é 3.3x. O modelo da Anthropic é significativamente mais caro, mas muitos usuários acham a qualidade do código melhor e estão dispostos a pagar por isso.
O relatório conclui com um conjunto de pesquisas recentes, incluindo a arquitetura MoE do DeepSeek-V3, o compromisso entre contexto longo e RAG, e a estrutura de agente de memória constante para MEM1. Essa parte é mais como uma lista de leitura para desenvolvedores profissionais, não expandida.

Melhores
Classificação
Favoritos
