Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

A Greptile acaba de lançar o "Relatório sobre o Estado da Programação em IA de 2025", esta empresa é especializada em revisão de código de IA, com clientes que vão desde startups de destaque como PostHog e Brex até empresas da Fortune 500. Cerca de um bilhão de linhas de código passam pelo seu sistema todos os meses, portanto, eles têm muitos dados de primeira mão. Aqui estão alguns números extraídos do relatório: o número de linhas de código produzidas pelos desenvolvedores por mês aumentou de 4.450 para 7.839, um aumento de 76%. O volume de PR também está crescendo, com a mediana subindo de 57 para 76 linhas. O aumento em equipes de médio porte é ainda mais impressionante, alcançando 89%. Na verdade, eu já critiquei antes que muitas pessoas gostam de usar o número de linhas de código para medir a produtividade, porque código não é um ativo, é um passivo; quanto mais código, mais difícil é manter, e mais código gerado por IA significa que é mais difícil de manter e mais bugs surgem. A distribuição de benefícios das ferramentas de programação em IA é extremamente desigual. Em projetos que já têm uma boa cobertura de testes e limites de módulos claros, a IA é um grande trunfo. Mas em sistemas legados complexos, onde é necessário um conhecimento profundo do domínio, sua ajuda é limitada e pode até ser contraproducente. Mas, de qualquer forma, agora é um fato que a IA está causando inflação no número de linhas de código. A IA aumentou o número de linhas de código, mas a qualidade melhorou? Infelizmente, o relatório não menciona isso, afinal, é fácil contar linhas de código, mas medir a qualidade do código é complicado. Os dados do relatório ainda são interessantes de se ver. Na parte do ecossistema de ferramentas, o mercado de bancos de dados vetoriais está bastante competitivo, com a Weaviate liderando com 25% de participação, mas seguida por seis ou sete outras empresas que estão entre 10% e 25%, ainda sem um vencedor claro. No pacote de memória de IA, o mem0 ocupa 59%, liderando de longe. Em relação aos arquivos de regras, o CLAUDE .md está no topo com uma taxa de adoção de 67%, o que indica que há muitos desenvolvedores usando Claude para criar agentes de programação. A tendência de download do SDK é ainda mais interessante. A OpenAI continua absolutamente à frente, com 130 milhões de downloads por mês. Mas o crescimento da Anthropic é impressionante, aumentando 1547 vezes desde abril de 2023, agora estabilizando em 43 milhões. A proporção de downloads entre OpenAI e Anthropic caiu de 47:1 no início de 2024 para 4.2:1 agora. O SDK GenAI do Google ainda está em 13.6 milhões, claramente atrás. Na comparação de desempenho dos modelos, foram testados o GPT-5.1, GPT-5-Codex, Claude Sonnet 4.5, Claude Opus 4.5 e Gemini 3 Pro. Algumas descobertas são dignas de nota. O tempo de resposta do primeiro token, os dois modelos da Anthropic estão abaixo de 2.5 segundos, enquanto os outros três levam mais do que o dobro. Não subestime esses segundos — em um cenário de programação interativa, se o tempo de espera for longo, você pode perder o fio da meada e ter que reentrar no estado de concentração. Em termos de throughput, os dois modelos da OpenAI são os mais rápidos, com uma mediana de 60-70 tokens/segundo. A Anthropic está entre 17-20, enquanto o Gemini tem apenas 4-5. Mas um throughput alto não significa tudo, ainda é preciso ver se seu cenário de uso realmente precisa de tanta velocidade. Na comparação de custos, tomando o GPT-5 Codex como base de 1x, o GPT-5.1 também é 1x, o Gemini 3 Pro é 1.4x, o Claude Sonnet 4.5 é 2x, e o Claude Opus 4.5 é 3.3x. Os modelos da Anthropic são claramente mais caros, mas muitos usuários acham que a qualidade do código é melhor e estão dispostos a pagar por isso. O relatório termina apresentando uma série de pesquisas recentes, incluindo a arquitetura MoE do DeepSeek-V3, as trade-offs entre contexto longo e RAG, e a estrutura de agente de memória constante do MEM1, entre outros. Esta parte parece mais uma lista de leitura para desenvolvedores profissionais, então não vou me aprofundar.

Top

Classificação

Favoritos