search

Found

info Visão geral

Compare dois textos palavra por palavra e destaque em cores as palavras adicionadas, removidas e sem alterações, com a porcentagem de similaridade.

📘 Como usar

  1. Cole a versão original em Texto A e a versão editada em Texto B
  2. Leia o resultado destacado, onde as palavras adicionadas aparecem em verde e as removidas em vermelho riscado
  3. Confira os contadores de adicionado, removido, sem alterações e similaridade acima do resultado

Comparador de Texto por Palavras

Adicionado 0
Removido 0
Sem alterações 0
Similaridade: --%
Insira os dois textos para ver as diferenças...
Copiado!

※ As adições e remoções no nível de palavra são detectadas com o algoritmo de subsequência comum mais longa (LCS).

Article

Comparador de Texto por Palavras | Compare Dois Textos Palavra por Palavra

Coloque uma versão anterior e outra posterior lado a lado e veja cada palavra adicionada ou removida, destacada na própria linha. Uma porcentagem de similaridade baseada na contagem de palavras mostra num relance o quanto as duas versões se afastaram.

💡 A granularidade entre o caractere e a linha

A maioria das ferramentas de diferença escolhe um de dois extremos. Uma comparação no nível do caractere reage a cada tecla, então corrigir um único erro espalha dezenas de marcas minúsculas pelo parágrafo. Uma comparação no nível da linha, a típica da revisão de código, marca a linha inteira como alterada mesmo que apenas uma palavra tenha se movido. A prosa fica no meio: quando você reformula uma frase, o que realmente muda são as palavras, não os caracteres nem a linha completa.

Esta ferramenta divide os dois textos pelos espaços em branco e executa uma passagem de subsequência comum mais longa (LCS) sobre as sequências de palavras. O resultado se lê como um controle de alterações: as palavras compartilhadas ficam neutras, as novas brilham em verde e as removidas aparecem riscadas em vermelho. Como a comparação se ancora nas palavras, mover um termo ou trocar um sinônimo produz um mapa de edição limpo e legível em vez de uma parede de ruído caractere a caractere. As contagens de adicionado, removido e sem alterações, junto com a pontuação de similaridade, dão uma leitura numérica rápida de quão pesada foi a revisão.

🧐 Perguntas frequentes

Qual é a diferença em relação a uma comparação por caracteres? Uma comparação por caracteres analisa letra por letra, então corrigir um erro pode marcar vários caracteres vizinhos. Uma comparação por palavras toma cada palavra separada por espaços como unidade, de modo que a mesma correção é informada como uma palavra removida e uma adicionada. Para editar prosa, a visão por palavras é muito mais fácil de acompanhar.

Como a porcentagem de similaridade é calculada? É o número de palavras sem alterações dividido pela maior das duas contagens de palavras, exibido em porcentagem. Dois textos idênticos marcam 100% e dois textos sem palavras em comum marcam 0%.

Funciona com idiomas que não usam espaços? O algoritmo divide pelos espaços em branco, então foi pensado para idiomas separados por espaços. Um texto sem espaços, como o chinês ou o japonês, reduz-se a pouquíssimas palavras, e uma ferramenta no nível do caractere ou de n-gramas dará um resultado mais significativo nesses casos.

Existe um limite de tamanho? Não há um teto rígido, mas a comparação LCS exata cresce de forma quadrática com o número de palavras. Para entradas muito grandes a ferramenta muda automaticamente para um percurso guloso mais rápido, que cede um pouco de precisão em troca de velocidade para manter a página fluida.

Como fica o texto copiado? As palavras adicionadas ficam entre [+ ] e as removidas entre [- ], enquanto as sem alterações permanecem como estão, de modo que você pode colar um registro de mudanças legível em texto simples onde precisar.

📚 Curiosidades

O problema da subsequência comum mais longa por trás desta ferramenta é a mesma ideia que move o clássico comando diff nascido nos Laboratórios Bell nos anos setenta, e é um exemplo de manual da programação dinâmica. A bioinformática toma emprestada exatamente a mesma lógica para alinhar sequências de DNA e proteínas, onde o alfabeto são nucleotídeos em vez de palavras. Seja comparando dois rascunhos de um ensaio ou duas fitas de um genoma, a pergunta é idêntica: qual é a sequência mais longa de elementos que ambas as versões compartilham e o que precisou ser inserido ou removido para passar de uma para a outra.