Calculadora de similaridade cosseno entre vetores de embedding | Compare dois embeddings lado a lado

Cole dois vetores de embedding do OpenAI, Cohere ou SBERT e obtenha a similaridade cosseno, o ângulo (em graus) e a distância cosseno de uma vez. Aceita formato vírgula, espaço ou array JSON até 4096 dimensões, com as normas e uma etiqueta de interpretação.

💡 Sobre esta ferramenta

Ao montar uma busca semântica ou um pipeline RAG, uma dúvida aparece o tempo todo: esses dois textos estão mesmo próximos no espaço vetorial? Antes de confiar na pontuação que o Pinecone ou o pgvector devolve, vale recalcular a distância na mão a partir dos vetores brutos para entender de onde vem o número.

A similaridade cosseno mede o ângulo entre dois vetores e ignora a magnitude (comprimento). É justamente o que se quer em embeddings de texto: uma consulta curta e um parágrafo longo podem apontar na mesma direção semântica mesmo com tamanhos bem diferentes. Esta ferramenta aceita três formatos reais para colar uma resposta JSON da API ou uma linha separada por vírgulas, e mostra o ângulo e a distância ao lado do valor cosseno para situar o resultado frente aos limiares 0.85 / 0.5 / 0.

Ela também intercepta as ciladas comuns: dimensões diferentes, vetor nulo ou elemento não numérico geram um erro em vez de uma pontuação enganosa.

🧐 Perguntas frequentes

Qual é a fórmula da similaridade cosseno? cos(θ) = (A · B) / (‖A‖ × ‖B‖): o produto escalar dos dois vetores dividido pelo produto das suas normas. O resultado vai de -1 (opostos) a 1 (mesma direção), passando por 0 (ortogonais, sem relação).

Cosseno ou distância euclidiana? O cosseno olha só a direção; a distância euclidiana mede o afastamento em linha reta (incluindo o comprimento). Como os modelos de embedding costumam normalizar as saídas, comparar direções basta, e por isso o cosseno é o padrão.

A partir de que valor dois textos "se parecem"? Em embeddings de texto, 0.7–0.95 é a faixa típica de "similar". A ferramenta marca cos > 0.85 como forte, 0.50–0.85 como moderada e 0–0.50 como fraca ou sem relação. Os limiares mudam conforme o modelo; observe a distribuição nos seus próprios dados.

Por que mostrar também a distância cosseno (1 − cos)? As bases vetoriais ordenam por distância, onde menor significa mais próximo. Ter a distância facilita a comparação com o que a base devolve.

Há limite de dimensões? Até 4096. Os modelos text-embedding-3-large (3072) e ada-002 (1536) da OpenAI entram sem problema. Se A e B têm número de dimensões diferente, um erro é sinalizado.

O que acontece com um vetor nulo? Um vetor de norma 0 não tem direção definida: a similaridade cosseno fica indefinida (divisão por zero) e a ferramenta exibe um aviso em vez de um valor errado.

📚 O cosseno como ângulo entre significados

Uma imagem ajuda a entender o cosseno: pense em cada texto como uma seta saindo da origem. Duas setas que apontam quase para o mesmo lugar formam um ângulo pequeno cujo cosseno se aproxima de 1; a 90° são ortogonais (cosseno 0) e tidas como sem relação; em sentidos opostos o cosseno chega a -1. Por isso esta calculadora mostra o ângulo em graus: traduz um número abstrato numa ideia geométrica concreta.

Vale guardar um atalho: se os dois vetores estão normalizados (norma = 1), a similaridade cosseno coincide exatamente com o produto escalar. Como a ferramenta mostra ‖A‖ e ‖B‖, dá para verificar se seus embeddings já vêm normalizados observando se ambas as normas valem aproximadamente 1.

Found

info Visão geral

📘 Como usar

Calculadora de similaridade cosseno entre vetores de embedding

Interpretação

grid_view Relacionados

Calculadora de similaridade cosseno entre vetores de embedding | Compare dois embeddings lado a lado

💡 Sobre esta ferramenta

🧐 Perguntas frequentes

📚 O cosseno como ângulo entre significados

info Visão geral

📘 Como usar

Calculadora de similaridade cosseno entre vetores de embedding

Interpretação

fullscreen Calculadora de similaridade cosseno entre vetores de embedding

grid_view Relacionados

Calculadora de similaridade cosseno entre vetores de embedding | Compare dois embeddings lado a lado

💡 Sobre esta ferramenta

🧐 Perguntas frequentes

📚 O cosseno como ângulo entre significados