A análise de cluster é uma maneira de analisar dados que classificam um conjunto de informações em dois ou mais grupos mutuamente exclusivos com base em combinações de variáveis internas. A análise de cluster é útil para descobrir estruturas e padrões nos dados com base apenas em uma categoria selecionada de similaridade e diferença. Na prática, a análise de agrupamento de um corpus de textos geralmente os agrupa de acordo com as semelhanças e diferenças nas frequências das palavras mais frequentes. A análise de cluster demonstrou ser altamente confiável na atribuição de autoria e identificação de gênero. Num grafo de rede um cluster pode ser entendido como um agrupamento de nós por uma mesma cor específica.