Clustering pode significar ter dois ou mais sistemas de computadores trabalhando em conjunto ou vários servidores ligados entre si para efeitos de manuseamento de cargas de trabalho variáveis, bem como para proporcionar um funcionamento contínuo no caso de uma falha. Também pode se referir a dados de agrupamento, que é uma técnica utilizada para análise dos dados pela divisão de um conjunto de dados em subconjuntos cujos elementos compartilham traços comuns. agrupamento de resultados de pesquisa visa mudar a maneira online de busca de pessoas através da organização de resultados de pesquisa em pastas que agrupar itens semelhantes.
Por Clustering é Necessário
A utilização da vasta informação disponível on-line não pode ser maximizada menos um meio eficaz de organizá-lo pode ser fornecido. motores Clustering coloco os resultados de pesquisa em conjunto com base na similaridade textual e linguística. Esta semelhança básica é apoiada por heurísticas que são codificados por programadores usando como base a preferência dos usuários sobre o que eles querem ver nos documentos de cluster. Clusters são apresentados usando o estilo de pastas e sub-pastas.
Quando um motor de busca fornece milhões de resultados para uma consulta particular, o buscador pode vasculhar os infinitas páginas de resultados ou dependem do julgamento do motor de busca como os resultados mais relevantes. Nem podem garantir que as informações específicas podem ser acessados, pois podem permanecer enterrados sob páginas de resultados ou não pode cumprir os critérios do mecanismo de busca. Da mesma forma que todas as outras coisas são agrupados ou organizada, o mundo da busca na internet seria mais útil uma vez concedido o benefício da pesquisa organizada.
Clustering motores automaticamente resultados agrupar em categorias que foram inteligentemente selecionados a partir de palavras e expressões contidas nos resultados da pesquisa. As categorias são destinados a alcançar a exatidão do nível humano e oferecer a capacidade de perfurar em desgraça hierárquica uma interface familiar pasta de estilo. listas de entorpecente não precisa ser rolado e / ou ignorados como os principais temas são vistos na primeira 300 - 500 direito resultados na primeira página. Uma rápida visão geral dos tipos de informação disponível sobre um determinado tópico é disponibilizado para que a área de interesse pode ser imediatamente posto em foco.
Com a grande melhoria da capacidade de motores de busca "para devolver um grande número de resultados relevantes, tornou-se mais difícil para navegar de forma significativa através de todos os resultados. Um pesquisador típico não ter tempo para ver os resultados além da primeira página o que torna muito provável a falta de resultados que teriam sido relevantes e úteis para seu / sua pesquisa ou consulta. Clusters de tornar possível que os resultados encontrados na décima página para ser apenas um clique de distância. Artigos relacionados também podem ser vistos juntos, sem muito esforço. Ele ainda revela inesperadas relações entre palavras, idéias e conceitos.
Um cluster é considerado tão bom se ele possui uma descrição legível. Deve ser capaz de ajudar na redução estabelece uma busca para encontrar resultados exatos. Um mecanismo de agrupamento consultas vários motores de busca, e combina os resultados possam ser agrupados e exibidos em uma tela. Cada lista de resultados vem com informações sobre o número total de resultados agrupados e recuperados. O motor de heurísticas próprio agrupamento deverá determinar que as páginas sejam favorecidas. Os motores de busca, por vezes, voltar várias cópias da mesma página com URLs ligeiramente diferentes, mas isso é minimizado no agrupamento de resultados de pesquisa. Isso acontece porque os motores de clustering não reproduzir os resultados com descrições semelhantes. Os clusters são específicas o suficiente para que os documentos repetidos são muito raros. Alguns são capazes de oferecer recursos de busca avançada que permite que os pesquisadores para especificar quais fontes devem ser pesquisados, o número de resultados desejados, o tempo de espera admissível, o idioma a ser utilizado ea saída de filtragem de conteúdo ofensivo.
Os motores de busca que Clusters
Define o Google não fornecem resultados, mas sim ajuda a encontrar termos semelhantes aos que entraram. Isso permite ao usuário criar consultas mais complexas, em uma área e debater sobre como colocar uma pesquisa em conjunto. Google Sets é o Google Labs 'agente de clustering.
WiseNut é um mecanismo de pesquisa de texto completo, que prevê assuntos relacionados além de uma série de resultados para qualquer item de pesquisa inseridos. Isso é chamado de WiseGuide. Alguns resultados teriam subtópicos que irá mostrar os resultados agrupados por baixo. Um link pode ser encontrado ao lado de cada um dos resultados agrupados cujas palavras-chave pode ser usada para executar outra pesquisa. Um conjunto diferente de resultados agrupados devem ser produzidos para além da página de resultados da web. Este motor de busca foi comprado por LookSmart.
Teoma foi apelidado como o "Google Killer" devido à sua tecnologia muito interessante clustering. Uma corrida única pesquisa irá produzir quatro conjuntos de resultados. Aqueles encontrados na parte superior esquerda são os resultados patrocinados, aqueles encontrados no fundo são resultados website não-patrocinados, aqueles no canto superior direito são as sugestões para aperfeiçoar o resultado e aqueles na parte inferior direita são cálculos link de especialistas e entusiastas. As coleções apontam são adequados para as necessidades de informação geral, enquanto as sugestões são para pesquisas mais específicas. Um clique sobre qualquer sinal de que a busca a correr novamente em um conjunto diferente de resultados do site devem ser apresentados. Teoma foi comprado por AskJeeves.
Infonetware.com é mais uma demonstração do Real Infonetware Termo de tecnologia do que um motor de busca. A página de resultados, onde se enquadra a área à esquerda oferece os temas relacionados com o termo de pesquisa na web, enquanto os resultados da pesquisa página encontram-se no quadro da direita. Ele trabalha com pesquisas full.
Oingo usa o Open Directory Project como fonte de pesquisa. A página de resultados apresenta uma lista drop-down de significados em potencial. A lista de categorias em ordem de relevância para a pesquisa pode ser encontrado abaixo dela, assim como os resultados do site do próprio diretório. É mais útil para pesquisas gerais ou mais termos de pesquisa que estão em uma categoria ampla.
Vivisimo é um motor de busca meta-clusters que os seus resultados. Ele fornece uma página muito simples, com resultados de pesquisa que são organizados em grupos. O design da página faz com que seja fácil de explorar várias categorias, sem ter de "perder o seu lugar". Clusty é o destino busca do consumidor ligado e de propriedade de Vivisimo. Examina os resultados da Ask, MSN, Open Directory, LookSmart, Gigablast e WiseNut. Estes locais foram escolhidos por causa de seus resultados precisos e velocidade de retorno rápido.
Consulta Server oferece diversos tipos de pesquisa no lado esquerdo da página. Cada pesquisa tem mais ou menos a mesma interface e todos os resultados cluster. Resultados da busca são apresentados em um quadro no lado direito do site.
Surfwax oferece serviços de subscrição com base e livre. Um link de foco pode ser visto no canto superior esquerdo depois de uma pesquisa está inscrita. Estas palavras foco pode ser usado para além do termo de busca. Eles são divididos em ligações mais estreitas ou mais amplas categorias e conter palavras genéricas e não a pessoas ou lugares específicos.
Northern Light procura notícias requer a busca de ter um certo número de resultados a fim de ser agrupados em pastas. No entanto, listagem de pastas não fornecem informações sobre o conteúdo de uma pasta específica, embora existam subpastas previstas tópicos abrangentes. resultados da pesquisa são listados por ordem de data.
motores de busca Clustering quebrar várias centenas de resultados em pacotes gerenciáveis. Sugestões são fornecidos para que o uso da informação é maximizada ea própria busca muito mais fácil. A consulta de pesquisa nem sempre pode ser específica o suficiente para direcionar a informação certa no tempo.