Cuil, a guerra do tamanho? – Parte II

Vistos os objectivos e propostas do Cuil, debrucemos-nos agora sobre a sua prestação.

A difícil missão  de filtrar e apresentar informação relevante

Voltando ao tamanho…

Os responsáveis do Cuil afirmam ser importante o tamanho do índice e defendem que se incluam sites de pequena dimensão. Todavia, o que se verifica é que o tamanho pode ser contraproducente. Quanto maior for o índice, mais tempo leva a actualizar essa informação – o Google usa tempos diferentes para actualizar páginas de notícias, por exemplo. Outra consequência lógica é a maior lentidão na resposta e a maior dificuldade em filtrar, ou seja, separar o trigo do joio. Isto, apesar das possibilidades tecnológicas estarem em evolução.

Porém, existe mérito no trabalho realizado pela equipa. Com muito poucos recursos humanos e com menos computadores, recolheram um número muito elevado de páginas.

O novo look e a preocupação com a privacidade

Acerca da forma de apresentação dos resultados em colunas, há quem goste e há quem ache que dificulta a leitura, precisamente o contrário do argumento utilizado pelos criadores. O que me parece indiscutível e positivo é a novidade e o assumir o risco da mudança. A personalização do interface é também um aspecto que soma pontos, embora não seja inovador, porque outros motores já o fazem desde há muito.

Discutindo a relevância dos resultados

Nesta área parece haver consenso nas reações quanto ao fraco desempenho do Cuil. Existem vários testemunhos, mas tomámos o teste apresentado na Online Tech Tips que utilizou a expressão “shipping seven” que se refere à futura versão do Microsoft Windows. Analisou a pertinência dos dez primeiros resultados nos vários motores de pesquisa que foram: Cuil – 10%; Google – 100%; Yahoo – 50%; Live Search – 60%; Ask – 0%. Em dez resultados, Cuil apresentou apenas um relacionado com o tema pesquisado.

Eu mesma realizei um teste simplório com o Cuil e o Google. Digitei a expressão “mastersid”, que se refere a um master da Universidade de Salamanca. Cuil não recuperou nos dez resultados uma única página relevante. Google apresentou como primeiro resultado um trabalho de um aluno realizado nesse curso e, na terceira posição, a página oficial do dito master. Curiosamente, o sistema do Cuil recuperou, e apresentou na página 4 de resultados, uma série de entradas  do site Tagzania que possuíam a etiqueta “mastersid”. Foi um teste realizado pelos alunos desse master para experimentar as etiquetas e conhecer Tagzania. Devo dizer que o endereço do master é “http://mastersid.usal.es”, ficando claro que o sistema valorizou mais as etiquetas que os URL e recuperou, neste caso, o menos relevante.

A fórmula utilizada pelo Cuil necessita de muito trabalho para chegar à precisão actual do Google. Ao fraco desempenho na relevância, junta-se a ausência de pesquisa vertical, tendo sido o aspecto mais criticado a impossibilidade de este motor pesquisar especificamente imagens. Finalmente, a opção de não usar IP ou cookies para obter padrões de uso pode comprometer desenvolvimentos futuros.

O sucesso de um bom motor de pesquisa está associado à combinação de várias técnicas, e excluir à partida algumas possibilidades tecnológicas, não é muito sensato. A política de privacidade agrada à sociedade internauta, mas apenas a breve trecho, porque se a ferramenta não é eficaz, não vai ser utilizada.

Panorama actual e tendências que se desenham nos motores de pesquisa

Cuil tem muito para desenvolver e outra coisa não seria de esperar, porque estamos a falar de escalas muito diferentes, quando comparamos as duas empresas: Cuil tem 30 empregados contra os 20000 de Google; opera há 2 anos, tendo apresentado publicamente o seu produto há menos de dois meses. Ora, Google leva uma década de andanças.

Apesar de uma tecnologia poder alterar completamente as peças no tabuleiro de xadrez, não parece que isso vá ocorrer com Cuil, pelo menos no imediato. Google guarda bem o segredo do seu PageRank e tem procurado continuamente melhorá-lo e superá-lo com uma solução mais eficaz. É uma empresa com tecnologia muito madura, por enquanto líder, e que tem e usa todos os recursos para manter essa liderança com novos desenvolvimentos. Além disso, mantém-se muito atenta aos seus competidores… Seria até muito provável que uma qualquer melhora significativa conseguida por uma start up fosse imediatamente assimilada pelos grandes buscadores da actualidade – Google, Yahoo ou Live Search da Microsoft.

Creio que fica provado que o tamanho não é a questão de fundo, apesar do crescimento imparável da rede. O aumento do índice deve ser acompanhado de técnicas cada vez mais inteligentes no processamento de tanta informação. E nenhuma deve ser descartada.