A fim de diminuir a quantidade de resultados irrelevantes em buscas na internet na área médica, o programa de pós-graduação em Tecnologia da Saúde da Pontifícia Universidade Católica do Paraná (PUCPR) está desenvolvendo um novo mecanismo, o MorphoSaurus. O professor Percy Nohama, que integra o projeto, explica que a terminologia médica exibe características próprias que dificultam o uso eficiente dos mecanismos de busca. ?Normalmente os sistemas utilizados trazem informações gerais. Isso nem sempre satisfaz as necessidades, pois podem vir documentos que falem sobre doenças, mas outros que não tenham relação com o assunto desejado?, afirma.

continua após a publicidade

Segundo Nohama, o MorphoSaurus é um projeto longo que vem sendo desenvolvido desde 2001 e conta com a participação da Freiburg University da Alemanha. O momento atual, afirma, é o de terminar a ferramenta de busca e integrá-la com o sistema de léxicos. É nesse sistema de léxicos que são catalogados documentos e palavras-chave relevantes. ?A indexação é um processo contínuo que vem sendo feito desde o início do projeto, porque exige grande refinamento. Como estamos construindo um léxico em vários idiomas, o processo é demorado.?

Uma característica interessante do MorphoSaurus, explica o professor, é a capacidade de se realizar buscas com um termo num idioma e obter resultados relevantes em vários. Por exemplo, fazendo uma busca com a palavra sangue em português, o sistema vai procurar documentos em outros idiomas. Nohama diz que o MorphoSaurus pode executar buscas em inglês, alemão, espanhol, sueco e, agora, o projeto vai integrar também a língua francesa. ?O MorphoSaurus está sendo desenvolvido com o que chamamos de mecanismo de busca translingual.?

Isso é possível, segundo Nohama, porque as palavras indexadas ganham um código, e seus sinônimos em outras línguas possuem o mesmo código. Desse modo, a palavra sangue relaciona documentos com a palavra inglesa blood, a palavra alemã blut, a palavra espanhola sangre, e assim por diante. No momento, o trabalho está sendo o de verificar a equivalência de palavras e os problemas de ambigüidade.

continua após a publicidade

Nohama diz que em cerca de dois meses o MorphoSaurus já deverá estar funcionando, assim que houver a integração da máquina de busca com o sistema de léxico de termos. ?O buscador será útil para qualquer pessoa que tenha interesse na área médica. Fizemos testes com o sistema e observamos bom desempenho.?

Ele afirma que há interesse em desenvolver, no futuro, um sistema similar para a área jurídica. Diferente do projeto da área médica, em que se utilizou como base o inglês, por ser o idioma em que há maior quantidade de conteúdo, um buscador de alta performance específico para o direito talvez pudesse ser feito em outra base lingüística. Nohama explica que seria preciso fazer estudos, mas uma possibilidade seria a de usar o italiano, que é freqüente na área jurídica.

continua após a publicidade