desenv-web-rp.com

Qual é o mecanismo de pesquisa ideal hospedado automaticamente?

Eu tenho um site interno (intranet) composto por vários blogs e fóruns, centenas de páginas estáticas, muitos arquivos PDF _ e vários outros tipos de documentos. Ele foi colado livremente nos últimos dois anos e agora é meu trabalho mantê-lo.

Estou procurando um mecanismo de pesquisa que possa me hospedar idealmente:

  1. Permite pesquisar diretamente nos bancos de dados do Blog/Fórum, se houver informações e tabelas do banco de dados a serem pesquisadas.

  2. Manipula a maioria dos documentos de texto (PDF/DOC/ODF)

  3. É de código aberto ou permite o acesso ao código-fonte uma vez adquirido

Não importa para mim em que idioma ou plataforma está escrito. Normalmente, eu usaria a pesquisa no site do Google, mas essa não é uma opção para uma intranet.

11
Tim Post

Confira Lucene

Escrito em Java também disponível para o . NET framework

Aqui está um artigo do CodeProject que explica como funciona e como é usado. http://www.codeproject.com/KB/library/IntroducingLucene.aspx

7
jessegavin

Eu usei Sphider antes e fiquei bastante impressionado.

2
Darryl Hein

SearchBlox , baseado no Lucene, pode atender às suas necessidades. É gratuito e vem com um rastreador.

2
user5213

Normalmente, eu usaria a pesquisa no site do Google, mas essa não é uma opção para uma intranet.

De fato, existe o appliance do Google, que é equivalente à pesquisa de intranets no site do Google. No entanto, isso não é de código aberto (a pesquisa no site do Google também não é, caso você não tenha notado.)

0
delete