desenv-web-rp.com

Boa ferramenta para rastrear meu site e me ajudar a encontrar links mortos e arquivos desvinculados

Eu tenho um site legado bastante grande, com literalmente milhares de PDFs que às vezes são contabilizados em um banco de dados, mas geralmente são apenas links na página e são armazenados na maioria dos diretórios do site.

Eu escrevi um rastreador php para seguir todos os links do meu site e depois comparo isso com um despejo da estrutura de diretórios, mas há algo mais fácil?

21
MrChrister

Eu usei Link Sleuth do Xen . Funciona muito bem, mas não faça DOS!

15
plntxt

Se você estiver usando o Windows 7, a melhor ferramenta é o SEO Toolkit 1.0 do IIS7. É gratuito e você pode baixá-lo gratuitamente.

A ferramenta examinará qualquer site e informará onde estão todos os links mortos, quais páginas demoram para carregar, quais páginas têm títulos ausentes, títulos duplicados, o mesmo para palavras-chave e descrições e quais páginas quebraram o HTML.

6
Ben Hoffman

Tente Verificador de Link da ferramenta de código aberto do W3C . Você pode usá-lo online ou instalá-lo localmente

4
mvark

Existem vários produtos de Microsys , especialmente os A1 Sitemap Generator e A1 Website Analyzer que rastrearão seu site e informarão tudo o que você possa imaginar sobre isto.

Isso inclui links quebrados, mas também uma exibição em tabela de todas as suas páginas, para que você possa comparar itens como <title> e tags de descrição meta idênticos, links para não seguir, meta noindex em páginas da web e muitas doenças que precisam apenas de olhos atentos e uma mão rápida para consertar.

1
Evgeny

Link Examiner também é um freeware muito bom para a sua necessidade.

1
Dark

Eu sou um grande fã de linklint para verificar links em sites estáticos grandes, se você tiver uma linha de comando unix (I ' usado no linux, MacOS e FreeBSD). Consulte o site para obter instruções de instalação. Depois de instalado, crio um arquivo chamado check.ll e faço:

linklint @check.ll

Aqui está a aparência do meu arquivo check.ll

# linklint
-doc .
-delay 0
-http
-htmlonly
-limit 4000
-net
-Host www.example.com
-timeout 10

Isso faz um rastreamento de www.example.com e gera arquivos HTML com relatórios com referências cruzadas para o que está quebrado, ausente etc.

1
artlung