Gu铆a de Screaming Frog

Julian D

Hola a todos, a continuaci贸n encontrar谩n la gu铆a m谩s completa en espa帽ol de聽聽Screaming Frog SEO Spider. Herramienta ideal para agencias SEO y consultores SEO.

Tabla de contenidos

鉁旓笍聽Rastreo b谩sico

  • C贸mo rastrear toda mi web
  • C贸mo rastrear una subcarpeta
  • C贸mo rastrear un subdominio
  • C贸mo rastrear sitios webs enormes
  • C贸mo rastrear cambiando el user agents聽
  • C贸mo rastrear urls sin par谩metros
  • C贸mo guardar una configuraci贸n

鉁旓笍聽Enlaces internos聽

  • C贸mo sacar informaci贸n de los enlaces internos (texto ancla, directiva, enlaces por p谩gina, etc.)
  • C贸mo encontrar enlaces internos hacia urls 4xx
  • C贸mo encontrar enlaces internos hacia urls con redirecciones
  • C贸mo activar el Link Score
  • C贸mo encontrar enlaces internos hacia urls no canonical
  • C贸mo encontrar enlaces a urls externas rotas

鉁旓笍聽Contenidos del sitio web

  • C贸mo encontrar urls con poco contenido
  • C贸mo encontrar im谩genes que les haga falta el texto alternativo
  • C贸mo encontrar todas las im谩genes presentes en una url
  • C贸mo rastrear todos los archivos CSS
  • C贸mo rastrear todos los archivos JavaScript
  • C贸mo encontrar todos los archivos PDF
  • C贸mo encontrar p谩ginas que tengan botones para compartir en redes sociales
  • C贸mo encontrar urls que usen un iframe
  • C贸mo encontrar urls que contengan un v铆deo o audio incrustado
  • C贸mo encontrar cualquier par谩metro que deseemos en una url

鉁旓笍聽Metadatos y directivas

  • C贸mo encontrar urls con meta t铆tulos muy largos
  • C贸mo encontrar urls con meta t铆tulos muy cortos
  • C贸mo encontrar urls con meta t铆tulos duplicados
  • C贸mo encontrar meta descripciones muy largas
  • C贸mo encontrar meta descripciones muy cortas
  • C贸mo encontrar meta descripciones duplicadas
  • C贸mo encontrar urls con contenido duplicado
  • C贸mo encontrar urls con directivas: nofollow, noindex, canonical, etc
  • C贸mo verificar que el archivo robots.txt este funcionando correctamente
  • C贸mo encontrar qu茅 datos estructurados est谩 usando un sitio web

鉁旓笍聽Sitemap XML

  • C贸mo crear un sitemap xml
  • C贸mo comprobar el sitemap xml existente en la web
  • C贸mo incluir el sitemap xml en el rastreo

鉁旓笍聽Problemas generales

  • C贸mo verificar si la migraci贸n de un sitio web qued贸 correcta
  • C贸mo encontrar urls que cargan lento
  • C贸mo encontrar malware o spam en un sitio web
  • C贸mo encontrar urls que no est谩n indexadas

鉁旓笍聽Scrapear contenido

  • Como scrapear contenidos espec铆ficos de un sitio web

鉁旓笍聽Reescritura de URL

  • C贸mo encontrar y eliminar par谩metros en urls
  • C贸mo volver a escribir las urls rastreada

鉁旓笍聽B煤squeda avanzada en la tabla

  • C贸mo filtrar todas las urls con 4xx
  • C贸mo filtrar todas las urls con 3xx
  • C贸mo filtrar todas las urls con un no index
  • C贸mo filtrar todas las urls 200
  • C贸mo excluir urls del listado principal聽

鉁旓笍聽Investigaci贸n de palabras clave

  • C贸mo saber qu茅 urls valoran m谩s los competidores
  • C贸mo saber qu茅 anchor text estan usando mis competidores en los enlaces internos.

Rastreo b谩sico

Cuando vamos a iniciar un rastreo, es muy importante que nos paremos a pensar que datos necesitamos extraer del sitio web, de esta manera podemos excluir algunas partes de la web y realizar rastreos m谩s 谩giles. A veces, con sitios que son muy grandes, tener claro lo que deseamos rastrear es muy valioso.

De forma predeterminada,聽 Screaming Frog solo rastrea el dominio que le ingresamos. Cualquier subdominio adicional que se encuentre en el camino se ver谩 en los enlaces externos. Para poder rastrear todos los subdominios de una web debemos cambiar la configuraci贸n del spider. Configuraci贸n – spider – clic en el check de rastrear subdominios y luego en aceptar.

Rastrear subdominios con Screaming Frog

Adem谩s, si vamos a realizar el rastreo desde una subcarpeta o subdirectorio en espec铆fico y deseamos que聽 Screaming Frog rastree todo el sito web, marcamos el check de “rastrear fuera de la carpeta de inicio”.

Consejo:

Para ahorrar tiempo en el rastreo, podemos desmarcar los check de: im谩genes, CSS, JavaScript y SWF. En caso dado de que no necesitemos esa informaci贸n.

C贸mo rastrear toda mi web

Para rastrear todas las urls que componen un sitio web, en configuraciones – spider te recomiendo que tenga el check en estas opciones: rastrear fuera de la carpeta de inicio, rastrear todos los subdominios y rastrear sitemaps xml enlazados en el robots, si no est谩 el sitemap xml en el robots le puede indicar la ruta.

Como rastrear todas las urls de un sitio web con screaming frog

C贸mo rastrear una subcarpeta

S铆, queremos limitar un rastreo a una sola carpeta, solo es colocar la url y darle a empezar sin realizar cambios a las configuraciones predeterminadas. Si hemos efectuado cambios en la configuraci贸n original de la rana, podemos restablecer la configuraci贸n predeterminada. Archivo – configuraci贸n – borrar configuraci贸n predeterminada.

Restablecer configuraci贸n inicial

Una segunda opci贸n, si no quieres borrar la configuraci贸n que tienes predeterminada, es ir a: configuraci贸n – incluir. Colocas la carpeta que deseas rastrear ejemplo: /marketing/ y al final colocas .* quedar铆a /marketing/.*

C贸mo incluir solo una carpeta con Screaming Frog

Resultado聽?

Resultado del rastreo de una sola carpeta

C贸mo rastrear un subdominio

Para rastrear un subdominio, colocamos la direcci贸n del subdominio y le damos a: configuraci贸n – incluir y quedar铆a as铆 subdominio.laweb.com/.*

Se pueden ir a realizar una prueba para que est茅n seguros de lo que les va a tomar el rastreo.

Prueba del rastreo de subdominio

C贸mo rastrear sitios webs enormes

Una buena manera de rastrear sitios webs grandes es por partes, puedes dividir el sitio por subcarpetas como te ense帽e m谩s arriba, de hecho es una de las maneras que la misma herramienta lo recomienda: c贸mo rastrear sitios web grandes usando SEO Spider.

1) cambiar el modo de almacenamiento (debes tener un SSD) configuraci贸n – sistema – modo de almacenamiento. Y seleccionamos almacenamiento en base de datos.

2)聽Asignar memoria RAM, configuraci贸n – sistema – asignaci贸n de memoria. Con 4gb de RAM es capaz de rastrear aproximadamente 2 millones de urls. Con 8gb de RAM se pueden rastrear aproximadamente 5 millones de urls.

C贸mo rastrear cambiando el User-Agent

Cambiar el User-Agent es una movida inteligente, ya que muchos servidores puede que bloqueen el agente que trae la rana por defecto: configuraci贸n –聽 User-Agent.

Cambiar el user agent en screaming frog

Te recomiendo que priorices un User-Agent de聽 Smartphones. S铆 tienes el Google Search Console puedes ir a cobertura y ver cu谩l es el rastreador principal de esa web y seleccionas ese.

Rastreador principal Google search Console

C贸mo rastrear urls sin par谩metros

Algunos par谩metros son molestos e incluso ralentizan nuestros rastreos. Ejemplos de par谩metros: /page/, ?p, ?*, etc. Todos estos par谩metros los podemos omitir del rastreo, nos vamos a configuraci贸n –聽 excluir (.*)colocamos el par谩metro(.*)

C贸mo excluir par谩metros con Screaming Frog

C贸mo guardar una configuraci贸n

Muy bien, puede que ya tengas una configuraci贸n que tu mismo dise帽aste a tu gusto para guardarla: archivo – configuraci贸n – guardar como y guardas el archivo .seospiderconfig.
Nota: este archivo se lo puedes enviar a un colega y el puede cargar esa misma configuraci贸n en su Screaming Frog ;).

Guardar configuraci贸n en scraming frog

Nota 2:聽Si le das en guardar configuraci贸n actual como predeterminada, siempre que habr谩s la rana esta ser谩 la configuraci贸n que cargue.

Enlaces internos

Los enlaces internos son lo que nos permiten ir de una url a otra en el mismo dominio. Los enlaces internos son importantes por dos razones:

  1. Ellos ayudan a que los lectores se mantengan m谩s tiempo en nuestra web y ayudan a la experiencia del usuario, ampli谩ndole informaci贸n con tem谩ticas relacionadas con la que ya est谩 consumiendo.
  2. Facilita las tres fases del trabajo del Googlebot (el robot de rastreo web de Google). Estas tres fases consisten en: crawling, indexaci贸n y ranking.

C贸mo sacar informaci贸n de los enlaces internos (texto ancla, directiva, enlaces por p谩gina, etc.)

Para sacar informaci贸n de los enlaces internos de un sitio web. Debes esperar que el rastreo llegue al 100% – exportaci贸n en bloque – enlaces – enlaces internos todo.

Enlaces internos todo

Podemos ver informaci贸n como:
Fuente: url de donde sale el enlace interno
Destino: la url de destino donde va el enlace
Ancla: es el texto del enlace

C贸mo encontrar enlaces internos hacia urls 4xx

Juli谩n Durango Consultor SEO

Juli谩n Durango

Con m谩s de 9 a帽os de experiencia, y enfocando mi trabajo especialmente en auditor铆as de sitio web, estrategias de link building y SEO local, me considero un emprendedor que conoce las necesidades de los clientes y de la importancia de tener una buena estrategia digital.

Diagn贸stico SEO
Scan the code
juliandurango.com
Hola. Pide tu diagn贸stico SEO !GRATIS!