Qué es el TF IDF y cómo mejorarlo en tus contenidos SEO

Estoy convencida de que has oído hablar hasta la saciedad de la importancia de tener una palabra clave cada vez que escribes tus contenidos.

Ya sabes que Google es un gigante que trata de entender nuestro lenguaje a través de algoritmos matemáticos. Está contínuamente buscando la manera de traducir la intención de búsqueda de los usuarios en números, en datos.

Hoy vengo a enseñarte un poquito más de SEO, para que tú también entiendas cómo interpreta Google esto de las keywords. A través del TF-IDF tendrás mucha más información sobre keywords, tuyas y también de tu competencia, ¿quiéres saber cómo?, ¡vamos allá!

Buscando en Google

¿Qué es el TF-IDF?

TF-IDF es el acrónimo de los términos en inglés Term Frequency – Inverse Document Frequency. Esta fórmula calcula y establece la ponderación de una palabra dentro de un texto. Normalmente, esa palabra es la keyword y esto ayuda a clasificar documentos para las consultas de los usuarios.

Cuando introduces una consulta en el buscador de Google sobre un tema en concreto, a través del TF-IDF puedes conocer en tiempo real todas las keywords relacionadas con ese tema.

Pero no sólo te da respuesta de las keywords; también te ofrece resultados con combinaciones long tail. ¿Te imaginas todo lo que puedes hacer con este algoritmo tan espectacular?

Listas de datos

Gracias a toda esta información que te devuelve el TF-IDF podrás crear un contenido único y original con la seguridad de que Google sabrá valorarlo muy positivamente, según sus criterios de posicionamiento.

Además, una de las principales ventajas de recurrir a este algoritmo es que en su fórmula matemática tiene en cuenta las temidas stopwords, o palabras que pueden anular todos tus esfuerzos en SEO. Es decir, se puede aplicar en cualquier idioma del planeta.

Voy a explicarte mejor esta fórmula matemática. Para ello, veamos por separado las dos mediciones que realiza.

TF, la frecuencia de términos

El TF, term frequency, o frecuencia de términos mide el uso de un término concreto dentro del artículo o documento en cuestión. Esto no es otra cosas que la densidad de la palabra clave; algo de lo que ya te hablé en este artículo del blog.

Voy a ponerte un ejemplo para que me entiendas. Imagina que entras en una habitación llena de estanterías que contienen documentos; estos son los artículos o posts. Tú quieres consultar los documentos que traten sobre “museos de España”, es decir, que contengan la keyword “museos de España”.

En una primera consulta muchos documentos quedarán fuera porque no contienen la palabra clave elegida. Sin embargo, aún quedan otros tantos artículos que sí tienen la keyword en su interior.

¿Cómo puedes determinar cuál de esos documentos es el más relevante?; muy sencillo, con la fórmula TF, que no viene a ser otra cosa que el número de veces que aparece escrita nuestra keyword dividido entre el número total de palabras que contiene el documento.

Fórmula TF

Parece fácil, ¿verdad?. Pero claro, no todos los documentos que contienen “museos de España” son iguales en cantidad de palabras escritas. Se supone que cuanto más largo sea un artículo más veces contiene la keyword principal.

Además, hay otro inconveniente. Si te fijas, la keyword que he elegido en el ejemplo es una secuencia de tres palabras “museos”, “de” y “España”; la palabra “de” es una de esas llamadas stopwords que se repetirá con demasiada frecuencia en todos los documentos de esas estanterías que estás investigando.

Por eso, esta parte del algoritmo se queda un poco corta y hace falta complementarla con la siguiente fórmula matemática.

IDF, la frecuencia inversa del documento

El IDF, Inverse Document Frequency, o frecuencia inversa del documento está diseñado para disminuir el peso de las palabras que no son relevantes y se repiten con demasiada frecuencia en cualquier documento.

Esta palabras son, como ya supongo que imaginas, los artículos, preposiciones y demás términos que nunca son relevantes por su naturaleza. Por eso se las llama stopwords o palabras vacías.

Por contra, el IDF lo que hace es darle más valor a las palabras menos frecuentes. En el ejemplo que vengo poniéndote en este artículo, son “museos” y “España”.

La fórmula que nos facilita el dato del IDF no es otra que el número total de documentos dividido entre el número de documentos con la keyword elegida.

Fórmula IDF

Veamos un ejemplo para que entiendas bien todo esto:

Imagina que estás leyendo un artículo de 500 palabras donde la keyword “museos de España” aparece 6 veces.

Además, existen 10 millones de de artículos y la palabra “museos de España” aparece en 1.000 de ellos

  • TF (term frequency) de “museos de España” es 6/500 = 0,012
  • IDF (inverse document frequency) lo calculamos así: 10.000.000/1.000 = 4
  • Por tanto, el TF*IDF es de 0,012 * 4 = 0,05

Cómo mejorar tus contenidos SEO con el TF-IDF

Ya sabes que Google está continuamente modificando el algoritmo que utiliza en su buscador. Es ahí, en el buscador, donde se muestran los resultados más relevantes de cualquier consulta que hacemos los internautas.

Es en este punto donde tienes que ser consciente del protagonismo que debe tener el TF-IDF en la generación de tus contenidos. Cuando vayas a redactar un contenido nuevo fíjate en todas las keywords que te devuelve esta fórmula tan reveladora que hoy estoy compartiendo contigo.

Esta medida ponderada va un paso más allá de la densidad de palabra clave de la que ya te he hablado en este blog. Te ofrece toda una colección de palabras bajo el mismo significado semántico.

Imagina la gran cantidad de ventajas que tienes a la hora de posicionar tus artículos con una rapidez extraordinaria. No sólo estás escribiendo para conquistar a tus lectores; ahora ya sabes también cómo enamorar a Google.

El funcionamiento de los algoritmos de Google

No voy a entrar en detalle con el complejo funcionamiento de la mayor herramienta de búsqueda de toda la red. Pero sí quiero que entiendas que cada uno de los algoritmos de Google pretende entender las búsquedas complejas que realiza cualquier internauta, junto con los cambios de conducta que van relacionados con ésto.

Por ejemplo, no utilizamos el mismo lenguaje de búsqueda las personas de X años con los más jóvenes de nuestra sociedad. Como tampoco utilizamos el mismo lenguaje si usamos un pc o un smartphone para conectarnos a internet.

Los algoritmos de google

Es por esto que Google está continuamente en la búsqueda de los factores que influyen en el posicionamiento, y trata de entender el significado de las palabras que le pedimos con la interacción de los usuarios y los resultados obtenidos.

Aunque las palabras clave siguen siendo fundamentales en la redacción de contenidos, el hecho de ofrecer un contenido de valor al internauta es una evidencia cada vez mayor. El buscador, Google, trata de identificar el contexto del contenido. No se centra tanto en las keywords como en el comportamiento del usuario.

Por eso, te aconsejo que recurras a este algoritmo que hoy estoy enseñándote. El TF-IDF siempre te dará todas las palabras clave relacionadas con el tema que tú quieras; pero es que además, te ayudará a descubrir las que aún no se están usando, ¿te das cuenta de lo importante que es esto a la hora de posicionar cualquier site?

Una aplicación que te ayuda con el algoritmo TF-IDF

Supongo que te estarás preguntando, ¿sólo una?. No, no hay sólo una, hay muchas; pero no todas te dan tanta información en su versión free como ésta de la que voy a hablarte.

Se trata de Ryte. Te la recomiendo porque en su versión gratuita te aporta mucha información que, bien utilizada, puede ayudarte mucho a la hora de mejorar el posicionamiento de tu web a través de los contenidos.

Mira, yo he consultado la keyword del ejemplo que te he puesto en este artículo, “museos de España”. Estos son los resultados que da la página:

Pantallazo 1 ryte

Y mira qué información facilita sobre los competidores:

Pantallazo 2 ryte

Algo que me gusta mucho de esta aplicación es que dispone de un blog con contenidos muy interesantes sobre cómo utilizar la herramienta, y sacarle el máximo partido.

De hecho, te animo a que la pruebes. Tiene un post sobre cómo utilizar la versión gratuita de la herramienta.

Y si quieres utilizar aplicaciones más completas, con muchísimos más datos e información para que mantengas a raya tus contenidos, puedes contratar la versión de pago de ésta que estoy mostrándote.

Aunque aquí ya hay más competencia; una herramienta que es muy conocida por la gran precisión de información que facilita es SEOlyze. Tiene una versión free por 30 días, y después la cuota mensual no es excesivamente costosa.

En cualquier caso, sea la herramienta que sea la que utilices para investigar el TF-IDF del tema que te interese, siempre debes tener muy presente que lo más importante de todo es generar un contenido de calidad que aporte valor al usuario.

Trata de superar las expectativas de tus lectores y ellos te ayudarán a posicionar tus contenidos en Google con sus comportamientos (clicks en tus posts, tiempo de permanencia en tu página, en fin, qué te voy a contar).

¿Practicas TF-IDF en tu website?, ¿con qué herramienta te ayudas?, ¿nos compartes algún truco que te funciona?, ¡Cuéntanos!