驴Cu谩ntas veces has escuchado que el SEO est谩 muerto? Seguramente muchas. Yo por lo menos lo llevo leyendo desde que empec茅 en esto del posicionamiento en 2010, si mal no recuerdo. Esto se debe a la frustraci贸n tras a帽os invertidos en un proyecto y que un cambio de algoritmo lo tumbe.
Es algo bastante com煤n. Google, en busca de la naturalidad, necesita ofrecer un mejor resultado de cara al usuario, evoluciona y cambia para adaptarse y mejorar. Y lo hace constantemente cambiando el algoritmo con el objetivo de luchar contra las malas pr谩cticas. Con estos cambios se acerca cada vez m谩s a la comprensi贸n del lenguaje humano.
Actualmente muchos SEO siguen trabajando con las keywords y es de lo que m谩s se escucha hablar, pero desde hace ya varios a帽os (concretamente en el 2012), el t茅rmino de keyword empez贸 a evolucionar dando lugar a un nuevo t茅rmino conocido como la entidad.
Mucho se habla sobre las palabras clave pero poco se toca el tema de las entidades en SEO: 驴qu茅 son?, 驴para qu茅 sirven?, 驴c贸mo trabajar con entidades en tus textos?
驴Qu茅 son las entidades?
Las entidades en SEO son el nombre de algo, es decir, de un elemento, un lugar, una persona, un animal, un objeto, un ente, una cosa, etc. Y este nombre se asocia de forma autom谩tica a otros t茅rminos o palabras, como pueden ser fechas, acciones u otras entidades.
El objetivo de las entidades es facilitar las respuestas al usuario en funci贸n de la intenci贸n de b煤squeda de este. Es por ello que los motores de b煤squeda necesitan establecer relaciones entre palabras o conceptos, dando lugar a las entidades.
Podemos ver algunos ejemplos en la web de Microsoft, donde nos explica c贸mo relacionan los motores de b煤squeda todo esto, c贸mo pasamos de un buscador normal a la necesidad de una web sem谩ntica y a la adaptaci贸n de los resultados de b煤squeda. Esto lo explicar茅 un poco m谩s abajo, pero antes…
驴Qu茅 tipos de entidades existen?
Bas谩ndonos en la documentaci贸n oficial de Google para el procesamiento del lenguaje natural, las entidades que reconoce y clasifica actualmente son:
- PERSON: persona.
- LOCATION: lugar.
- ORGANIZATION: organizaci贸n.
- EVENT: evento.
- WORK_OF_ART: ilustraci贸n.
- CONSUMER_GOOD: productos de consumo.
- OTHER: otros tipos de entidades no identificadas.
- PHONE_NUMBER: n煤mero de tel茅fono.
- ADDRESS: direcci贸n.
- DATE: fecha.
- NUMBER: n煤mero.
- PRICE: precio.
- UNKNOW: para entidades desconocidas.
Evoluci贸n del motor de b煤squeda y llegada de la web sem谩ntica
Poco a poco, los dispositivos desde los que se han conectado los usuarios han ido evolucionando y, en paralelo, tambi茅n han cambiado las b煤squedas que estos hac铆an para satisfacer las necesidades que ten铆an.
Desde los ordenadores de escritorio siempre ha sido m谩s com煤n realizar b煤squedas cortas, pero con el paso del tiempo y el acceso de m谩s poblaci贸n a los buscadores, comenzaron a surgir b煤squedas m谩s largas que necesitaban ser respondidas con m谩s exactitud; y con la llegada de los m贸viles, este hecho no solo se intensific贸 m谩s, sino que dio lugar a m谩s diversidad de b煤squedas.
Ante el problema de poder dar una respuesta m谩s exacta al usuario y conocer la intenci贸n de b煤squeda que se esconde tras cada una de esas b煤squedas, se establecieron las entidades para ofrecer mejores resultados al usuario.
Estas entidades, como expliqu茅 al principio del post, se relacionan para poder dar esta respuesta al usuario, por lo que si buscamos el nombre de un actor, es posible que busquemos fotos, la biograf铆a o pel铆culas en las que ha participado. Y si buscamos una ciudad, es posible que necesitemos ver un mapa, noticias, alquileres, compra de viviendas, etc.
C贸mo es Google capaz de entender la relaci贸n de palabras
Es necesario irse un poco atr谩s en el tiempo para recuperar y entender algunos t茅rminos relacionados con las t茅cnicas empleadas para entender mucho mejor la relaci贸n de contenidos y de qu茅 se est谩 hablando en cada uno de ellos.
- Co-citaci贸n:聽cuando un texto cita a dos referencias de otros dos textos, d谩ndose la probabilidad de que estas dos referencias est茅n relacionadas entre ellas y el texto que las referencia. La probabilidad de relaci贸n va disminuyendo cuanto mayor es la distancia entre las dos referencias, y la relaci贸n disminuye si la distancia es menor.
- Co-ocurrencia:聽es la relaci贸n de proximidad entre t茅rminos que aparecen en un texto y las diferentes partes que forman este texto. Si dos t茅rminos est谩n juntos o cercanos, probablemente est茅n relacionados de forma sem谩ntica.
- LSA (Latent Semantic Analysis):聽en espa帽ol se conoce como Indexaci贸n Sem谩ntica Latente. Es un m茅todo de indexaci贸n que trata de buscar patrones de relaciones entre los t茅rminos de un conjunto de documentos. Aqu铆 creo que hay un poco de desambiguaci贸n con otra palabra que deriva de esta, conocida como keywords LSI, que ser铆a la relaci贸n de palabras dentro de un mismo documento para poder entender de qu茅 tema est谩 tratando.
- Ontolog铆a:聽trata de dotar a los ordenadores de la capacidad de valorar informaci贸n por s铆 mismos mediante el uso de inteligencia artificial.
Una vez conocidos estos t茅rminos, podemos hacernos una ligera idea de c贸mo ha evolucionado el an谩lisis de contenidos por parte de Google y c贸mo cada uno de estos a煤n sigue vigente y de qu茅 forma funcionan.
Gracias a la co-citaci贸n, Google es capaz de realizar un an谩lisis sobre lo que habla cada contenido en funci贸n de la proximidad de los enlaces. Es por ello que la tem谩tica de los art铆culos es tan importante desde los art铆culos que nos enlazan.
El siguiente paso es la co-ocurrencia, que tiene un doble efecto.
Por un lado tenemos las palabras que rodean a los enlaces que apuntan a nuestras p谩ginas. La cercan铆a de estas hace que Google pueda entender mucho mejor sobre lo que va a tratar el contenido enlazado.
Por el otro lado tenemos la relaci贸n de palabras, frases y p谩rrafos, en relaci贸n con la distancia que existe entre estos. Si adem谩s le sumamos las keywords LSI, el algoritmo de Google BERT que ya conocemos y que refuerza el entendimiento del contenido bas谩ndose en un contexto, tenemos un avance importante.
Por 煤ltimo, pasar铆amos al m茅todo de indexaci贸n en relaci贸n con el conjunto de documentos relacionados (LSA). Esto lo que har铆a ser铆a mostrar informaci贸n de algo si muestra informaci贸n de otra cosa relacionada, de ah铆 que cuando busques algo, muchas veces te muestre informaci贸n relacionada como veremos a continuaci贸n en el knowledge graph.
Knowledge Graph
Una forma de ver todo esto, de c贸mo Google relaciona la informaci贸n mediante entidades, es el knowledge graph (gr谩fico de conocimiento). Aqu铆 est谩n los destacados que aparecen en los resultados de b煤squeda aportando m谩s informaci贸n sobre una consulta.
Inicialmente, toda esta informaci贸n se extrajo de fuentes como Wikipedia, Wikidata, Freebase entre otros, pero tambi茅n se ofreci贸 la posibilidad a otras webs de insertar un marcado que pudiera ofrecer m谩s informaci贸n y que todo esto se viera retroalimentado. Con este marcado nacieron los microformatos, RDFa, schema, etc.
Si realizas una b煤squeda como puede ser 芦Madrid芦, podemos ver el siguiente knowledge graph de la entidad Madrid:
Como resultado, nos ofrece el pa铆s al que pertenece, el tiempo, el gentilicio, el patr贸n, la poblaci贸n, informaci贸n sobre hoteles, vuelos, planificaciones de viajes, etc.
Otro ejemplo ser铆a a b煤squeda del t铆tulo de una pel铆cula o una persona conocida. En este caso escog铆 芦Aladd铆n禄:
As铆, podemos obtener informaci贸n relevante de entidades como personas relacionadas con la pel铆cula como puede ser el director o el reparto, empresas donde puedes ver la pel铆cula y qui茅n hizo posible la producci贸n de esta, fecha del estreno, etc.
Extraer entidades
Existen otras formas adem谩s de los knowledge graph para extraer entidades. Para ello podemos recurrir a herramientas que nos ayuden a identificarlas.
Si queremos obtener sugerencias de entidades para una keyword聽en concreto, tan solo tenemos que ir a Google Im谩genes y realizar una b煤squeda r谩pida.
Esos c铆rculos con keywords que aparecen en la parte superior de las im谩genes son entidades que podemos usar para reforzar nuestros contenidos.
Carlos Ortega tambi茅n nos ofrece este magnifico hilo de twitter donde nos deja algunos trucos para extraer entidades:
Seguro que sab茅is que para ver las entidades de un texto pod茅is tirar de la API de NLP de Google.
Pero, 驴sab茅is tambi茅n de d贸nde m谩s se pueden sacar entidades de forma gratuita?
De GOOGLE DOCS 馃槺
Mini hilo 猬囷笍
— Carlos Ortega (@carlos_darko) May 20, 2020
Si nos queremos meter a hilar un poco m谩s fino, os contar茅 algunas opciones m谩s, pero que requieren de un registro previo en Dandelion, haciendo uso de su versi贸n gratuita (siempre que no necesites hacer un uso excesivo de la herramienta).
El ejemplo que expondr茅 se basar谩 en la consulta anchor text.
Extensi贸n de Chrome
Una de ellas es una extensi贸n de Chrome, realizada por Fede Gomez, llamada extractor de entidades.
Una vez instalada nos pedir谩 que insertemos un token API de la web de Dandelion, es por ello que necesitaremos registrarnos en esta web y acceder a nuestro聽Dashboard para encontrar el token API.
Una vez introducido el token podemos guardar y cerrar para empezar a probar la extensi贸n.
Para ver su funcionamiento debemos realizar una b煤squeda r谩pida en Google y pulsar sobre el icono del plugin o en el desplegable; despu茅s pulsamos sobre extractor de entidades.
Tarda unos segundos en aparecer, por lo que tendr茅is que esperar un poco a que realice el an谩lisis y muestre la informaci贸n. Lo que podr茅is ver son las entidades por cada resultado de b煤squeda justo debajo de cada resultado en las SERP.
En este bloque tambi茅n podremos ver m谩s informaci贸n sobre la entidad en cuesti贸n si hacemos clic en cada uno de estos resultados.
Por otra parte, tambi茅n veremos una media de todas las entidades en funci贸n de los resultados de b煤squeda en la parte derecha de la pantalla.
Se ordenar谩n por nivel de relevancia y distinguiremos claramente su importancia mediante el color azul. Tambi茅n tendremos la opci贸n de ver todas las entidades o exportar la informaci贸n en un CSV.
Entidades SEO Kiwosan
Kiwosan es una herramienta de pago pero no es muy cara y ofrece otras funcionalidades bastante interesantes. En el an谩lisis de entidades que te ofrece revisa los primeros resultados de Google para analizar estas entidades, o tambi茅n permite que mandes t煤 las URL seleccionadas para realizar este an谩lisis de entidades.
En el primer desplegable podemos seleccionar si queremos analizar las entidades de las聽SERP o analizar URL personalizadas con la opci贸n Batch. En el segundo recuadro insertaremos la consulta o listado de URL, y en el tercero seleccionaremos el pa铆s (aunque actualmente solo est谩 Espa帽a seleccionable).
Tras realizar la consulta, lo primero que veremos ser谩 una gr谩fica con las entidades ordenadas por apariciones.
Lo siguiente que veremos ser谩 una tabla, donde la primera columna estar谩 constituida por las entidades m谩s usadas y su relaci贸n con el contenido, para despu茅s pasar al an谩lisis de entidades por cada URL.
En cada recuadro de entidad aparece:
Nombre de la entidad (n煤mero de veces que aparece) [importancia de la entidad]
Lo siguiente que vemos es la clasificaci贸n y el an谩lisis de estas entidades por tipos en relaci贸n con la documentaci贸n oficial del procesamiento del lenguaje natural que coment茅 m谩s arriba.
Los tipos se pueden ver destacados en colores en la parte superior a modo de total, pero tambi茅n podemos ver a qu茅 tipo de entidad pertenece cada una de forma individual en cada tarjeta donde pone tipo.
驴C贸mo ayudan las entidades a enriquecer un texto?
Ahora que hemos extra铆do todas las entidades de los textos: 驴c贸mo puede ayudarnos esto en el SEO?, 驴c贸mo debo trabajar con las entidades para posicionar un texto?
Es tan sencillo como insertar las entidades tal cual en nuestro contenido dando mayor importancia a aquellas que tengan mayor valor de importancia en el top de entidades y que est茅n dentro de alg煤n tipo de clasificaci贸n distinto a others o聽unknow.
Conclusiones
El concepto de las entidades es algo bastante complejo de entender, pero la forma de trabajar con estas es bastante simple y sencilla.
Existen herramientas que est谩n al alcance de todos y nos pueden ayudar a realizar este an谩lisis y a entender mucho mejor la intenci贸n b煤squeda de los usuarios.
Si a esta t茅cnica le aplicamos tambi茅n el an谩lisis de TF-IDF y creamos art铆culos orientados, como expliqu茅 en el art铆culo de intenci贸n de b煤squeda, conseguiremos unos textos perfectos para optar unas buenas posiciones.
4 comentarios en “Qu茅 son las entidades SEO y c贸mo utilizarlas para mejorar tus textos”
Hola Eric. Muchas gracias por ese art铆culo fascinante. No solo explicas la parte conceptual sino que vas a lo pr谩ctico. Un saludo.
Gracia Eric. Buen tema lo desconocia pot completo .
Gracias Eric, su art铆culo es ilustrativo, su contenido enriquece la capacidad de escribir para web, en mi caso es de gran ayuda. Saludos.
Pingback: 驴C贸mo se gan贸 el concurso SEO?