Pesquisa tática de palavras-chave em um mundo RankBrain


Sou Robert Sena da Silva profissional de SEO – Search Engine Optimization desde 2012. Iniciei minha carreira com no Marketing Digital fazendo um pouco de cada área como Links Patrocinados Google AdWords, SEO, Social Media e “quebrava um galho como Frot-End era literalmente um eu Marketing Digital. mas isso fez eu me tornar uma profissional mais completo e pensar além das oportunidades To change this standard text, you have to enter some information about your self in the Dashboard -> Users -> Your Profile box. Saiba mais


Reading Time: 11 minutes
Rate this post

RankBrain usa inteligência artificial para incorporar grandes quantidades de linguagem escrita em entidades matemáticas – chamadas vetores – que o computador pode entender. Se RankBrain vê uma palavra ou frase que não está familiarizada, a máquina pode adivinhar quais palavras ou frases podem ter um significado semelhante e filtrar o resultado em conformidade, tornando-o mais eficaz no tratamento de consultas de pesquisa nunca antes vistas .

Mais uma vez, RankBrain está sendo chamado como essencialmente um motor de relevância, uma máquina para melhor compreensão das semelhanças e relações entre as palavras. Quais são esses vetores que o artigo menciona, no entanto? No sentido geral, os vetores são um conceito matemático – um ponto no espaço com direção e magnitude. Os vetores são uma maneira de codificar informações complexas.

Felizmente, temos outra pista, do projeto público ML do Google, TensorFlow . Um dos projetos secundários do Google é uma biblioteca chamada Word2Vec que, como o nome indica, usa ML para converter palavras em vetores. Os métodos tradicionais de codificação de palavras para recuperação de informações podem lidar com problemas simples, como a pluralização e o atraso, mas têm pouco ou nenhum sentido dos relacionamentos. Word2Vec e modelos similares são capazes de aprender relacionamentos como os exemplos abaixo (Fonte: Tensorflow.org, © 2016 Google):

Aqui, o Word2Vec aprendeu que o relacionamento entre homem e mulher é o mesmo que a relação entre o rei ea rainha (codificado na direção do vetor). Da mesma forma, a relação entre o tempo do verbo andando para caminhar é o mesmo que a relação entre nadar e nadar. Mais importante ainda, essas regras não precisavam ser especificadas. A máquina os aprendeu estudando grandes coleções de palavras reais em contexto.

Os algoritmos reais do Google são quase certamente mais complexos do que a biblioteca Word2Vec publicamente disponível, e os pesquisadores combinaram abordagens baseadas em vetores com outras abordagens, como a LDA mais familiar (alocação latente de dirichlet), mas parece muito provável que uma abordagem como esta seja em jogo em RankBrain.

RankBrain is NOT query translation

É fácil erradicar erroneamente a conclusão de que RankBrain simplesmente traduz consultas desconhecidas em mais familiares ou consultas longas em consultas curtas. Este não é o caso. RankBrain parece operar em tempo real e pode comparar várias versões de uma frase de pesquisa ao mesmo tempo.

Se eu erroneamente escrever uma pesquisa como “Benedict Crumblebatch”, o Google vai me dizer isso:

Nesse caso, o Google tentou interpretar minha intenção e substituiu minha consulta com o que pensa ser uma versão melhor. Esta é a tradução de consulta. Nesse caso, todos os resultados correspondem à consulta traduzida e anula minha pesquisa original.

Revisando um exemplo a partir de cima, se eu procurar “lenço”, posso retornar as correspondências em “cachecol” e “cachecóis” (mesmo no mesmo resultado):

O Google não está traduzindo “cachecol” -> “cachecóis” e depois retornando fósforos no novo termo. O Google está aplicando um poderoso mecanismo de relevância que reconhece essas partidas em tempo real.

Temos certeza de que é RankBrain?

Deixe-me ser claro em uma coisa – a relevância é um processo muito complexo, e é difícil saber com certeza quando os métodos tradicionais de recuperação de informações terminam e RankBrain começa. Não posso dizer com certeza que todos os exemplos que mostrei anteriormente representam o RankBrain em ação.

No entanto, há mais uma evidência. Lembre-se do exemplo “NJ DMV”? Google pôde entender que o “DMV” (Departamento de Veículos Motorizados) e “MVC” (Motor Vehicle Commission) são conceitos equivalentes em Nova Jersey.

Nossa equipe de ciência dos dados, liderada por Matt Peters, reuniu um protótipo ML que usa um método semelhante ao Word2Vec. Se você inserir termos de pesquisa nesta ferramenta, olha os resultados correspondentes do Google e calcula a semelhança entre esses resultados e a consulta original:

Essa captura de tela foi editada, mas os dados são reais. O que a ferramenta está dizendo é que uma página com o título “Estado de Nova Jersey – Comissão de Veículos Motorizados” é uma boa combinação (93%, embora o sistema seja um pouco indulgente) para o “NJ DMV”. O fato de podermos treinar um sistema de ML para executar esta tarefa não prova que RankBrain faça isso, mas mostra pelo menos que está bem dentro das capacidades ML do Google.

Quando RankBrain apareceu?

Por favor, note que RankBrain geralmente está vinculado à data de anúncio em outubro de 2015, mas esse artigo também diz que RankBrain estava em jogo “nos últimos meses”. O artigo de Steven Levy sobre o ML no Google dá uma data de abril de 2015 para o lançamento, e acreditamos que a linha de tempo é precisa. RankBrain provavelmente esteve em jogo por pelo menos 1 1/2 anos no momento da redação.


Como nos adaptamos a RankBrain?

Em um mundo onde o Google pode entender a obtenção, sinônimos e até respostas, como abordamos pesquisa de palavras-chave? Voltemos ao nosso exemplo Space Needle. Vou usar o Mozwords Keyword Explorer como pano de fundo para o restante desta discussão. Digamos que eu acione minha ferramenta de pesquisa de palavras-chave confiável e digite a frase “altura da agulha espacial”:

Mesmo fora do portão, temos 1.000 palavras-chave para lidar, muitas das quais são bastante semelhantes. Como abordamos essas 1000 variações?

A opção 1 é escrever 1.000 páginas, cada laser orientado para uma única frase. Sabemos, praticamente, que isso vai ser uma grande quantidade de trabalho ou vai levar a conteúdo fino. Os sites preenchidos com páginas com modelos que só variam por algumas palavras-chave são uma péssima experiência de usuário e isca principal para o algoritmo Panda do Google.

A opção 2 é tirar o maior número possível dessas frases e preenchê-las em um único parágrafo. Eu fiz isso por você, e aqui está o tipo de resultado que você pode esperar:

ALTURA DA AGULHA DO ESPAÇO
altura da agulha espacial (Seattle) é de 605 pés. A altura da agulha espacial em histórias é pouco mais de 60. É interessante notar que a comparação da altura da agulha espacial para o Empire State Building é cerca de metade da altura. Em contraste, a comparação da altura do Seattle Space Needle com a Willis Tower de Chicago é apenas cerca de um terço da altura.

As frases em negrito são as frases do meu alvo. Espero que todos possamos concordar que este não é o melhor conteúdo crafting se nosso objetivo é convencer nosso público de que somos uma fonte confiável de informações.

Proponho uma terceira opção. Você pode ter notado um pulldown no Keyword Explorer para [Group Keywords]. Isso faz exatamente o que parece ser. Vamos levar todas essas palavras-chave muito semelhantes (e você poderia fazer isso à mão também, se você estiver disposto a colocar o tempo) e tentar agrupá-los. Terminamos com algo como isto:

O sistema tentou balançar as palavras-chave em grupos mais amplos e mais úteis, o que nos permite ignorar algumas das variantes menores. Então, vamos escolher três grupos desta lista:

  1. “altura da agulha espacial”
  2. “altura da agulha espacial nas histórias”
  3. “agulha espacial de altura”

E se escolhemos frases linguísticas naturais representativas dentro de cada um desses grupos? Pense neles como exemplares do grupo. Podemos escolher algo assim:

  1. “altura da agulha espacial”
  2. “Space Needle é ___ histórias”
  3. “Quão alto é a agulha espacial?”

Agora, vamos elaborar um parágrafo em torno dessas frases mais naturais e diversas:

COMO TALL É A AGULHA DO ESPAÇO? 
auge da Space Needle em Seattle, Washington é de 184 m (605 pés), incluindo a antena. Curiosamente, enquanto o Space Needle tem aproximadamente 60 andares de altura, ocupa apenas 6 andares, sendo a maior parte da torre estrutural. Enquanto era uma vez o prédio mais alto de Seattle , o Space Needle agora é apenas o 7º.

Não só escrevemos um parágrafo que pode realmente ser valioso para os seres humanos, mas cobrimos nossas três frases de destino e até conseguiu um quarto (o “edifício mais alto em Seattle”). Além disso, cada uma dessas frases representa grupos de dezenas ou centenas de palavras-chave similares. Ao escrever para os grupos ou conceitos mais amplos em vez de frases estreitamente direcionadas, podemos cobrir muitas variantes de palavras-chave de forma eficiente.


3 Gs: reunir, agrupar, gerar

Eu levei a chamar essa abordagem para a pesquisa de palavras-chave dos 3 Gs, e isso é curtido:

  1. Reúna palavras-chave
  2. Agrupe palavras-chave em clusters
  3. Gerar exemplares

Outra maneira de pensar neste processo é que estamos agrupando palavras-chave em conceitos, e depois convertem cada conceito em uma palavra-chave / frase representativa: Palavra-chave -> Conceito -> Palavra-chave *. O resultado é uma frase de pesquisa específica para o alvo, mas essa frase representa potencialmente dezenas ou centenas de palavras-chave semelhantes.

Vamos trabalhar com outro exemplo, mas com intenção comercial. Imagine que você está trabalhando no espaço do apartamento de Seattle e está procurando escrever um artigo sobre os custos de aluguel. Apenas para escolher um ponto de partida, você entende “preços de aluguel de Seattle” na sua ferramenta de pesquisa de palavras-chave de escolha e colete sua lista de palavras-chave:

Naturalmente, recuperamos uma lista de palavras-chave relacionadas, mas às vezes muito semelhantes. Mesmo nesta lista, podemos começar a ver algumas variações interessantes (“aluguel médio”, preços por ano, preços mapeados, etc.), mas vamos levá-lo ao segundo passo e agrupar essas palavras-chave:

Em um cenário de pesquisa de palavras-chave do mundo real, gostaríamos de explorar minuciosamente todos os grupos, mas eu escolhi três por agora que me chamaram a atenção (sublinhado em verde). Eles são:

  1. “Aluguel médio de Seattle pelo bairro”
  2. “Os preços da habitação de Seattle subiram”
  3. “Apartamentos mais baratos em Seattle”

Como geramos um exemplar de cada grupo? Às vezes, a intuição está bem. Por exemplo, as palavras-chave que o nosso sistema agrupou no n. ° 2 se tornam um pouco de uma mistura estranha, mas eu realmente gosto de como o “fardo” ressoa e os “preços da habitação” são uma boa variante de palavras-chave, então vou escolher uma frase . Para algo como # 3, podemos optar por apenas ver qual variação tem o maior potencial de tráfego. No Keyword Explorer, podemos simplesmente expandir esse grupo, selecionar as palavras-chave e adicioná-las a uma lista, assim:

Uma vez que as estatísticas da lista são coletadas, podemos dar uma olhada e ver que os “apartamentos mais baratos em Seattle” têm o maior volume de tráfego e o potencial de palavras-chave, de acordo com nossas métricas:

Para o grupo final (“renda média de Seattle por bairro”), procurei as palavras-chave agrupadas, e um chamou minha atenção: “aluguel médio do centro de seattle”. Eu gosto deste porque é específico para um bairro real, embora possamos escolher criar conteúdo em torno de algum tipo de tema de vizinhança por bairro também. O que eu gosto de tentar entender nossas palavras-chave como grupos / clusters é que também é um ótimo processo para gerar idéias de conteúdo.

Então, vamos colocar alguns exemplares contra nossos três grupos. Podemos terminar com algo como isto:

  1. “Aluguel médio no centro de Seattle”
  2. “Os preços da habitação de Seattle estão subindo rapidamente”
  3. “apartamentos mais baratos em Seattle”

Todas estas são frases ricas que podemos usar para criar conteúdo, e são construídas em um quadro lógico de pesquisa por palavras-chave. Mesmo usando apenas essa lista única, nosso sistema afirma que esses três grupos representam pelo menos 64 frases-chave. Factoring na cauda longa, eles potencialmente representam mais centenas.

Eventualmente, podemos ter ferramentas ML que podem levar grandes grupos de frases relacionadas e ajudar a encontrar o exemplar perfeito. Mesmo agora, o mecanismo de agrupamento do Keyword Explorer é construído em ML. Chegará um momento muito cedo quando a ML for parte do nosso trabalho diário como SEO.

Há uma quarta, não oficial G: Gap . Como nossos amigos britânicos podem dizer, lembre-se da lacuna. Os exemplares que você constrói neste processo devem ser frases de linguagem natural que representam dezenas de palavras-chave, mas nossa compreensão de um conceito e do Google nem sempre será igual, e algumas pesquisas que você esperava que classificassem caíssem pelas rachaduras . É importante continuar monitorando e rastreando um grande conjunto de palavras-chave. Se você ver que alguns não estão melhorando, considere gerar novos exemplares ou segmentá-los separadamente. Este é um processo iterativo, e ainda temos que deixar nossas mãos sujas com pesquisas reais todos os dias.


Bônus: brainstorming de palavras-chave

Aqui é algo divertido de tentar. No Keyword Explorer, você pode solicitar especificamente frases de palavras-chave que não contenham nenhuma das palavras em sua frase original. Por que você quer fazer isso? Pode ajudá-lo a encontrar conceitos relacionados que você talvez não tenha considerado.

A partir das [Sugestões de palavras-chave de exibição que] pulldown, selecione “excluir os termos da consulta para obter idéias mais amplas”. Aqui estão alguns dos resultados que recebo em busca de “preços de aluguel de Seattle” com o agrupamento em (Eu editei esta lista um pouco apenas para mostrar alguns dos resultados mais interessantes no espaço permitido):

Alguns destes são óbvios (embora ainda interessantes), como pesquisas que usam nomes de neigbhorhood específicos (por exemplo, “melhores apartamentos em Capitol Hill”). Alguns são menos óbvios e abrem algumas novas avenidas. “Kirkland apartamentos abaixo de US $ 1000” nos lembra que tanto a sensibilidade de vizinhança quanto de preços são importantes em pesquisas semelhantes. Estes são aspectos que não podemos ignorar em nossa pesquisa de palavras-chave mais ampla sobre este tópico.

O segundo para o final é realmente interessante, IMO: “apartamentos perto da sede da Amazon”. Sendo um empregador tão grande (sabemos muito bem, dada a concorrência pelo talento em Seattle), um foco de conteúdo em apenas apartamentos perto da sede da Amazon pode ter muita força. Finalmente, embora não seja o tópico mais útil ou a palavra-chave para o alvo, “muito caro” é certamente uma boa frase de título para se afastar.


Por que não apenas escrever para pessoas?

Se o Google está realmente entendendo pesquisas de linguagem natural e se tornando mais inteligente, por que não escrevemos conteúdo para pessoas e esquecemos esse processo? É uma pergunta justa. Se suas escolhas são preenchimento de palavras-chave da era de 2005 e conteúdo fino ou escrita para pessoas, por favor, para o amor de tudo o que é santo, escreva para os usuários do seu site humano (e, por extensão, procure usuários).

Há um problema, e provavelmente é mais fácil mostrar que contar …

O Google percorreu um longo caminho em sua jornada de uma abordagem baseada em heurística para uma abordagem de aprendizado de máquinas, mas onde estamos em 2016 ainda está muito longe da compreensão da linguagem humana. Para realmente ser eficaz como SEO, ainda precisamos entender como essa máquina pensa, e onde é insuficiente para o comportamento humano. Se você quer fazer pesquisa de palavras-chave de nível inicial, sua abordagem pode ser mais humana, mas seu processo deve replicar o entendimento da máquina tanto quanto possível.

Espero que você dê uma tentativa aos 3 Gs e me avise o que você acha. Eu admitirei que estou tendenciosa e espero que você também dê uma tentativa de Keyword Explorer , se você ainda não (e, se você tiver, teste alguns dos novos truques dos quais eu falei).

 

Facebooktwittergoogle_pluslinkedinyoutubevimeoby feather

Consultor de Growth Hacking | Marketing Digital Exepert SEO is using WP-Gravatar