TOTAL webbhantering

Googles rankingalgoritmforskning introducerar TW-BERT

Innehållsförteckning

En Google Research-studie beskriver ett anmärkningsvärt ramverk som heter TW-BERT, vilket förbättrar sökrankningen utan att kräva några större förändringar.

Google har tillkännagivit ett betydande rankningsramverk kallat Term Weighting BERT (TW-BERT), som förbättrar sökresultaten och är lätt att implementera i befintliga rankningssystem.

Även om Google inte har bekräftat att de använder TW-BERT, är detta nya ramverk ett genombrott som förbättrar rankningsprocesser generellt, inklusive inom Query Expansion. Det är också lätt att implementera, vilket enligt mig gör det troligare att det redan används.

TW-BERT har många medförfattare, bland dem Marc Najork, en framstående forskare på Google DeepMind och tidigare Senior Director of Research Engineering på Google Research.

Han har medförfattat många forskningsartiklar om rankningsprocesser och flera andra ämnen.

Urval av artiklar där Marc Najork listas som medförfattare:

2022

– Optimering av Top-K-mätvärden för neurala rankningsmodeller

2021

– Dynamiska språkmodeller för kontinuerligt utvecklande innehåll
– Tänka om kring sök: Att göra domänexperter av dilettanter

2020

– Feature transformation för neurala rankningsmodeller
– Learning-to-rank med BERT i TF-Ranking

2019

– Semantisk textmatchning för långformade dokument

2018

– TF-Ranking: Skalbart TensorFlow-bibliotek för Learning-to-Rank
– LambdaLoss-ramverket för ranking med metrisk optimering

2016

– Learning-to-rank med urvalsbias i personlig sökning

Vad är TW-BERT?

TW-BERT är ett rankningsramverk som tilldelar poäng (kallade vikter) till ord i en sökfråga för att mer exakt bestämma vilka dokument som är relevanta.

TW-BERT är också användbar inom Query Expansion, en process som omformulerar en sökfråga eller lägger till fler ord i den (som att lägga till ordet ”recept” i sökfrågan ”chicken soup”) för att bättre matcha sökfrågan med resultaten.

TW-BERT överbryggar två paradigm inom informationssökning

Forskningsartikeln diskuterar två olika sökmetoder: den ena är statistikbaserad och den andra bygger på djup maskininlärning.

De statistikbaserade informationssökningsmetoderna ger effektiv sökning som kan skalas upp, men de väger orden oberoende av varandra och tar inte hänsyn till sammanhanget i hela sökfrågan.

Modeller baserade på djup maskininlärning kan å andra sidan räkna ut sökfrågans sammanhang och ge bättre representationer för enskilda termer.

Forskarna föreslår användningen av TW-BERT för att kombinera de bästa aspekterna av båda metoderna.

TW-BERT är lätt att använda

En av TW-BERT:s fördelar är att den kan implementeras direkt i nuvarande informationssökningsprocesser som en ”drop-in”-komponent.

Till skillnad från tidigare viktningsmetoder kräver TW-BERT inga justeringar av retrievers parametrar eller specialiserad programvara.

Använder Google TW-BERT i sin rankningsalgoritm?

Eftersom TW-BERT är lätt att implementera är det rimligt att anta att det kan ha integrerats i Googles algoritm.

En viktig aspekt när man förutser om en algoritm kommer att användas är dess förbättringar jämfört med befintliga metoder. TW-BERT har visat sig vara framgångsrik, vilket kan öka sannolikheten för att den redan används av Google.

Forskarna förklarade hur den förbättrar nuvarande rankningssystem:

  • Med hjälp av dessa retriever-ramverk visar vi att vår termviktningsmetod överträffar de standardiserade termviktningsstrategierna för uppgifter inom domänen.
  • I uppgifter utanför domänen förbättrar TW-BERT de standardiserade viktningsstrategierna samt täta neurala rankare.

Dessa förbättringar och den enkla implementeringen är två viktiga skäl till att TW-BERT kan vara en del av Googles algoritm.

Om Google har infört TW-BERT kan det förklara vissa rankningsfluktuationer som observerats under den senaste månaden.

I avsaknad av officiell bekräftelse kan vi bara spekulera om sannolikheten för att TW-BERT är en del av Googles sökrankningsalgoritm. Oavsett är TW-BERT ett anmärkningsvärt ramverk som förbättrar noggrannheten i informationssökningssystem och potentiellt kan användas av Google.

Få gratis prisförslag

error:
TOTAL
Sök