Hur högt är tornet i Paris? Hur vektorsökning vet att du frågar om Eiffeltornet

Kredit:CC0 Public Domain

För bara några år sedan, webbsökningen var enkel. Användare skrev några ord och vadade genom resultatsidor.

I dag, samma användare kan istället ta en bild på en telefon och släppa den i en sökruta eller använda en intelligent assistent för att ställa en fråga utan att fysiskt röra en enhet alls. De kan också skriva en fråga och förvänta sig ett faktiskt svar, inte en lista med sidor med troliga svar.

Dessa uppgifter utmanar traditionella sökmotorer, som är baserade på ett inverterat indexsystem som förlitar sig på sökordsmatchningar för att ge resultat.

"Sökordssökningsalgoritmer misslyckas bara när folk ställer en fråga eller tar en bild och frågar sökmotorn, "Vad är det här?" sa Rangan Majumder, gruppprogramledare på Microsofts Bing sök- och AI-team.

Självklart, Det är inte nytt att hålla jämna steg med användarnas sökpreferenser – det har varit en kamp sedan webbsökningen startade. Men nu, det blir lättare att möta dessa behov som förändras, tack vare framsteg inom artificiell intelligens, inklusive de som tagits fram av Bings sökteam och forskare vid Microsofts forskningslabb i Asien.

"AI:n gör produkterna vi arbetar med mer naturliga, sade Majumder. Förut, folk var tvungna att tänka, "Jag använder en dator, så hur skriver jag in min inmatning på ett sätt som inte bryter sökningen?'"

Microsoft har gjort ett av de mest avancerade AI-verktygen det använder för att bättre möta människors växande sökbehov tillgängligt för alla som ett projekt med öppen källkod på GitHub. På onsdag, den släppte också tekniker för användarexempel och en tillhörande video för dessa verktyg via Microsofts AI-labb.

Algoritmen, kallas Space Partition Tree And Graph (SPTAG), låter användare dra fördel av intelligensen från modeller för djupinlärning för att söka igenom miljarder informationsbitar, kallas vektorer, i millisekunder. Den där, i tur och ordning, innebär att de snabbare kan leverera mer relevanta resultat till användarna.

Vektorsökning gör det lättare att söka efter koncept snarare än nyckelord. Till exempel, om en användare skriver "Hur högt är tornet i Paris?" Bing kan returnera ett naturligt språkresultat som talar om för användaren att Eiffeltornet är 1, 063 fot, även om ordet "Eiffel" aldrig förekom i sökfrågan och ordet "lång" aldrig förekommer i resultatet..

Microsoft använder vektorsökning för sin egen Bing-sökmotor, och tekniken hjälper Bing att bättre förstå avsikten bakom miljarder webbsökningar och hitta det mest relevanta resultatet bland miljarder webbsidor.

Använd vektorer för bättre sökning

I huvudsak en numerisk representation av ett ord, bildpixel eller annan datapunkt, en vektor hjälper till att fånga vad en databit faktiskt betyder. Tack vare framsteg inom en gren av AI som kallas djupinlärning, Microsoft sa att det kan börja förstå och representera sökavsikter med hjälp av dessa vektorer.

Kredit:Microsoft

När den numeriska punkten har tilldelats en databit, vektorer kan ordnas, eller kartlagt, med nära nummer placerade i närheten av varandra för att representera likhet. Dessa proximala resultat visas för användare, förbättra sökresultaten.

Tekniken bakom vektorsökningen som Bing använder fick sin start när företagets ingenjörer började märka ovanliga trender i användarnas sökmönster.

"När vi analyserar våra loggar, teamet upptäckte att sökfrågorna blev längre och längre, " sa Majumder. Detta antydde att användarna ställde fler frågor, överförklarar på grund av tidigare, dåliga erfarenheter av sökordssökning, eller "försökte agera som datorer" när de beskrev abstrakta saker - allt onaturligt och obekvämt för användarna.

Med Bing-sökning, vektoriseringsarbetet har utökats till över 150 miljarder databitar som indexerats av sökmotorn för att ge förbättringar jämfört med traditionell sökordsmatchning. Dessa inkluderar enstaka ord, tecken, webbsidor, fullständiga frågor och andra medier. När en användare söker, Bing kan skanna de indexerade vektorerna och leverera den bästa matchningen.

Vektoruppdrag tränas också med hjälp av djupinlärningsteknik för ständig förbättring. Modellerna överväger indata som slutanvändarklick efter en sökning för att bli bättre på att förstå innebörden av den sökningen.

Även om idén att vektorisera media och sökdata inte är ny, det har bara nyligen varit möjligt att använda den i skalan av en enorm sökmotor som Bing, Microsofts experter sa.

"Bing behandlar miljarder dokument varje dag, och tanken nu är att vi kan representera dessa poster som vektorer och söka igenom detta gigantiska index på 100 miljarder plus vektorer för att hitta de mest relaterade resultaten på 5 millisekunder, " sa Jeffrey Zhu, programledare på Microsofts Bing-team.

För att sätta det i perspektiv, Majumder sa, tänk på det här:En hög med 150 miljarder visitkort skulle sträcka sig härifrån till månen. Inom ett ögonblick, Bings sökning med SPTAG kan hitta 10 olika visitkort efter varandra inom den kortbunten.

Används för visuella, ljudsökning

Bing-teamet sa att de förväntar sig att erbjudandet med öppen källkod kan användas för företags- eller konsumentinriktade applikationer för att identifiera ett språk som talas baserat på ett ljudutdrag, eller för bildtunga tjänster som en app som låter folk ta bilder på blommor och identifiera vilken typ av blomma det är. För dessa typer av applikationer, en långsam eller irrelevant sökupplevelse är frustrerande.

"Även ett par sekunder för en sökning kan göra en app oanvändbar, " konstaterade Majumder.

Teamet hoppas också att forskare och akademiker kommer att använda det för att utforska andra områden av sökgenombrott.

"Vi har bara börjat utforska vad som verkligen är möjligt runt vektorsökning på detta djup, " han sa.

Student använder AI för att diagnostisera växtsjukdomar

Slå på elbilen för hälsofördelar

Elektronik