Fördelning av topp-10 funktioner. Upphovsman:Panida Songram.
Ett växande antal företag och individer världen över skapar Facebook -sidor för marknadsförings- och reklamändamål. Detta beror på att Facebook erbjuder möjligheten att kostnadsfritt kommunicera till potentiella eller befintliga kunder, reklam för nya produkter, erbjudanden eller tjänster.
Än, just för att denna tjänst är gratis och lättillgänglig, skadliga användare använder det för att skapa vilseledande sidor. Att upptäcka och identifiera opålitliga sidor är av största vikt, eftersom det kan hjälpa till att varna användare och minska skadlig aktivitet på plattformen.
Forskare över hela världen har därför försökt utveckla metoder för att upptäcka och förebygga bedrägeri på Facebook och andra sociala medieplattformar. Panida Songram, en forskare vid Mahasarakham University, i Thailand, har nyligen genomfört en studie som undersöker användningen av övervakad maskininlärning för att upptäcka tillförlitligheten eller opålitligheten på Facebook -sidor.
"Detta dokument syftar till att upptäcka och undersöka egenskaperna hos opålitliga och pålitliga Facebook -sidor, "Songram skrev i sin tidning, som publicerades i tidskriften Springer's Artificial Life and Robotics. "Effektiva maskininlärningsmodeller och metoder för val av funktioner undersöks också för att upptäcka opålitliga och pålitliga sidor."
Songram extraherade ett stort antal funktioner som kan hjälpa till att avgöra om en sida är pålitlig eller inte, inklusive sidinformation, information om en produkt eller tjänst, användarsvar och inläggsbeteende hos sidadministratören. Hon utbildade sedan ett övervakat verktyg för maskininlärning för att analysera dessa funktioner och klassificera sidor som tillförlitliga eller opålitliga.
"Först, Facebook -sidor samlas slumpmässigt och sedan märks de av fem användare, "Songram förklaras i hennes artikel." Facebook -sidor med godkännande av fem användare väljs ut och deras information hämtas med hjälp av Facebook Graph API. Nästa, funktioner extraheras från informationen och undersöks i experimenten. "
Songram utvärderade effektiviteten hos olika klassificerare för att upptäcka opålitliga och pålitliga sidor. Hon fann att KNN var den bästa klassificeraren, uppnå 88,67 procents noggrannhet. Hon genomförde också en analys av sidfunktioner på Facebook, för att bättre förstå vad som typiskt kännetecknar pålitliga eller opålitliga sidor.
"För opålitliga sidor, antalet dagar mellan datum för senaste inlägg och hämtningsdatum är högt och antalet inlägg per vecka (inläggsfrekvens) är mycket litet, "Songram skrev i sin tidning." Det indikerar att opålitliga sidor inte är aktiva, medan pålitliga sidor är aktiva. "
Songram noterade att mängden människor som diskuterar opålitliga sidor på nätet är betydligt mindre än de som pratar om pålitliga sidor. En möjlig förklaring till detta är att användare ofta inser att sidorna är opålitliga och att de därför inte pratar om dem online. Inlägg på pålitliga sidor innehöll också mycket fler webbadresser än de på opålitliga sidor, samt mer information om företaget och dess produkter/tjänster.
Med hjälp av vad hon fann vara de 10 bästa funktionerna för att bestämma en Facebook -sidas tillförlitlighet, Songram uppnådde en klassificeringsnoggrannhet på 91,37 procent. I framtiden, hennes resultat kan hjälpa utvecklingen av effektivare verktyg för att snabbt upptäcka opålitliga Facebook -sidor.
© 2018 Science X Network