• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Andra
    Lennon eller McCartney? Kan statistisk analys lösa ett författarskapspussel?

    Kredit:CC0 Public Domain

    Stylometri – användningen av statistiska tekniker för att bestämma författarskap – är mest känd för att identifiera Unabomber som Theodor Kaczynski och avslöja att Shakespeare samarbetade med Christopher Marlowe i Henry IV-spelcykeln. I textanalys, det är inte det ovanliga ordvalet som förråder den dolda rösten, men det vanliga – de återkommande mönstren av vanliga ord, som prepositioner, som markerar den troliga identiteten för en enda person.

    Det var en ömsesidig Beatles passion – upptäckt vid en konferens på Prince Edward Island – som ledde till att Mark Glickman, lektor i statistik vid Harvard, och Jason Brown, professor i matematik vid Dalhousie University, att undra om ett stilometriskt tillvägagångssätt skulle kunna svara på den brännande frågan:Lennon eller McCartney?

    Som Glickman förklarar, för de flesta Lennon-McCartney-låtar, det är välkänt och väldokumenterat vem av de två som skrev låten. Dock, ett förvånansvärt stort antal låtar (eller delar av låtar) har ifrågasatt författarskapet. Som ett exempel, ingen vet vem som skrev musiken till "In My Life, "ett spår från albumet Rubber Soul från 1965, som är rankad 23 på Rolling Stones The 500 Greatest Songs of All Time. Både Lennon och McCartney mindes olika. "Så, vi undrade om du kunde använda dataanalystekniker för att försöka ta reda på vad som pågick i låten för att skilja om det var av det ena eller det andra, säger Glickman.

    Med hjälp av tidigare Harvard statistikstudent Ryan Song, Glickman och Brown "dekomponerade" varje Beatles-låt från 1962 till 1966 till fem representationer. Varje representation bestod av frekvensen av förekomsten av en uppsättning musikaliska drag inom varje låt. "Grundtanken bakom vårt tillvägagångssätt, säger Glickman, "är att konvertera en låt, vars musikaliska innehåll är svårt att kvantifiera på något direkt sätt, till en uppsättning olika datastrukturer som är tillgängliga för att etablera en signatur för en låt med hjälp av ett kvantitativt tillvägagångssätt." Glickman fortsätter, "Tänk på att bryta ner en färg till dess beståndsdelar av rött, grön och blå med olika vikter fästa. Vi gör samma sak med Beatles-låtar, dock med mer än tre komponenter. Totalt, vår metod delar in låtar i totalt 149 beståndsdelar."

    "Den första representationen består helt enkelt av frekvenserna av olika vanligt spelade ackord, tillsammans med sammanställningar av ovanliga ackord, " säger Glickman. "Vi kunde bilda 11 ackordkategorier." Sedan, de kännetecknade melodiska toner – toner som sjöngs av sångaren. Tredje, de spelade in frekvenserna för förekomsten av ackordövergångar, det är, ett ackord följt av ett annat ackord. På nytt, vissa ovanliga ackordövergångar aggregerades i enskilda kategorier. Fjärde, de spelade in frekvenserna av på varandra följande melodiska tonpar.

    Och då, till sist, de sönderdelade låtar i fyra melodiska toner "konturer". En kontur, säger Glickman, är en melodisk sekvens med fyra toner kategoriserad i en serie "ups, " "nedgångar" och "förblir desamma." Med andra ord, om en melodisk passage med fyra toner innefattar fyra toner som ökar i tonhöjd, då skulle konturen vara ("upp, " "upp" "upp") eftersom varje på varandra följande tonpar innebär en ökning av tonhöjden. Undersöka konturer med fyra toner, säger Glickman, lägger till extra detaljer som kan hjälpa till att skilja stilar av melodisk komposition.

    Anledningen till att dessa fem representationer kan fungera som signaturer för olika musikaliska kompositionsstilar är att, som Glickman påpekar, det är något välkänt med Beatles låtskrivarstilar:Lennon skrev vanligtvis melodiska linjer som inte varierade mycket.

    "Tänk på Lennon-låten, 'Hjälp!'", säger Glickman. "Det går i princip, 'När jag var yngre, så mycket yngre än idag, ' där planen inte förändras särskilt mycket. Den stannar i samma ton upprepade gånger, och ändras endast i korta steg. Medan Paul McCartney, du tar en låt som "Michelle, ' och det går, 'Michelle, ma belle. Sont les mots qui vont très bien ensemble.' När det gäller tonhöjd, det är överallt."

    Deras tillvägagångssätt att sluta sig till okänt eller omtvistat författarskap från musikaliska drag kan förstås i tre steg. Först, deras modell hävdar att var och en av frekvenserna för de 149 musikaliska inslagen i en låt beror på låtens författare. Till exempel, "toniken" (grundackordet i en låt) antas förekomma med en frekvens i Lennon-låtar, men en möjligen annan frekvens i McCartneys låtar. Andra, de använder ett vanligt verktyg i sannolikhet som kallas "Bayes regel" för att vända sannolikheten. Med andra ord, börjar med frekvensen av de 149 musikaliska inslagen som känner till en låts författare, de bestämmer en modell för sannolikheten att Lennon eller McCartney skrev en låt med tanke på frekvensen av de 149 musikaliska inslagen. Denna modell tränades sedan med hjälp av 70 Lennon-McCartney-låtar eller sångpartier där författarskapet verkligen var känt. Till sist, som ett tredje steg, resultaten av denna modell tillämpades på Lennon-McCartney-låtar och låtdelar där författarskapet var ifrågasatt, vilket resulterade i sannolikhetsförutsägelser för låtarna av okänt författarskap.

    "Så, sannolikheten att 'In My Life' skrevs av McCartney är .018, säger Glickman, "vilket i grunden betyder att det är ganska övertygande en Lennon-låt." McCartney minns fel. Men "Ordet, "som Glickman trodde var säker på att vara en Lennon-låt visade sig, enligt deras modell, nästan säkert av McCartney.

    Finns det mer i den här övningen än en rolig musikal som dunnit? "Ja, " säger Glickman. "Denna teknik kan utökas. Vi kan titta på pophistorien och kartlägga flödet av stilistiskt inflytande."


    © Vetenskap https://sv.scienceaq.com