Gränssnittet för crowdsourcingstudien. Upphovsman:Fan et al.
Deep learning -tekniker har visat sig vara oerhört användbara för att analysera alla typer av data, allt från bilder till text, onlineposter och ljudinspelningar. Dessa tekniker är utformade för att identifiera mönster i stora datamängder, separera objekt i olika kategorier och gör förutsägelser mycket snabbare än människor.
I en färsk studie, forskare vid Simon Fraser University, Academia Sinica och Dartmouth College har tillämpat djupinlärningstekniker för att identifiera likheter och skillnader mellan kinesisk och västerländsk klassisk musik. Deras papper, förpublicerad på arXiv, presenterar en jämförande analys av musikinspelningar med hjälp av modeller för ljudhändelsedetektering (SED) och ljudbildsemotion (SER).
"Vi har lyssnat på både kinesisk och västerländsk klassisk musik, "Jianyu Fan, en av forskarna som genomförde studien, berättade TechXplore. "Vi känner att flera faktorer skiljer kinesisk musik från västerländsk musik, inklusive deras underliggande kultur, filosofi och tankesätt. Det är därför vi är mycket intresserade av studier som jämför kinesisk och västerländsk musik. "
Deep learning -modeller för analys av musikinspelningar kan ibland prestera dåligt, när de kämpar för att lära sig mönster i information på hög nivå, som en sångs melodi, harmoni, etc. För att övervinna begränsningarna i tidigare studier, Fan och hans kollegor tillämpade ljudbildsmodeller för analys av kinesisk och västerländsk klassisk musik, för att utvärdera deras effektivitet för att identifiera likheter och skillnader mellan de två undergenrerna.
Fördelningen av känslomässiga kommentarer av västerländsk klassisk musik. Upphovsman:Fan et al.
Initialt, forskarna sammanställde två kommenterade datamängder som innehåller inspelningar av kinesisk och västerländsk musik, kallad WCMED och CCMED. Senare, de utbildade en förutbildad SED och en förutbildad SER -modell på dessa datamängder separat, kombinerar dem båda med en stödvektorregressionsmodell (SVR). SED -modeller är utformade för att upptäcka ljudhändelser i ljudsignaler, medan SER -modeller tränas i att känna igen de känslor som förmedlas av ljudbildinspelningar.
"Medan tidigare musikstudier främst använder modeller baserade på musik, vi var nyfikna på om en modell som är utbildad i allmänt ljudlandskap kan användas för att analysera musik och hur de är olika för kinesisk och västerländsk klassisk musik, "Fan förklarad." Därför, Vi försökte använda två modeller byggda på allmänt ljud:en modell för detektering av ljudhändelser och en modell för ljudkänslomässig igenkänning. "
Forskarna använde överföringsinlärningstekniker för att extrahera ljud på hög nivå. De använde sedan dessa representationer för att träna sin musikkänslighetsigenkänningsmodell för att upptäcka känslor som förmedlas av musikinspelningar. Eftersom deras modell var förutbildad för att generalisera ljudets egenskaper, de fann att dessa representationer fungerade bättre i kombination med en enklare modell, särskilt för analys av kinesisk klassisk musik. Forskarna utbildade också en djupinlärningsklassificerare om de datamängder de skapade och genomförde ytterligare analyser med fokus på specifika funktioner i kinesiska och västerländska sånger.
"Eftersom vårt mål är att använda förutbildade ljudbildsmodeller för att analysera och jämföra kinesisk och västerländsk klassisk musik, vi förväntade oss inte att modellen skulle fungera perfekt för olika typer av ljud och olika typer av uppgifter, "Fan sa." Men våra resultat tyder på att det är effektivt för att förutsäga upphetsning av både kinesisk och västerländsk klassisk musik med hjälp av ljudlandskapsmodeller. "
Fördelningen av känslomässiga kommentarer av kinesisk klassisk musik. Upphovsman:Fan et al
Resultaten från Fan och hans kollegor tyder på att SED- och SER -modeller är lovande verktyg för analys av musikinspelningar. Intressant, den jämförande analysen av kinesisk och västerländsk klassisk musik med hjälp av dessa tekniker ledde till resultat som är i linje med idéer som presenteras av musikteoretiker i Kina.
Forskarna observerade också att deras djupinlärningsklassificerare kände igen ljudbildinspelningar som klassisk kinesisk musik. Detta tyder på att ljudbildinspelningar vanligtvis delar fler likheter med klassisk kinesisk musik än med västerländsk klassisk musik.
"Vår studie belyste att vissa likheter finns mellan kinesisk klassisk musik och ljudbildinspelningar, "Fan sa." Dessa resultat är i linje med de som rapporterats av kinesiska musikforskare och kinesiska filosofer inom klassisk musik. "
I framtiden, studien som gjorts av detta forskargrupp kan inspirera till andra studier som jämför olika musikgenrer baserat på analys av ljudlandskapsmodeller. Under tiden, Fan och hans kollegor planerar att fortsätta undersöka likheter och skillnader mellan kinesisk och västerländsk musik med hjälp av djupa inlärningsmetoder, samtidigt som man försöker bygga modeller som automatiskt kan komponera ny klassisk musik.
© 2020 Science X Network