Kredit:CC0 Public Domain
Den automatiserade märkningen och förutsägelsen av allvarlighetsgraden av felrapporter för datorprogramvara är målet för forskare vid The Hashemite University i Zarqa, Jordanien. Detaljer om deras ansträngningar kartläggs i International Journal of Computational Science and Engineering. I sista hand, de utvecklar en intelligent klassificerare som kan förutsäga om en nyligen skickad felrapport är tillräckligt oroande i felspårningssystemet för att motivera brådskande utredning och åtgärdande.
För att utveckla sitt system, teamet bygger två datamängder med hjälp av 350 felrapporter från öppen källkodsgemenskapen – Eclipse, Mozilla, och Gnome – rapporterade i det monstruösa, välkänd, och det passande namnet databas, Bugzilla. Datauppsättningarna med har karakteristiska textegenskaper, baserat på 51 viktiga termer, teamet förklarar och så baserat på denna information, de skulle kunna träna olika diskriminerande modeller för att utföra automatiserad märkning och förutsägelse av svårighetsgrad av varje efterföljande felrapport som skickas in. De använde en förstärkningsalgoritm för att förbättra prestandan.
"För automatisk märkning, noggrannheten når cirka 91 % med AdaBoost-algoritmen och korsvalideringstestet, " rapporterar laget. Men, de såg bara en allvarlighetsförutsägelseklassificering på cirka 67 % med AdaBoost-algoritmen och korsvalideringstestet. Ändå, teamet säger att deras resultat är uppmuntrande och erbjuder hopp om att ta bort flaskhalsen som är den manuella bedömningen av felrapporter som har använts hittills.
"De föreslagna funktionsuppsättningarna har visat sig vara en bra klassificeringsprestanda för två "svåra" problem, " rapporterar laget. "Resultaten är uppmuntrande och, i framtiden, vi planerar att arbeta mer med att förbättra komponenten klassificeringsalgoritmer för bättre prestanda, " avslutar forskarna.