Maskininlärningspipeline som användes för att träna modellerna. Kredit:Greg Ross
En studie där maskininlärningsmodeller tränades för att bedöma över 1 miljon företag har visat att artificiell intelligens (AI) exakt kan avgöra om ett nystartat företag kommer att misslyckas eller bli framgångsrikt. Resultatet är ett verktyg, Venhound, som har potential att hjälpa investerare att identifiera nästa enhörning.
Det är välkänt att omkring 90 % av nystartade företag misslyckas:mellan 10 % och 22 % misslyckas under sitt första år, och detta utgör en betydande risk för riskkapitalister och andra investerare i företag i tidiga skeden. I ett försök att identifiera vilka företag som är mer benägna att lyckas, forskare har utvecklat maskininlärningsmodeller som utbildats i över 1 miljon företags historiska prestanda. Deras resultat, publicerad i KeAi's Journal of Finance and Data Science , visa att dessa modeller kan förutsäga resultatet av ett företag med upp till 90 % noggrannhet. Det innebär att potentiellt 9 av 10 företag är korrekt bedömda.
"Denna forskning visar hur ensembler av icke-linjära maskininlärningsmodeller som tillämpas på big data har enorm potential att kartlägga stora funktionsuppsättningar till affärsresultat, något som är ouppnåeligt med traditionella linjära regressionsmodeller, " förklarar medförfattaren Sanjiv Das, Professor i finans- och datavetenskap vid Santa Clara Universitys Leavey School of Business i USA.
Författarna utvecklade en ny ensemble av modeller där det kombinerade bidraget från modellerna uppväger den prediktiva potentialen för var och en ensam. Varje modell klassificerar ett företag, placera den i en av flera framgångskategorier eller en misslyckandekategori med en specifik sannolikhet. Till exempel, ett företag kan ha stor sannolikhet att lyckas om ensemblen säger att det har 75 % sannolikhet att vara i kategorin IPO (noterad på börsen) eller "förvärvad av ett annat företag", medan endast 25 % av dess förutsägelse skulle falla i kategorin misslyckad.
Forskarna tränade modellerna på data hämtade från Crunchbase, en crowd-sourced plattform som innehåller detaljerad information om många företag. De gifte sig med Crunchbase-observationerna med patentdata från USPTO (United States Patent and Trademark Office). Med tanke på Crunchbases publikbaserade karaktär, det var ingen överraskning att höra att vissa företags poster saknar information. Denna observation inspirerade författarna att mäta mängden information som saknas för varje företag och använda detta värde som en input till modellen. Denna observation visade sig vara en av de mest kritiska egenskaperna för att avgöra om ett företag skulle förvärvas eller på annat sätt misslyckas.
Huvudförfattaren Greg Ross från Venhound Inc. noterar att ensemblen av modeller, tillsammans med nya datafunktioner, "genererar en nivå av noggrannhet, precision och återkallelse som överstiger andra liknande studier. Investerare kan använda detta för att snabbt utvärdera framtidsutsikter, lyfta potentiella röda flaggor och fatta mer välgrundade beslut om sammansättningen av sina portföljer."