En vild gnu, även känd som en gnu.
Uppvärmning, ventilation, och luftkonditioneringssystem – kallade HVAC-system – kan vara en känslig balans. Det finns många faktorer att ta hänsyn till, från luftflödet mellan rummen till effekten av mänsklig kroppsvärme. Under det senaste decenniet, forskare har vänt sig till maskininlärning för att optimera dessa system. Med smartare kontroller, byggnader kan spara energi utan att offra komfort.
Det finns för närvarande två huvudsakliga synsätt på problemet. I det första tillvägagångssättet, styrenheten använder en detaljerad modell av byggnaden för att hantera sina system. Dock, modellen tar mycket ansträngning att skapa. "En mycket bra modell av en byggnad är svår att göra, svårt att underhålla, och skalar inte, säger Mario Bergés, professor i byggnads- och miljöteknik. "Byggnader är inte likadana, så du måste skapa en modell för varje byggnad."
Den andra metoden innebär att generera stora mängder data, vilket gör att regulatorn kan anpassa sig till olika byggnadssystem. I detta fall, det största hindret är hur lång tid det tar. "Du skulle behöva cirka 40 års simuleringsdata för en relativt komplex byggnad, " säger Bergés. "I den verkliga världen, du kan inte bara ägna 40 år åt att försöka ta reda på hur man kontrollerar en byggnad."
För att tackla dessa utmaningar, Bergés arbetade med Ph.D. student Bingqing Chen och en Dell-samarbetspartner. De utvecklade en ny lösning, Gnu-RL, som innehåller det bästa av båda metoderna.
Först, Gnu-RL slutför offline-förträning med hjälp av historiska data. VVS-system har redan kontroller, så Gnu-RL lär sig att kopiera dem. På det här sättet, det undviker komplikationerna med exakta modeller och stora mängder data. "Det behöver bara historiska data, som vi redan har många av, " säger Chen.
När förträningen är klar, Gnu-RL kan imitera den tidigare styrenheten på ett tillförlitligt sätt. Nästa, det lärs ut att anpassa sig och bli bättre. Bergés och Chen tillämpade en nyligen utvecklad differentiable Model Predictive Control (MPC) policy. Denna policy belönar agenten för att maximera belöningen och minimera kostnaderna, och medlet justerar därefter tills det uppnår de optimala kontrollerna för HVAC-systemet. Den här metoden kallas förstärkningsinlärning - vilket är anledningen till att lösningen har RL i slutet av namnet.
Den första delen av namnet, å andra sidan, kommer från en mer okonventionell källa. En gnu är en stor, mörk antilop från Afrika. Dessa djur är otroligt precociala, vilket innebär att de föds i ett relativt avancerat tillstånd. "De kan fly från rovdjur inom samma dag som de föds, " säger Chen. "Och Gnu-RL kontrollerar ganska bra vid start." Denna likhet gjorde namnet till ett naturligt val.
Bergés och Chen backar upp denna jämförelse med två tester. Det första testet utfördes med en simulering av den intelligenta arbetsplatsen högst upp på Margaret Morrison. "Vi hade en förbättring från 40 år till fyra veckor när det gäller träningstiden, ", säger Bergés. "Och vi visade också en förbättring på cirka 6% i energibesparingar utan att ge avkall på komforten."
Bergés och Chen blev så uppmuntrade av simuleringsresultaten att de bestämde sig för att tillämpa Gnu-RL i en verklig miljö. I tre veckor, de lät Gnu-RL styra luftflödet i ett konferensrum i Gates Center. Resultaten av detta test var lika lovande. "Den lärde sig hur man imiterar den befintliga styrenheten, " säger Bergés. "Då, utöver det, den lärde sig att förkyla utrymmet och ge komfort innan folk skulle komma, vilket är något som den befintliga kontrollern inte gjorde."
Dock, medan deras arbete är spännande, Bergés och Chen vill uppmärksamma arbetet från forskarna som kom före dem. "Vårt bidrag är en ansökan, så vi bygger på andras arbete, " säger Chen. Framför allt, Gnu-RL antog den differentierbara MPC-policy som utvecklats av Brandon Amos och Zico Kolter. Denna policy gjorde det möjligt för Gnu-RL att vara både effektiv och flexibel.
Bergés och Chen presenterade sitt papper om Gnu-RL på 6 th ACMs internationella konferens om system för energieffektiva byggnader, städer, och Transportation (BuildSys 2019). Konferensen ägde rum i New York City den 13 och 14 november.
Med blicken mot framtiden, Bergés och Chen tror att det fortfarande finns utrymme för Gnu-RL att växa. "Vi har tittat på relativt enkla scenarier, ", säger Bergés. "Det kan uppstå komplikationer när vi försöker kontrollera mycket mer komplexa byggnader, så det är fortfarande en öppen fråga. Men vi pekar åtminstone i en riktning som är ny och som kan stimulera en hel del forskning om hur man ska ta itu med det här problemet."