FoodPro Preloader

Lab Failures Gjør til gull i Søk etter nye materialer


"Lær av dine feil." Det er et kjent ordtak, men folk har fortsatt en tendens til å markere sine suksesser og feie sine feil under teppet, som professor ved Princeton University påpekte i forrige uke da han publiserte sin "CV of Failures" (pdf) som siden har gått viral. Nå, i en studie publisert denne uken i Nature, har et team av forskere ved Haverford College i Pennsylvania tatt denne ideen til neste nivå - ved å bruke den til det vitenskapelige samfunn. (er e

"Lær av dine feil." Det er et kjent ordtak, men folk har fortsatt en tendens til å markere sine suksesser og feie sine feil under teppet, som professor ved Princeton University påpekte i forrige uke da han publiserte sin "CV of Failures" (pdf) som siden har gått viral. Nå, i en studie publisert denne uken i Nature, har et team av forskere ved Haverford College i Pennsylvania tatt denne ideen til neste nivå - ved å bruke den til det vitenskapelige samfunn. (er en del av Springer Nature.)

Selv om de fleste forsøkene feiler, er det bare suksessene som er rapportert i vitenskapelig litteratur og diskutert blant eksperter. Det store flertallet av dataene er kassert, igjen for å samle støv i glemt laboratoriebøker eller aldri nedskrevet, noe som gjør det effektivt utilgjengelig for bruk i videre forskning. "Vitenskapelig litteratur er partisk mot feil, " sier eksperimentell kjemiker Alexander Norquist, en av studiens hovedforfattere. "Det vi ønsker å gjøre, er å trekke så mye informasjon som mulig fra det store antallet mislykkede reaksjoner som vanligvis ikke blir rapportert." For å oppnå dette brukte Haverford-forskerne en samling av disse mislykkede eller "mørke" reaksjonene for å skape en maskinlæringsmodell som kunne forutsi suksessen til nye kjemiske reaksjoner med større nøyaktighet enn mennesker er i stand til å oppnå.

De startet med å samle en database med nesten 4000 kjemiske reaksjoner (hvorav mange hadde mislyktes og var derfor ikke allerede digitalisert) utført i løpet av det siste tiåret i Norquists laboratorium. Informasjonen fokuserer på syntese av nye materialer - i dette tilfellet faste stoffer kalt templaterte vanadium selenitter, som består av vanadium, selen, oksygen og en organisk komponent. De opprettet deretter en maskinlæringsalgoritme for å utlede mønstre fra dataene og avgjøre hva som gjorde noen eksperimenter lykkes og andre feiler. Vanligvis bygger forskere som Norquist en intuisjon i mange år om kombinasjonene av forholdene - temperatur, mengde og forholdet mellom reaktanter, surhet og en rekke andre faktorer - som kan føre til en vellykket dannelse av krystaller. Men vår intuisjon er alltid ufullstendig, sier Norquist. "Det er subtilitet og nyanse for forskjeller mellom reaktanter som ikke er tydelige."

Så vendte teamet til maskinlæring: De tildelte nesten 300 egenskaper til hver reaksjon og brukte deretter en støtteteknormaskin som kan analysere data i høye dimensjoner for å gjøre forutsigelser om hvilke forhold som ville være nødvendige for nye kombinasjoner av reaktanter som de deretter testet i laboratoriet. Algoritmen forutslo forholdene for en vellykket dannelse av krystaller i 89 prosent av disse tilfellene, sammenlignet med forskernes forutsigelser, som hadde en suksessrate på 78 prosent.

Fordi årsakene til algoritmens avgjørelser ikke alltid var klare, da de enorme dataene ble vurdert, gikk forskerne tilbake til selve modellen og dannet et beslutningstreet, en flytdiagram-lignende struktur som viser de potensielle resultatene av en serie av valg. Ved å bruke denne metoden, som er mye lettere å tolke, kunne de få ny innsikt og formulere hypoteser. De fant for eksempel at polarisasjon (som måler hvordan fordeling av kostnader forvrenges i nærvær av et elektrisk felt) var viktig på en måte som de ikke hadde forventet basert på egen lab erfaring. Faktisk endte de med tre hypoteser om forskjellige undergrupper av reaktanter. En klasse reaksjoner som inneholdt visse organiske komponenter krevde tilstedeværelsen av vanadium i en spesifikk oksidasjonstilstand. I mellomtiden da disse komponentene hadde lave polarisasjoner, innså forskerne at de måtte rette oppmerksomheten til oppførselen til andre reaktanter, nemlig natrium. Til slutt, for spesielt store organiske komponenter, hadde ladetetthet en kritisk rolle. "Den virkelige nyheten i dette er slutt-til-ende rørledningen, " sier dataloger Sorelle Friedler, en av studiens hovedforfattere. "Ideen om å ta tidligere betraktet feil, ubetydelige reaksjoner og bruk av informasjonen i dem for å koble til en maskinlæringsrørledning, og deretter prøve å undersøke resultatene av maskinlæringsrøret for å generere disse nye hypotesene."

Resultatene kommer i en tid da materialforskning har blitt stadig viktigere. Det hvite hus lanserte Material Genome Initiative i 2011, for eksempel for å akselerere tempoet der nye materialer blir oppdaget og satt på markedet. Nå kan Haverford-teamets maskininnlæringsmetode hjelpe forskere til å gjøre dette søket mye mer målrettet, både ved å optimalisere syntetiske prosesser som allerede er kjent, og ved å skape nye faste stoffer. "Materialer står sentralt i alle teknologiske fremskritt vi kan tenke på, " sier Ram Seshadri, en materialforsker ved University of California, Santa Barbara, som ikke deltok i denne undersøkelsen. "Mobiltelefonen jeg bruker akkurat nå - sitt litiumbatteri er fullt av avanserte materialer, laget av nettopp den typen kjemiske syntetiske stoffer som er beskrevet i dette papiret, " bemerker han.

Mobiltelefoner er ikke de eneste potensielle bruksområdene til slike materialer. Denne forskningen kan rettes mot alt fra å skape bedre sjampo og solkremkrem til å produsere nye legemidler og bygge bedre solcellepaneler. Videre vil forskerne gjøre sin maskinlæringsstrategi tilgjengelig på andre områder, både innen og utenfor kjemi. Teamet har publisert sin reaksjonsdatabase online slik at andre forskere kan bidra med egne data. "Vi er veldig spent, " sier Friedler. "Vi håper at dette papiret vil stimulere andre laboratorier til å jobbe med oss." Tilgang til slike data, spesielt feilene, vil tillate dem å lage nye funn og forfine deres algoritme. "Dette er tallet av data, " sier Alán Aspuru-Guzik, professor i kjemi og kjemisk biologi ved Harvard University, som ikke var tilknyttet studien. "Og dette papiret viser at vi kan lære mye av mislykkede eksperimenter."

"Vanligvis er ikke vitenskap data-drevet, det er årsak og effekt drevet. Dette arbeidet anerkjenner at noen ganger må du gå utover årsakssammenheng og bruke data-drevne tilnærminger, sier Seshadri. "Men det fantastiske er at de data-drevne tilnærmingene selv fører til en bedre forståelse av årsakssammenheng. Så tilnærmingen [Haverford-teamet] har tatt er uunngåelig tilnærmingen, mange av oss kommer til å vedta mer og mer i fremtiden. "

Anbefalt


Aviation Industry ser ut til å løse et karbonproblemManglende nøytroner kan føre et hemmelig liv som mørk materieKan vi holde flyene trygge uten å drepe så mange fugler?Hva lærer forskere ved å binde fugler?Records from Ancient China Reveal Link Between Epidemics and Climate ChangeMan-Made Genetiske Instruksjoner Yield Living Cells for første gang2017 Var det tredje hotteste året på rekord for USABybeboere Kjør avskoging i 21. århundre