De bevindingen, vandaag gemeld in cel systemen, gelden voor digitale objecten inclusief datasets, software, broncode, en andere producten die wetenschappers ontwikkelen die nuttig kunnen zijn voor de onderzoeksgemeenschap.
Het doel is om de manier waarop we gegevens in biomedisch onderzoek beheren te upgraden; het delen en hergebruiken van gegevens uit deze projecten om maximaal waarde te extraheren. Terwijl financiers, onderzoekers, en andere belanghebbenden erkenden dat we het beter moeten doen met databeheer in biomedisch onderzoek, het pad om dit te doen was niet duidelijk."
Avi Ma'ayan, PhD
Ma'ayan is de directeur van het Mount Sinai Center for Bioinformatics, en senior onderzoeker aan het onderzoek.
Het team hoopt dat als biomedische onderzoekers de toolbox toepassen om hun werk te evalueren, ze zullen zich meer bewust worden van eenvoudige stappen die ze kunnen nemen om de bruikbaarheid van hun digitale objecten te verbeteren.
In 2017 en 2018 financierden de National Institutes of Health (NIH) het NIH Data Commons Pilot Phase Consortium, die werkte om manieren te vinden om het delen van digitale onderzoeksobjecten te verbeteren via een cloudgebaseerde omgeving.
Om een dergelijke virtuele omgeving te implementeren, onderzoekers moesten normen en een platform ontwikkelen om wetenschappers te helpen zich te houden aan de FAIR (findable, toegankelijk, interoperabel, en herbruikbare) richtlijnen die eerder zijn opgesteld door leden van het consortium.
Eerst, het team ontwikkelde statistieken en rubrieken om FAIRness te beoordelen, maar erkende dat deze statistieken en rubrieken mogelijk niet in gelijke mate van toepassing zijn op alle onderzoeksdomeinen. Dus creëerden ze de gereedschapskist, genaamd FAIRshake, waarmee degenen die digitale objecten maken niet alleen hun FAIRness kunnen beoordelen, maar ook nieuwe normen kunnen ontwikkelen om FAIRness te definiëren en te evalueren.
Dus, de onderzoekers verklaarden dat "FAIRshake het naast elkaar bestaan van meerdere statistieken en rubrieken mogelijk maakt, waardoor de gemeenschap op meer democratische wijze normen kan ontwikkelen."
Dr. Ma'ayan benadrukt dat onderzoek niet open access hoeft te zijn om FAIR te zijn. "Het vereist alleen dat mensen een duidelijke licentie verstrekken over hoe anderen hun gegevens moeten gebruiken, " hij zei.
De FAIRshake-toolbox bevat zowel handmatige als geautomatiseerde tools voor het beoordelen van FAIRness, die vragen stellen als "Heeft het digitale object machineleesbare metadata?" De toolbox is het afgelopen jaar getest op duizenden digitale objecten en het team heeft tutorials op YouTube geplaatst over het gebruik van FAIRshake.
Terwijl Dr. Ma'ayan zegt dat er een "natuurlijke verbetering van de toegankelijkheid en acceptatie van die normen is geweest, zelfs zonder enige druk van ons of van de NIH, " hij legt ook uit dat het team verrast was door enkele van de trends die ze opmerkten bij het uitvoeren van beoordelingen met de toolkit.
Hij zei dat maar weinig onderzoekers Application Programming Interfaces (API's) hebben geïmplementeerd - software waarmee verschillende computerprogramma's kunnen communiceren - die "van cruciaal belang zijn voor het samenbrengen van gegevens". Onderzoekers gaven ook vaak geen licenties om andere wetenschappers te vertellen hoe ze toestemming konden krijgen om de gegevens te gebruiken.
Naarmate onderzoeksproducten EERLIJK worden, wetenschappers zullen verbindingen kunnen maken en dingen kunnen bouwen die niet mogelijk waren voordat ze tools zoals machine learning gebruikten om "de manier te transformeren waarop we gegevens hergebruiken, " zegt dr. Ma'ayan.