Die Kunst der wissenschaftlichen Kuration

Blog

HeimHeim / Blog / Die Kunst der wissenschaftlichen Kuration

Aug 01, 2023

Die Kunst der wissenschaftlichen Kuration

Am Ende von Raiders of the Lost Ark, der mysteriösen Bundeslade,

Am Ende von Raiders of the Lost Ark wird die mysteriöse Bundeslade, die Indiana Jones kürzlich geborgen hat, in einer einfachen Holzkiste verpackt und in ein riesiges Lagerhaus voller unzähliger Stapel ähnlicher Kisten transportiert. Als der Karren um eine Ecke im Lagerhaus verschwindet, fragen sich die Zuschauer, was nötig wäre, um die Bundeslade wiederzufinden.

Die Prämisse dieser Szene bietet eine treffende Analogie dafür, was mit Daten – selbst wertvollen, hart erkämpften Daten – passieren kann, die in Datenbanken ohne angemessene Organisation gespeichert sind. Sowohl für erfahrene als auch für unerfahrene Wissenschaftler kann die Navigation in der Informationslandschaft auf der Suche nach solchen „verborgenen“ Daten, die für ihre Forschung relevant sind, außerordentliche Anstrengungen erfordern.

Wenn Kuration gut durchgeführt wird, beschleunigt sie den Forschungsfortschritt und sorgt für mehr Transparenz im wissenschaftlichen Prozess und Vertrauen in wissenschaftliche Erkenntnisse.

Im heutigen Umfeld der offenen Wissenschaft ist die sorgfältige Kuratierung von Daten, Software, Dokumenten und anderen Elementen des wissenschaftlichen Wissensökosystems von entscheidender Bedeutung, um Forschern dabei zu helfen, die riesige, ständig wachsende Informationsmenge effizient zu durchsuchen. Die Kuration sorgt für Kontext und Klarheit rund um die Informationen und macht sie leichter auffindbar und nützlicher. Kuratierte Anleitungen verbessern auch die Zugänglichkeit von Daten und Informationen. Wenn Kuration gut durchgeführt wird, beschleunigt sie den Forschungsfortschritt und sorgt für mehr Transparenz im wissenschaftlichen Prozess und Vertrauen in wissenschaftliche Erkenntnisse.

Hier untersuchen wir das Konzept der Kuratierung wissenschaftlicher Inhalte und ihren Wert für die Verbesserung der Entdeckung und Nutzung wissenschaftlicher Daten und Informationen und konzentrieren uns dabei auf zwei Anwendungsfälle innerhalb der NASA.

In der Kunstwelt bezieht sich Kuration auf die Auswahl, Organisation und Präsentation von Kunstwerken in einer Sammlung oder Ausstellung. Kuration kann sich ebenfalls auf die Organisation von Online-Inhalten oder -Informationen beziehen. In diesem Zusammenhang wurde die Kuratierung von Inhalten als „der Vorgang des Entdeckens, Sammelns und Präsentierens digitaler Inhalte rund um ein bestimmtes Thema“ beschrieben. Wir bauen auf dieser und anderen Definitionen auf, um die Kuratierung wissenschaftlicher Inhalte so zu definieren, dass sie maßgebliche Experten einbezieht, die kontextbezogene Details identifizieren, sammeln, validieren, synthetisieren, organisieren und präsentieren, die für die effektive Entdeckung, das Verständnis und die effektive Nutzung wissenschaftlicher Daten und Kenntnisse erforderlich sind [z. B. Rotman et al ., 2012].

Im Wesentlichen ist die Kuratierung wissenschaftlicher Inhalte eine wertschöpfende Anstrengung. Dazu gehören alle Aktivitäten oder Prozesse, die den Fortschritt hin zu umsetzbarer Wissenschaft beschleunigen oder es unterschiedlichen Zielgruppen erleichtern, wissenschaftliche Informationen zu verarbeiten. Der Umfang dieser Kuration beschränkt sich nicht nur auf Daten und Veröffentlichungen, sondern umfasst auch detaillierte Kontextinformationen aus Quellen, die im Laufe der Zeit häufig nicht gut erhalten sind. Zu diesen Quellen können graue Literatur gehören, die außerhalb traditioneller Kanäle (z. B. Fachzeitschriften) verfügbar gemacht wird, sowie Tabellen, Abbildungen, Diagramme mit wichtigen Informationen, Personallisten, Blogs aus vertrauenswürdigen Quellen und andere nicht überprüfte Inhalte.

Eine effektive Kuratierung wissenschaftlicher Inhalte wird von Fachexperten geleitet, die relevante und zuverlässige Informationen zu bestimmten Themen validieren und synthetisieren. Diese Experten verwenden eine strukturierte Methodik, um die Forschungsaktivitäten für Daten- und Informationssuchende zu optimieren. Dieser Prozess fördert das Vertrauen der Nutzer in die kuratierten Inhalte, da sie verstehen, dass vertrauenswürdige Personen oder Teams dafür verantwortlich sind.

Die schiere Menge an Informationen kann jeden verwirren und verwirren, insbesondere diejenigen, die neu in der Forschung sind oder sich mit einer neuen Disziplin befassen.

Mit der kontinuierlichen Ausweitung wissenschaftlicher Inhalte, technologischen Fortschritten und politischen Maßnahmen, die zunehmend offene Wissenschaft begünstigen, stehen Forschern mehr Daten und Informationen zur Verfügung als je zuvor. Die schiere Menge an Informationen kann jeden verwirren und verwirren, insbesondere diejenigen, die neu in der Forschung sind oder sich mit einer neuen Disziplin befassen. Leider verkompliziert die Verbreitung räuberischer Verlage, Scheingesellschaften und Scheinkonferenzen die Informationslandschaft, indem sie es einfacher macht, maßgeblich wirkendes, aber letztendlich unzuverlässiges Material zu verbreiten.

Erhalten Sie jeden Freitag die faszinierendsten Wissenschaftsnachrichten der Woche in Ihrem Posteingang.

Es erfordert viel Geschick, die Masse an Inhalten zu durchsuchen, um verlässliche, authentische und zuverlässige Daten und Informationen zu extrahieren – ein entscheidender erster Schritt zur Beantwortung jeder wissenschaftlichen Frage. Dieser Aufwand kann langwierig und mühsam sein. Forscher wiederholen häufig Informationsbeschaffungsbemühungen, die andere vor ihnen durchgeführt haben, und lenken so Zeit und Aufmerksamkeit von anderen wichtigen Forschungsaufgaben ab. Durch den Prozess der Identifizierung und Bereitstellung relevanter Kontexte zu Daten und Informationen hilft die Kuratierung wissenschaftlicher Inhalte den Benutzern, sich in dieser riesigen Landschaft zurechtzufinden, und ermöglicht eine effizientere wissenschaftliche Entdeckung durch die Rationalisierung der ersten Forschungsschritte.

Modelle für eine erfolgreiche Kuratierung wissenschaftlicher Inhalte finden sich in allen Wissenschaften. Gute Beispiele sind das Astrophysics Data System des Smithsonian Astrophysical Observatory und die Encyclopedia of Life des National Museum of Natural History. Mittlerweile bieten zwei laufende NASA-Projekte, der Catalogue of Archived Suborbital Earth Science Investigations (CASEI) und die Science Discovery Engine (SDE), Modellanwendungsfälle für die Kuratierung wissenschaftlicher Inhalte in den Erd- und Weltraumwissenschaften. Diese Bemühungen wurden jeweils entwickelt, um den Bedürfnissen bestimmter Gemeinschaften gerecht zu werden, und in der Praxis fördern sie die Entdeckung von NASA-Daten und -Informationen in einer Reihe von Disziplinen.

Seit September 2018 erstellt die Airborne Data Management Group (ADMG) der NASA CASEI, ein wissenschaftlich kuratiertes Inventar mit mehr als einem halben Jahrhundert erdwissenschaftlicher Beobachtungen der NASA aus Luft- und Feldkampagnen (d. h. suborbitalen) zur Verbesserung bestehender Informationssuchfunktionen . Diese Beobachtungen haben das Potenzial, neue wissenschaftliche Untersuchungen zu unterstützen, die über die Fragen hinausgehen, zu deren Beantwortung die Daten ursprünglich gesammelt wurden. Datennutzer haben jedoch berichtet, dass diese Beobachtungen schwer zu entdecken, zugänglich und zu nutzen sind, da Luft- und Felduntersuchungsdaten in einer Vielzahl von Formaten, Koordinatensystemen und räumlich-zeitlichen Auflösungen aufgezeichnet werden und verschiedene Datenarchivierungsprozesse, Metadaten und komplexe Verfahren zum Einsatz kommen motivierende und situative Details [Earth Science Data Systems, 2018; Smith et al., 2020]. Darüber hinaus werden Luft- und Felddaten in einem verteilten Netzwerk von Datenzentren gespeichert, die sich jeweils auf unterschiedliche thematische Studienthemen konzentrieren und unterschiedliche Ansätze zur Datenverwaltung verwenden. Diese Faktoren verstärken sich und führen zu einem inkonsistenten und umständlichen Entdeckungsprozess.

CASEI verfügt über eine benutzerfreundliche Anwendungsprogrammierschnittstelle, die es Benutzern ermöglicht, Datenbankinhalte einfach zu durchsuchen, zu durchsuchen und zu filtern, und basiert auf einem Metadatenmodell, das auf den Bedürfnissen der Benutzergemeinschaft basiert. Das CASEI-Modell umfasst wesentlich mehr Metadateninhalte, als normalerweise für Datenprodukte gesammelt werden, die dem Metadatenregister hinter Earthdata Search der NASA hinzugefügt werden, dem primären Tool für die Suche nach erdwissenschaftlichen Daten der NASA. Der zusätzliche CASEI-Metadateninhalt umfasst Untersuchungsregionen, Beschreibungen wichtiger Ereignisse, vertikale Beobachtungsregionen, Oberflächentypen und andere Details, die es Benutzern ermöglichen, schnell auf Teilmengen des gesamten Datensatzes abzuzielen oder Informationen und Daten über mehrere Kampagnen hinweg in Beziehung zu setzen. Stellen Sie sich zum Beispiel vor, dass Forscher daran interessiert sind, die Auswirkungen von Aerosolen und chemischen Spezies auf die Wolkenentwicklung speziell in Küstenregionen zu untersuchen. Metadaten in CASEI erleichtern die Identifizierung vorhandener Kampagnen, bei denen Aerosol-, Chemie- und Wolkenbeobachtungen über Küstenregionen gesammelt wurden.

CASEI hostet oder archiviert keine Datenprodukte, sondern dient vielmehr als Kurationsdienst, indem es Benutzer direkt auf Daten verweist, die in verschiedenen Rechenzentren der NASA (sogenannte Distributed Active Archive Centers oder DAACs) gespeichert sind. Die Kuratierung für CASEI wird von ADMG-Teammitgliedern durchgeführt, die in den technischen Aspekten der CASEI-Kuratierung geschult sind und die Heterogenität und Komplexität von Luft- und Felddaten verstehen. Der Kurationsprozess beginnt mit einer Untersuchung maßgeblicher Daten- und Informationsquellen wie peer-reviewter wissenschaftlicher Literatur, Erfahrungsberichten, Zusammenfassungen von Kampagnenveranstaltungen und Instrumentenbetriebstabellen. Diese Überprüfung hilft Teammitgliedern beim Sammeln, Validieren und Synthetisieren kritischer kontextueller Metadaten im Zusammenhang mit Datensätzen, die den Nutzen von Beobachtungen erweitern und das zukünftige wissenschaftliche Verständnis durch geeignete Datennutzung in neuen Analysen unterstützen können.

Die für die Organisation und Bezugnahme auf Luft- und Feldkampagnen verwendeten Begriffe variieren je nach Disziplin und im Laufe der Zeit. Um das CASEI-Inventar zu erstellen, müssen Kuratoren herausfinden, wie sie die vorhandenen Kampagneninformationen in das Metadatenmodell des Katalogs integrieren können. Kuratoren verwenden objektive Entscheidungsbäume, um sicherzustellen, dass sie konsistente Entscheidungen bei der Übersetzung vorhandener verwendeter Informationen in die CASEI-Definitionen und das Metadatenmodell treffen [Wingo und Smith, 2023]. Drei Kuratoren überprüfen dann alle Metadaten vollständig, bevor der Inhalt in der CASEI-Datenbank veröffentlicht wird.

Um die Genauigkeit der Inhalte im Laufe der Zeit aufrechtzuerhalten, führen Kuratoren vierteljährliche Datenbankaktualisierungen durch. Zu diesen Aktualisierungen gehören die Einhaltung standardisierter wissenschaftlicher Schlüsselwörter, das Hinzufügen neuer Datenprodukte für aktive Kampagnen und das Einfügen von URLs zu neuen, von Experten geprüften Veröffentlichungen. Aktualisierungen der CASEI-Benutzeroberfläche sowie zusätzliche Funktionen und Fähigkeiten werden ebenfalls auf der Grundlage des Benutzerfeedbacks entwickelt. Beispielsweise arbeiten Entwickler derzeit daran, Karten hinzuzufügen, die stationäre Bahnsteigstandorte und bewegliche Bahnsteiggleise enthalten.

Bisher haben Benutzer auf der ganzen Welt die Beta-CASEI-Schnittstelle verwendet. Der Katalog erscheint offiziell im Juli 2023.

Das Science Mission Directorate (SMD) der NASA umfasst Studien in fünf großen Themenbereichen: Astrophysik, biologische und physikalische Wissenschaften, Geowissenschaften, Heliophysik und Planetenwissenschaften. Unter dem Dach von SMD gibt es eine große Vielfalt an Daten, Dokumenten, Bildern, Modellen, Tools, Software und Code zu diesen Themen, die jedoch über zahlreiche Archive, Repositories und Websites verstreut sind, was die Daten- und Informationsermittlung zu einer Herausforderung macht.

Ab Anfang 2022 entwickelte die Open-Source Science Initiative der NASA SDE, um die Ziele der Agentur zu unterstützen, die Verfügbarkeit, Auffindbarkeit und Zugänglichkeit offener, interdisziplinärer Informationen zu erhöhen. SDE bietet einen zentralen Zugangspunkt für kuratierte Daten und Ressourcen aus den fünf Themenbereichen von SMD. Flexible Filteroptionen – die derzeit Plattformen, Instrumente und Missionen umfassen und um weitere Schlüsselkonzepte erweitert werden – bieten eine Organisationsebene und helfen Benutzern, SDE-Inhalte effektiver zu erkunden. Mit SDE könnte ein Benutzer, der nach Informationen über Galaxien sucht, beispielsweise Ressourcen nach bestimmten Plattformen filtern, etwa den Weltraumteleskopen Hubble und James Webb.

Die Kuratierung für die Science Discovery Engine beinhaltet die Zusammenarbeit mit Fachexperten, um kontextbezogenes Wissen zu identifizieren und hinzuzufügen.

Der Kurationsprozess für SDE umfasst die Zusammenarbeit mit Fachexperten, um relevante Tools, Dokumente, Daten- und Bildmetadatenarchive, Code-Repositories und Software, die an vorhandenen, aber verstreuten Standorten verfügbar sind, mit kontextbezogenem Wissen zu identifizieren und hinzuzufügen. Diese Aufgabe ist aufgrund der schieren Menge an Informationen herausfordernd und zeitaufwändig und da Daten und Informationen manchmal auf mehreren Websites dupliziert werden, Websites nicht gepflegt werden und Weblinks defekt sind.

Die Inhaltskuratierung bei SDE ist im Gange, da weitere Daten und Ressourcen identifiziert und integriert werden. Darüber hinaus kuratiert das SDE-Team die Suchbegriffslisten innerhalb jeder Filteroption. Es ist ein erheblicher Aufwand erforderlich, um die Begriffsliste für jeden Filter zu erstellen und zu pflegen, der vorhandene Begriffe aus den wissenschaftlichen Themenbereichen von SMD zusammenfasst, aber der Kontext, den diese Filter bieten, ist für neue Benutzer von unschätzbarem Wert.

Die Beta-SDE, die regelmäßig wächst, wenn weitere Inhalte hinzugefügt werden, wurde auf der AGU-Herbsttagung 2022 in Chicago veröffentlicht und enthält derzeit mehr als 700.000 durchsuchbare Dokumente, darunter 84.000 Metadatensätze zu Daten.

Die Kuratierung wissenschaftlicher Inhalte funktioniert am besten als lebendige Aktivität, die im Laufe der Zeit wiederholt wird (Abbildung 1). Der Zyklus beginnt mit der Identifizierung eines Bedarfs oder Anwendungsfalls aus der Community. Der Anwendungsfall beleuchtet Trends, Diskussionsthemen oder Wissenslücken und ist für die Definition des Umfangs einer Kurationsbemühungen von wesentlicher Bedeutung. Beispielsweise wurde die Schaffung von SDE durch den erkannten Bedarf vorangetrieben, die Entdeckung der offenen wissenschaftlichen Daten und Informationen der NASA zu erleichtern und interdisziplinäre Wissenschaft zu ermöglichen.

Sobald der Anwendungsfall definiert ist, werden menschliche Fachexperten und/oder Techniken der künstlichen Intelligenz (KI) eingesetzt, um verwandte Daten und Informationen zu identifizieren und einen Mehrwert für Benutzer zu schaffen, indem nur die relevantesten Inhalte ausgewählt werden. Durch effektive Organisation, Annotation, Visualisierung und Destillation von Informationen in verständlichere Formate werden diesem Inhalt weitere Werte und Kenntnisse hinzugefügt [Dale, 2014].

Eine kuratierte Sammlung wird dann mit der Benutzergemeinschaft geteilt – über integrierte Suchplattformen, Webseiten, Online-Lernumgebungen oder Crowdsourcing-Wissenschaftsportale –, um das Verständnis und den Zugriff auf die Informationen zu verbessern. Das Feedback der Community treibt die Erstellung zusätzlicher Inhalte voran und beginnt den Kurationszyklus erneut.

Es besteht ein empfindliches Gleichgewicht zwischen dem wissenschaftlichen Wert, der durch die Pflege kuratierter Inhalte erzielt wird, und den Kosten dafür.

Die Wartung ist unerlässlich, um sicherzustellen, dass eine Sammlung auf dem neuesten Stand bleibt und der Gemeinschaft weiterhin einen Mehrwert bietet. Es besteht jedoch ein empfindliches Gleichgewicht zwischen dem wissenschaftlichen Wert, der durch die Pflege kuratierter Inhalte erzielt wird, und den Kosten dafür. Einerseits stellt eine kuratierte Sammlung eine fokussierte Quelle verlässlichen Wissens und einen erheblichen Zeit- und Arbeitsaufwand dar, der anerkannt, geschätzt und gefördert werden sollte. Die Sicherstellung der Langlebigkeit der Sammlungen sowie die Möglichkeit, sie zu zitieren, trägt zur Anerkennung der Beiträge der Kuratoren bei und sorgt für Transparenz und Vertrauen für die Nutzer.

Andererseits können die mit der unbegrenzten Aufrechterhaltung einer kuratierten Sammlung verbundenen Kosten, zu denen auch die Kosten für die erforderliche Infrastruktur und der zusätzliche Aufwand gehören, um eine Sammlung aktuell und relevant zu halten, potenziell untragbar werden. Beispielsweise haben die Administratoren der Climate Data Initiative (CDI) [Ramachandran et al., 2016], einer kuratierten Sammlung von Daten der Bundesregierung, die für Fragen des Klimawandels relevant sind, seit 2016 Schwierigkeiten, die Sammlung mit der minimalen Unterstützung, die sie erhalten, aufrechtzuerhalten. CDI kuratierte ursprünglich mehr als 700 Datensätze, verwaltet aber mittlerweile nur noch 570.

Viele Fragen fließen in die Überlegungen ein, ob und wie lange kuratierte Ressourcen aufbewahrt werden sollen. Welche Verpflichtungen müssen eingegangen werden, um sie zu erhalten? Werden Entscheidungen allein durch Kennzahlen getroffen – und wenn ja, welche Kennzahlen – oder müssen andere Faktoren abgewogen werden? Und wie kann der Informationsbedarf der Gemeinschaft am effizientesten und mit möglicherweise begrenzter Unterstützung gedeckt werden?

Die Kuratierung wissenschaftlicher Inhalte kann viele Formen annehmen, darunter die folgenden:

Angesichts des exponentiellen Wachstums der Informationsverfügbarkeit sowie der wachsenden Bestrebungen, die Transparenz und den gleichberechtigten Zugang zu wissenschaftlichen Ergebnissen zu verbessern, wird die Kuratierung wissenschaftlicher Inhalte in all ihren Formen immer wichtiger. Es ist für einen einzelnen Menschen nicht mehr möglich, die riesigen Mengen an verfügbaren Informationen zu einem Thema effektiv zu durchsuchen und zu bewerten. Neue Kurationsansätze werden identifiziert und genutzt, da modernste Technologien entwickelt werden und sich immer mehr, manchmal unterversorgte, Gemeinschaften wissenschaftlichen Bemühungen anschließen. Diese neuen Ansätze tragen dazu bei, die Kurationsbemühungen zu verstärken, um mit dem Inhaltswachstum und der Nachfrage nach einem schnellen offenen Zugang zu Daten und Informationen Schritt zu halten.

In jüngster Zeit haben sich KI, maschinelles Lernen und die Verarbeitung natürlicher Sprache (NLP) als vielversprechend erwiesen. Beispiele hierfür sind der Einsatz von NLP zur Verbesserung von Genanmerkungen und Text-Mining-Techniken zur Kuratierung biomedizinischer Forschung [Ohyanagi et al., 2015; Alex et al., 2008]. Damit KI jedoch effektiv ist, muss sie zusammen mit menschlichem Fachwissen eingesetzt werden, um KI-Algorithmen zu trainieren und ihre Ergebnisse zu validieren.

Die Wissenschafts- und Datenverwaltungsgemeinschaften müssen der Kuratierung wissenschaftlicher Inhalte Priorität einräumen, was bedeutet, die Bemühungen der Mitwirkenden anzuerkennen und zu belohnen, den Prozess zu würdigen und die Ergebnisse zu bewahren.

Es ist eine Herausforderung sicherzustellen, dass dieses menschliche Fachwissen verfügbar ist. Wissenschaftler sehen sich bereits mit steigenden Anforderungen an ihre Zeit konfrontiert, darunter der Wettbewerb um immer wettbewerbsintensivere und eingeschränktere finanzielle Unterstützung und die Erfüllung der Erwartungen an schnellere, offenere wissenschaftliche Ergebnisse. Die Teilnahme an der Kuration als Fachexperte erhöht nur die bestehende Verantwortung. Wie können wir also weiterhin Wissenschaftler in diese Arbeit einbeziehen?

Zunächst einmal müssen die Wissenschafts- und Datenverwaltungsgemeinschaften der Kuratierung wissenschaftlicher Inhalte Priorität einräumen, was bedeutet, die Bemühungen der Mitwirkenden anzuerkennen und zu belohnen, den Prozess zu würdigen und die Ergebnisse zu bewahren. Um dies zu erreichen, muss die Datenverwaltungsgemeinschaft über die bloße Archivierung von Daten hinausgehen und sich stattdessen auf die Bereitstellung verbesserter Dienste für Benutzergemeinschaften konzentrieren. Dazu gehört eine grundlegende Änderung unserer Arbeitsweise und der Besetzung von Repositorien sowie der Zusammenarbeit von Technologen und Wissenschaftlern. Darüber hinaus sollten Institutionen erwarten, dass Förderanträge in wissenschaftlichen Anträgen wesentliche Aktivitäten der Kuratierung wissenschaftlicher Inhalte ermöglichen. Schließlich ist eine Methode erforderlich, um die Arbeit von Kuratoren wissenschaftlicher Inhalte anzuerkennen – möglicherweise ähnlich den Ansätzen für die Anrechnung der Arbeit, die in die Erstellung von Datensätzen einfließt.

Durch solche Bemühungen können wir die langfristige Nachhaltigkeit gut organisierter, kuratierter wissenschaftlicher Repositorien verbessern, die dazu beitragen, die riesige Informationslandschaft zu verstehen, einen gerechteren Zugang zu Informationen zu ermöglichen und die interdisziplinäre Arbeit zu fördern, die zur Bewältigung vieler Herausforderungen der Welt erforderlich ist Heute. Wir können auch sicherstellen, dass wertvolle, hart erkämpfte Daten und Informationen nicht wie die Arche in Raiders im Dunkeln verstauben und der Zeit verloren gehen.

Alex, B., et al. (2008), Automating Curation using a Natural Language Processing Pipeline, Genome Biol., 9, suppl. 2, S10, https://doi.org/10.1186/gb-2008-9-s2-s10.

Dale, S. (2014), Inhaltskuration: Die Zukunft der Relevanz, Bus. Inf. Rev., 31(4), 199–205, https://doi.org/10.1177/0266382114564267.

Earth Science Data Systems (2018), Management luftgestützter Datenprodukte: Herausforderungen und Empfehlungen, Version: 27. Februar 2018, NASA, Washington, DC

Ohyanagi, H., et al. (2015), Plant Omics Data Center: Ein integriertes Web-Repository für Interspezies-Genexpressionsnetzwerke mit NLP-basierter Kuration, Plant Cell Physiol., 56(1), e9, https://doi.org/10.1093/pcp/pcu188.

Ramachandran, R., et al. (2016), Klimadateninitiative: Eine Geokurationsmaßnahme zur Unterstützung der Klimaresilienz, Comput. Geosci., 88, 22–29, https://doi.org/10.1016/j.cageo.2015.12.002.

Ramasubramanian, M., et al. (2020), ES2Vec: Schlüsselwortzuweisung für geowissenschaftliche Metadaten mithilfe domänenspezifischer Worteinbettungen, in 2020 SoutheastCon, S. 1–6, Inst. von Elektr. und Elektron. Eng., Piscataway, NJ, https://doi.org/10.1109/SoutheastCon44009.2020.9249743.

Rotman, D., et al. (2012), Supporting Content Curation Communities: The case of the Encyclopedia of Life, J. Am. Soc. Inf. Wissenschaft. Technol., 63, 1.092–1.107, https://doi.org/10.1002/asi.22633.

Smith, DK, et al. (2020), Aufbau eines luftgestützten Dateninventars zur Verbesserung der Auffindbarkeit und des Zugriffs auf Daten, Vortrag auf der AMS-Jahrestagung 2020, virtuell, Am. Meteorol. Soc., ntrs.nasa.gov/citations/20200000477.

Wingo, SM und D. Smith (2023), ADMG CASEI Inventory Terms Definitions, NASA Earth Sci. Daten und Informationen Syst. Stand. Koordin. Aus., https://doi.org/10.5067/DOC/ESCO/ESDS-RFC-047v1.

Kaylin Bugbee ([email protected]), NASA Marshall Space Flight Center, Huntsville, Alabama; und Deborah Smith, Stephanie Wingo und Emily Foshee, University of Alabama in Huntsville

Zitat: 2022. Die Autoren. CC BY 3.0