GBIF-Deutschland präsentiert das neue Virtuelle Herbarium Deutschland. Das Virtuelle Herbarium ist eine gemeinschaftliche Präsentation bedeutender Herbarien Deutschlands und basiert auf modernster GBIF-Technologie. Virtuell bedeutet, dass Menschen aus Forschung, Bildung, Umweltwissenschaften sowie interessierte Bürgerinnen und Bürger digitalisierte Pflanzenbelege bequem am Rechner untersuchen können ohne die weiten Wege in die einzelnen Herbarien auf sich nehmen zu müssen.
You are here
Projekte des Knotens Bakterien und Archaeen GBIF-Deutschland
Datenmobilisierung
Der Focus des Knotens GBIF-D Bakterien und Archaeen ist es, organismenbezogene prokaryontische Daten durch innovative Methoden der Datenmobilisierung zu erschließen. Der Umfang und die Dichte der verfügbaren Taxon-bezogenen Information soll dadurch wesentlich erhöht werden. Diese erweiterte Datenbasis wird völlig neuartige Biodiversitätsanalysen (Verbreitungsmuster, Vergleich Omics-basierter mit physiologischen Daten, Verbreitung von Abbaureaktionen oder Naturstoffsynthesen) ermöglichen.
Für Bakterien und Archaeen sind spezifische Informationen zu Habitaten und Biogeographie, Biochemie und Physiologie, sowie ausführliche Beschreibungen der Kultivierungsbedingungen in Verbindung mit den jeweiligen Resultaten aus Genom- und Metagenomanalysen bislang nur unzureichend digital verfügbar.
Sofern dazu relevante Informationen in schriftlicher Form vorhanden sind, wie z.B. Erstbeschreibungen oder jahrelang gewissenhaft protokollierte Beschreibungen von Lebendsammlungen, sind diese Wissensquellen zumeist weder zentral lokalisiert noch strukturiert durchsuchbar oder über das Internet abrufbar.
Mobilisierung von Schrift und Bildmaterial
In einem ersten Schritt wird das Material gesichtet und digitalisiert. Dabei stellt die Digitalisierung nur den ersten Schritt der Verarbeitung dar. Die nun digitalisierten Informationen werden durch Text und Data Mining Methoden in eine strukturierte und auswertbare Form überführt. Dabei wendet man Methoden des Text und Data Mining an. Diese umfassen unterschiedliche Analyseverfahren mit denen unstrukturierte Texte, Tabellen oder Zahlenwerte in eine strukturierte und durchsuchbare Form, also Datenbankinhalt überführt werden. Die Algorithmen, die hier Anwendung finden haben ihren Ursprung sowohl in dem Bereich der Sprach- und Computerlinguistik als auch der Statistik und des maschinellen Lernens. Die verarbeiteten Daten und Bilder werden den jeweiligen Taxa zugeordnet, inhaltlich und semantisch strukturiert, aufbereitet und schließlich öffentlich zur Verfügung gestellt werden.
[31.01.2012]