Skip to content

Latest commit

 

History

History
36 lines (21 loc) · 3.51 KB

README.v1.md

File metadata and controls

36 lines (21 loc) · 3.51 KB

Darwin Core Archive to JSON - Flora e Funga do Brasil

Eduardo Dalcin e Henrique Pinheiro


Motivação e Justificativa

A Flora e Funga do Brasil é uma base de dados de referência nacional para a biodiversidade de plantas e fungos. Além da interface de acesso aos dados, o acesso pode ser feito via web services e parte dos dados podem ser "baixados" no formato Darwin Core Archive (DwC-A), através do recurso disponível no IPT institucional.

Entretanto, a estrutrura relacional do formato DwC-A exige do {usuário, analista, cientista de dados, pesquisador etc} um esforço adicional para relacionar e integrar as diferentes tabelas para gerar a informação necessária.

Em essência, o formato DwC-A é um formato de transferência de dados entre aplicações. Porém, altamente específico para o domínio da biodiversidade, em especial, para atender a demanda por agregação de dados de provedores na base de dados do GBIF.

Por outro lado, formato JSON é uma forma de armazenar e transferir dados, sob a forma de documentos, que se tornou muito popular com as aplicações baseadas na web. Em resumo, o formato JSON:

  • É uma formatação leve e compacto de troca de dados;
  • Para seres humanos, é fácil de ler e escrever;
  • Para máquinas, é fácil de interpretar e gerar;
  • É um padrão aberto independente de linguagem;
  • Utiliza texto legível a humanos, no formato atributo-valor, de natureza auto-descritiva.

Além disto a base de dados da Flora e Funga do Brasil possui hoje mais de 135.000 nomes científicos e o produto cartesiano das relações entre todas as tabelas gera um conjunto de registros significativo para a manipulação visando análise para geração de informação relevante.

Com esta aplicação, é possível importar o conjunto de dados da Flora e Funga do Brasil, disponível no formato DwC-A, para um sistema gerenciador de bancos de dados orientado à documentos, como o MongoDB, por exemplo, e realizar consultas e definir filtros de forma mais simples, para o {usuário, analista, cientista de dados, pesquisador etc} sem maiores conhecimentos técnicos e de SQL, e sem o custo computacional gerado pelas "JOINs".

Por fim, a importância do conjunto de dados da Flora e Funga do Brasil para a conservação e uso sustentável e socielmente justo da biodiversidade brasileira requer que sua disponibilidade e facilidade de uso seja sempre ampliada e potencializada pela oferta do seu conjunto de dados em diferentes formatos, para que possa causar o maior impacto possível na tomada de decisão e na formulação de políticas públicas relacionadas com a biodiversidade vegetal brasileira.

Objetivo

  • Criar uma ferramenta livre, gratuita e de código que ofereça os dados publicados pela Flora e Funga do Brasil em formato Darwin Core Archive no IPT, em formato JSON
  • Oferecer a ferramenta em um Docker, onde o usuário pode instalar em sua máquina local ou em um servidor