Base de Dados
Científicos

  • Login
View Item 
  •   DSpace Home
  • Base de Dados Científicos
  • Dados
  • View Item
  •   DSpace Home
  • Base de Dados Científicos
  • Dados
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Scripts e metadados para auditoria de perda semântica em crosswalk de Metadados

Thumbnail
View/Open
gbif_50_full_metadata.json (561.2Kb)
redape_embrapa_50_datacite.json (484.3Kb)
ufscar_50_full_metadata.json (181.6Kb)
gbif_collection.py (3.314Kb)
redape_embrapa_coleta.py (5.659Kb)
ufscar_full_metadata.py (6.293Kb)
analise_sensibilidade.csv (5.759Kb)
auditoria_3_repositorios.csv (11.05Kb)
algoritmo_perda_semantica.py (2.994Kb)
analise_sensibilidade.py (2.002Kb)
auditor_tuplas.py (2.800Kb)
README.txt (6.007Kb)
dicionario_governanca.json (16.23Kb)
dicionario_governanca.csv (6.689Kb)
README dicionário governança (6.566Kb)
Date
2026-05-13
Author
Lima, Karolayne Costa Rodrigues de
Sunye, Marcos Sfair
Metadata
Show full item record
Subject
Metadados
Perda semântica
Crosswalk metadados
Dados científicos
Validade semântica
xmlui.dri2xhtml.METS-1.0.item-type
Dataset
Abstract
Este conjunto de dados reúne os scripts de coleta, os metadados brutos e os resultados tabulares que fundamentam o artigo "A armadilha da validade artificial: auditoria da perda semântica no crosswalk de metadados". O estudo propõe um framework para avaliação de interoperabilidade semântica em crosswalks de metadados, operacionalizado pela tupla ⟨S, T, C, V⟩ (Semântica, Tipo, Cardinalidade, Valor) e pela Métrica de Lossiness Ponderada (Lw), que quantifica a degradação informacional entre esquemas de origem e destino de forma independente da conformidade estrutural. Foram coletados 150 registros de metadados de três repositórios brasileiros: Repositório Institucional da UFSCar (Dublin Core, via OAI-PMH), GBIF (Darwin Core/EML, via API REST) e Redape/Embrapa (DataCite, via OAI-PMH), por meio de scripts Python, e avaliados em três cenários de crosswalk: UFSCar > DataCite (Cenário A, Lw médio = 22,75%), GBIF > Dublin Core (Cenário B, Lw médio = 51,15%) e GBIF >DataCite (Cenário C, Lw médio = 7,93%). Os resultados evidenciam que validade estrutural e fidelidade informacional são propriedades independentes: no Cenário B, todos os 50 registros foram validados com sucesso (Val = 100%) enquanto apresentaram perda semântica de até 73,24%, fenômeno denominado Validade Artificial. O conjunto inclui os scripts de coleta e auditoria, os metadados brutos em JSON e as tabelas de resultados em CSV, permitindo a reprodução integral dos experimentos.
DOI: http://dx.doi.org/10.5380/bdc/108
Collections
  • Dados [76]

Biblioteca Central
Rua General Carneiro, nº 370/380.
Centro - Curitiba/PR
CEP: 80.060-150
DSpace software copyright © 2002-2018  DuraSpace
Contact Us | Send Feedback
Theme by Atmire
 

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsxmlui.ArtifactBrowser.Navigation.browse_typeThis CollectionBy Issue DateAuthorsTitlesSubjectsxmlui.ArtifactBrowser.Navigation.browse_type

My Account

Login

Statistics

View Usage Statistics

Biblioteca Central
Rua General Carneiro, nº 370/380.
Centro - Curitiba/PR
CEP: 80.060-150
DSpace software copyright © 2002-2018  DuraSpace
Contact Us | Send Feedback
Theme by Atmire