Publicando dados na web de dados

um relato de experiência na automatização dos processos de extração, transformação e carga de dados abertos provenientes do Portal DADOS.GOV.BR

  • Sandro Rautenberg Universidade Estadual do Centro-Oeste
  • Alessandra Cassiana Burda Universidade Estadual do Centro-Oeste
  • Lucélia Souza Universidade Estadual do Centro-Oeste
  • Josiane Michalak Hauagge Dall’Agnol Universidade Estadual do Centro-Oeste
  • Gisane Michelon Universidade Estadual do Centro-Oeste
  • Tony Alexander Hild Universidade Estadual do Centro-Oeste
Palavras-chave: Informação governamental, Web semântica, Armazenamento de dados

Resumo

Em face ao grande volume de dados disponível na web, estudar as formas de preservar este volume é uma tarefa cada vez mais importante. Parte dos dados disponíveis são classificados como Dados Abertos e são disponibilizados pelos órgãos governamentais (vide o portal dados.gov.br). Esse tipo de dado tem despertado interesse para o uso em assuntos estratégicos, públicos ou privados. Neste contexto, este trabalho visa estabelecer um workflow para a extração de dados abertos governamentais, a transformação dos dados em dados abertos conectados e a carga dos dados transformados na Web de Dados, de acordo com os princípios Linked Data (Dados Conectados). Para tanto, utiliza-se como alicerce metodológico o ciclo de vida Linked Data Lifecycle e suas ferramentas. Em estudos de casos, são publicados quatro conjuntos de Dados Abertos Governamentais Conectados, os quais são originalmente provenientes do portal dados.gov.br. Com os estudos, computacionalmente, define-se um processo para a passagem dos Dados Abertos Governamentais da 3ª para 5ª Estrela, segundo a classificação de abertura de dados proposta por Tim Bernes-Lee. Como resultado desses experimentos, estabelece-se um processo automatizado como base a uma infraestrutura informacional a ser utilizada, futuramente, em um ecossistema para cidades de pequeno ou de médio porte.

Downloads

Não há dados estatísticos.

Biografia do Autor

Sandro Rautenberg, Universidade Estadual do Centro-Oeste

Bacharel em Ciências da Computação pela Fundação Universidade Regional de Blumenau (1996), mestre em Engenharia de Produção pela Universidade Federal de Santa Catarina (1998) e doutor em Engenharia do Conhecimento pela Universidade Federal de Santa Catarina (2009). Realizou seu estágio pós-doutoral na Universidade de Leipzig - Alemanha, com ênfase no desenvolvimento Ontologias para Linked Open Data (Projeto de pesquisa com apoio da CAPES - Processo BEX no 18228/12-7). É professor não-titular da Universidade Estadual do Centro-Oeste (UNICENTRO) do Bacharelado em Ciência da Computação e do Mestrado Profissional em Administração (PPGADM). Tem experiência na área de Ciência da Computação, com ênfase em Inteligência Computacional e Web Semântica, atuando principalmente nos seguintes temas: Ontologias, Sistemas Imunológicos Artificiais, Redes Neurais Artificiais, Linked Data e Linked Open Data.

Alessandra Cassiana Burda, Universidade Estadual do Centro-Oeste

Acadêmica do curso de Ciência da Computação na Universidade Estadual do Centro Oeste do Paraná

Tony Alexander Hild, Universidade Estadual do Centro-Oeste

Bacharel em Análise de Sistemas (2001) pela Universidade Estadual do Centro-Oeste (UNICENTRO), Bacharel em Administração de Empresas (2007) pela mesma universidade, Especialista em Engenharia de Software com Ênfase em Software Livre (2009) pela Universidade Federal de Lavras (UFLA), Mestre em Informática (2012) pela Universidade Federal do Paraná (UFPR). Atualmente é Professor Assistente e Pesquisador em computação de alto desempenho, processamento de imagens e sistemas embarcados do Departamento de Ciência da Computação da UNICENTRO.

Referências

-STAR. 5-Star OPEN DATA. 2012. Disponível em: <http://5stardata.info/en/>. Acesso em: 10 de maio 2017.

AUER, S. Introduction to lod2. In: Linked Open Data – Creating Knowledge Out of Interlinked Data. AUER, S.; BRYL, V.; TRAMP, C (Ed.). Lecture Notes in Computer Science. Springer-Verlag, 2014.

AUER, S.; BÜHMANN, L.; DIRSCHL, C.; ERLING, O.; HAUSENBLAS, M.; ISELE, R.; LEHMANN, J.; MARTIN, M.; MENDES, P. N.; VAN NUFFELEN, B.; STADLER, C.; TRAMP, S.; WILLIAMS, H. Managing the Life-Cycle of Linked Data with the LOD2 Stack. In: The Semantic Web – ISWC 2012. Cudré-Mauroux P. et al. (Ed.). Lecture Notes in Computer Science, v. 7650. Springer, Berlin, Heidelberg, 2012.

BIZER, C., HEATH, T.; BERNERS-LEE, T. Linked data - the story so far. In: International Jour-nal of Semantic Web and Information Systems, v. 5, n. 1, p. 1–22, 2009.

BRASIL. Lei nº 12.527, de 18 de novembro de 2011. Regula o acesso a informações previsto no inciso XXXIII do art. 5o, no inciso II do § 3o do art. 37 e no § 2o do art. 216 da Constituição Federal; altera a Lei no 8.112, de 11 de dezembro de 1990; revoga a Lei no 11.111, de 5 de maio de 2005, e dispositivos da Lei no 8.159, de 8 de janeiro de 1991; e dá outras providên-cias. Diário Oficial da República Federativa do Brasil, Brasília, DF, 18 nov. 2011. Disponível em: <http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/l12527.htm>. Acesso em: 15 maio 2017.

DCMI. DCMI Metadata Terms. Disponível em: <http://dublincore.org/documents/dcmi-terms/>. Acesso em: 27 maio 2014.

ISOTANI, S.; BITTENCOURT, I. I. Dados Abertos Conectados: Em busca da Web do Conhe-cimento. Novatec, 2015.

LEBO, T.; ERICKSON, J. S.; DING, L.; GRAVES, A.; WILLIAMS, G. T.; DIFRANZO, D.; LI, X.; MICHAELIS, J.; ZHENG, J. G.; FLORES, J.; SHANGGUAN, Z.; MCGUINNESS, D. L.; HENDLER, J. Producing and Using Linked Open Government Data in the TWC LOGD Portal. In: Linking Government Data. WOOD, D (Ed.). Springer-Verlag, 2011.

MODEL. Model for Tabular Data and Metadata on the Web: W3C Recommendation 17 December 2015. Disponível em: <https://www.w3.org/TR/tabular-data-model/>. Acesso em: 13 maio 2017.

OPEN KNOWLEDGE INTERNATIONAL. O que são Dados Abertos? Disponível em: <http://opendatahandbook.org/guide/pt_BR/what-is-open-data/>. Acesso em: 14 maio 2017.

PORTAL. Portal Brasileiro de Dados Abertos. Disponível em: <http://dados.gov.br/>. Acesso em: 16 Abril 2017.

PINHEIRO, L. V. R.; FERREZ, H. D. Tesauro Brasileiro de Ciência da Informação. Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict), 2014.

SCOVO. The Statistical Core Vocabulary (SCOVO) | DERI Vocabularies. Disponível em: <http://vocab.deri.ie/scovo>. Acesso em: 16 abril 2017.

SPARQLIFY. Sparqlify - Agile Knowledge Engineering and Semantic Web (AKSW). Disponí-vel em: <http://aksw.org/Projects/Sparqlify.html>. Acesso em: 15 maio 2017.

TRIBUNAL DE CONTAS DA UNIÃO. 5 motivos para a abertura de dados na Administração Pública. Disponível em: <http://portal.tcu.gov.br/biblioteca-digital/cinco-motivos-para-a-abertura-de-dados-na-administracao-publica.htm>. Acesso em: 26 maio 2017.

VIRTUOSO. OpenLink Virtuoso Home Page. Disponível em: <https://virtuoso.openlinksw.com/>. Acesso em: 15 Maio 2017.

WOOD, D. Linking Government Data. Springer-Verlag, 2011.

Publicado
2018-06-04
Como Citar
Rautenberg, S., Burda, A., Souza, L., Dall’Agnol, J., Michelon, G., & Hild, T. (2018). Publicando dados na web de dados. Tendências Da Pesquisa Brasileira Em Ciência Da Informação, 10(2), 1-16. Recuperado de http://ejournal.space/tpbci/index.php/tpbci/article/view/77
Seção
Artigos

Artigos mais lidos pelo mesmo (s) autor (es)