Resumo

O DCAT-BR é um perfil de aplicação do vocabulário Data Catalog Vocabulary (DCAT) para descrever catálogos, conjuntos de dados, distribuições, serviços de dados e metadados relacionados produzidos ou mantidos pelo setor público brasileiro e por entidades vinculadas. A especificação define classes, propriedades e boas práticas para promover a interoperabilidade semântica entre catálogos nacionais, federados e internacionais, bem como para apoiar iniciativas de open data e linked data.

Status deste documento

Esta é a primeira recomendação oficial da versão 1.0 do vocabulário DCAT-BR, elaborada pelo Grupo de Trabalho DCAT-BR. Futuras revisões seguirão o processo de governança de dados nacional, com participação de órgãos federais, estaduais, municipais e entidades vinculadas.

Comentários e propostas de alteração devem ser enviados por meio do repositório público indicado na seção de governança e manutenção.

Introdução

A disseminação de dados governamentais em múltiplas plataformas exige um vocabulário comum para descrição de metadados, de forma a viabilizar a descoberta, combinação e reuso de conjuntos de dados em escala nacional. O vocabulário DCAT, criado pelo W3C, fornece um modelo RDF para a descrição de catálogos de dados na Web, permitindo a interoperabilidade entre diferentes portais.

O DCAT-BR especializa o DCAT (versão 3), alinhando-o às necessidades do contexto brasileiro e às políticas de governança de dados e proteção de dados pessoais, como a Lei Geral de Proteção de Dados (LGPD). Ele estabelece um conjunto de classes, propriedades obrigatórias e opcionais, bem como vocabulários controlados, para descrever conjuntos de dados do setor público de forma padronizada.

O vocabulário também é projetado para ser utilizado por outros atores, como empresas, academia e organizações da sociedade civil, desde que observadas as regras de adesão ao ecossistema DCAT-BR.

Visão geral do DCAT-BR

Objetivos

Benefícios de uso

Escopo

O DCAT-BR aplica-se a conjuntos de dados geridos pelo setor público nas esferas federal, estadual, distrital e municipal, bem como por entidades vinculadas. O padrão pode ser utilizado por outros setores, desde que preservada a compatibilidade com as diretrizes nacionais de catalogação.

Governança e manutenção

O DCAT-BR é mantido com base na Política de Governança de Dados nacional. Alterações na especificação são discutidas no Grupo de Trabalho DCAT-BR e comunicadas publicamente, de modo a preservar a interoperabilidade entre implementações e a rede federada de catálogos.

O modelo de contribuição prevê:

  1. Registro de propostas de alteração em repositório público versionado.
  2. Análise técnica pelo Grupo de Trabalho DCAT-BR.
  3. Período de consulta pública, quando apropriado.
  4. Publicação de novas versões, acompanhadas de notas de versão, artefatos RDF e SHACL.

Conformidade

Esta seção é normativa.

Um catálogo, portal ou serviço declara conformidade com o DCAT-BR quando:

Modelo de informações do DCAT-BR

Classes principais

O DCAT-BR utiliza e especializa classes do DCAT v3 e de vocabulários relacionados, organizando o modelo em torno dos seguintes tipos de recursos:

Conjunto de Dados (dcat:Dataset)
Uma coleção de dados publicada ou curada por um único agente, disponível para acesso ou download em uma ou mais representações.
Recurso (dcat:Resource)
Recurso publicado ou curado por um único agente. Inclui conjuntos de dados, serviços de dados e outros recursos catalogados.
Distribuição (dcat:Distribution)
Uma representação específica de um conjunto de dados, por exemplo, um arquivo CSV, uma API ou outro formato de acesso.
Período de Tempo (dcterms:PeriodOfTime)
Intervalo de tempo definido por um início e um fim, utilizado para descrever a cobertura temporal de conjuntos de dados.
Local (dcterms:Location)
Região espacial ou lugar nomeado, utilizado para descrever a cobertura geográfica de conjuntos de dados.
Serviço de Dados (dcat:DataService)
Coleção de operações que fornece acesso a um ou mais conjuntos de dados ou funções de processamento de dados.
Verificação de Integridade (spdx:Checksum)
Valor de checksum usado para verificar a integridade do conteúdo de um arquivo ou pacote. Mesmo pequenas alterações no conteúdo do arquivo alterarão seu Checksum. Esta classe permite que os resultados de uma variedade de algoritmos de Checksum e resumo de mensagens criptográficas sejam representados.
Relacionamento (dcat:Relationship)
Classe utilizada para descrever um relacionamento qualificado entre recursos catalogados. Normalmente referenciada por dcat:qualifiedRelation.
Agente (foaf:Agent)
Fornece diversas propriedades para descrever pessoas, organizações ou entidades. Pode ser uma foaf:Organization ou foaf:Person.

Propriedades

As tabelas a seguir listam todas as propriedades definidas pelo DCAT-BR, organizadas por classe.

Propriedades do Conjunto de Dados (dcat:Dataset)

Propriedade URI Descrição Alcance
dcterms:accrualPeriodicity Periodicidade de Atualização Deve indicar qual será a periodicidade com que o conjunto de dados será atualizado (ex.: diária, mensal, trimestral, semestral, anual). (Selo de Qualidade: Bronze) dcterms:Frequency
dcterms:spatial Área Geográfica Deve indicar a área geográfica coberta pelo conjunto de dados, representando a extensão territorial à qual os dados se referem. (Selo de Qualidade: Ouro) dcterms:Location
dcterms:temporal Período Temporal Utilizar para indicar o intervalo temporal coberto pelos dados, referenciando um recurso do tipo dcterms:PeriodOfTime. dcterms:PeriodOfTime
prov:wasGeneratedBy Fornecedor Negocial do Conjunto de Dados Referencie uma instância de prov:Activity descrevendo o processo/atividade que gerou o conjunto de dados (ex.: "Cálculo anual do Conceito Enade", "Extração mensal do CNPJ", etc.). prov:Activity
dcat:inSeries Em Série Deve indicar se o conjunto de dados faz parte de uma série de conjuntos de dados. prov:Activity

Propriedades de Recursos (dcat:Resource)

Propriedade URI Descrição Alcance
dcterms:accessRights Observância Legal Deve indicar se o conjunto de dados é público, restrito ou privado. dcterms:RightsStatement
dcat:contactPoint E-mail da Área Técnica Responsável Deve indicar o e-mail de contato da área técnica responsável pelo conjunto de dados. vcard:Kind
dcterms:creator Organização Deve indicar qual área técnica do órgão/entidade é responsável pelo conjunto de dados. foaf:Agent
dcterms:description Descrição Descrição sobre o conjunto de dados, incluindo metadados que indiquem quais as Políticas Públicas ou serviços públicos impactados e metadados que descreva as principais informações do conjunto de dados. rdfs:Literal
dcat:keyword Palavras-Chave Deve indicar palavras ou tags que resumem os principais aspectos do conjunto de dados. rdfs:Literal
dcterms:license Licença de Uso Deve selecionar sob qual espécie de licença o conjunto de dados será publicado de acordo com as definições apresentadas. dcterms:LicenseDocument
dcat:theme Tema Deve selecionar a área temática à qual o conjunto de dados esteja vinculado. Permite selecionar mais de uma opção. skos:Concept
dcterms:title Título Deve conter um nome dado ao Conjunto de Dados. O título deve ser escrito por extenso utilizando sigla após o final do título, caso exista. Este é um campo obrigatório. rdfs:Literal
dcterms:type Tipo do Recurso Deve selecionar se o recurso se refere a Distribuição (arquivo), Serviço (API) ou outros. rdfs:Class
dcat:version Versão Deve indicar qual é a versão do conjunto de dados que está sendo cadastrada. (Selo de Qualidade: Bronze) rdfs:Literal
dcterms:publisher Área Técnica Responsável Deve indicar qual área técnica do órgão/entidade é responsável pela disponibilização do conjunto de dados. foaf:Agent
dcterms:issued Data de Publicação Deve indicar a data de emissão formal do conjunto de dados (por exemplo, a data de publicação). rdfs:Literal
dcterms:modified Data de Alteração Deve indicar a data mais recente em que o recurso foi alterado, atualizado ou modificado. rdfs:Literal
dcterms:language Idioma Deve indicar o idioma do conjunto de dados usado para metadados textuais (por exemplo, títulos, descrições) ou para os valores textuais do próprio conjunto de dados. dcterms:LinguisticSystem
dcat:landingPage URL de Obtenção de Acesso Deve indicar uma página da Web para obter acesso a um catálogo, um conjunto de dados, suas distribuições e/ou informações adicionais. foaf:Document
dcterms:rights Observância Legal Complementar Deve indicar uma declaração que diz respeito a todos os direitos não abordados na "Observância Legal", como declarações de direitos autorais. (Selo de Qualidade: Prata) dcterms:RightsStatement
dcat:hasVersion Atualização de Versão Deve indicar que este conjunto de dados possui um versionamento mais específico. (Selo de Qualidade: Prata) dcat:Resource
adms:status Situação Deve indicar o status do conjunto de dados (Ativo, Descontinuado, Em Construção, etc.). Recomenda-se utilizar um conceito SKOS de um vocabulário controlado. (Selo de Qualidade: Prata) skos:Concept
dcterms:relation Relacionamento não Especificado Deve indicar um conjunto de dados com uma relação não especificada com outro conjunto de dados catalogado. (Selo de Qualidade: Não utilizado nos Selos) dcat:Resource
dcat:qualifiedRelation Relacionamento Link para uma descrição de um relacionamento com outro conjunto de dados. (Selo de Qualidade: Não utilizado nos Selos) dcat:Relationship
dcterms:hasPart Faz Parte Deve indicar conjunto de dados incluído física ou logicamente no conjunto de dados descrito. (Selo de Qualidade: Ouro) dcat:Resource
dcterms:isReferencedBy É Referenciado Por Deve indicar recurso relacionado (ex.: publicação) que referencia, cita ou aponta para o conjunto de dados. Para descrição detalhada do relacionamento, utilizar dcat:qualifiedRelation. (Selo de Qualidade: Ouro) dcat:Resource
dcat:previousVersion Versão Anterior Deve indicar a versão anterior de um recurso em uma linhagem. (Selo de Qualidade: Não utilizado nos Selos) dcat:Resource
dcterms:replaces Substituído Por Deve indicar o conjunto de dados que é substituído pelo conjunto de dados descrito. (Selo de Qualidade: Ouro) dcat:Resource
dcat:first Primeiro Recurso Deve indicar o primeiro conjunto de dados em uma coleção ordenada ou série de conjuntos de dados à qual pertence o conjunto de dados atual. (Selo de Qualidade: Não utilizado nos Selos) dcat:Resource

Propriedades da Distribuição (dcat:Distribution)

Propriedade URI Descrição Alcance
dcat:accessURL URL de Acesso Deve indicar o endereço da web onde o recurso está hospedado (arquivo, API ou serviço). rdfs:Resource
dcterms:description Descrição do Recurso Deve indicar a descrição do recurso do conjunto de dados, incluindo metadados que indiquem quais as Políticas Públicas ou serviços públicos impactados e metadados que descrevam as principais informações do conjunto de dados. rdfs:Literal
dcterms:title Título do Recurso Deve conter um nome dado ao recurso do conjunto de dados. O título deve ser escrito por extenso utilizando siglas após o final do título, caso exista. rdfs:Literal
dcterms:format Formato Deve selecionar sob qual formato o recurso será disponibilizado. dcterms:MediaTypeOrExtent
dcterms:issued Data de Publicação do Recurso Data de emissão formal (por exemplo, publicação) do recurso. rdfs:Literal
dcterms:modified Data de Alteração do Recurso Data mais recente em que o recurso foi alterado, atualizado ou modificado. (Selo de Qualidade: Sem Selo) rdfs:Literal
dcterms:rights Observância Legal Complementar do Recurso Deve indicar uma declaração que diz respeito a todos os direitos não abordados com dcterms:license ou dcterms:accessRights, como declarações de direitos autorais. (Selo de Qualidade: Sem Selo) dcterms:RightsStatement
dcterms:accessRights Observância Legal do Recurso Deve indicar a visibilidade do Recurso, se a visibilidade é pública ou privada. (Selo de Qualidade: Sem Selo) dcterms:RightsStatement
dcterms:license Licença de Uso do Recurso Deve selecionar sob qual espécie de licença o recurso será publicado de acordo com as definições apresentadas. (Selo de Qualidade: Sem Selo) dcterms:LicenseDocument
dcat:downloadURL URL de Download Deve indicar a URL de download do arquivo em um determinado formato (por exemplo, CSV, ODS ou RDF). O formato deve ser indicado por dcterms:format e/ou dcat:mediaType da distribuição. (Selo de Qualidade: Não utilizado nos Selos) rdfs:Resource
dcat:byteSize Tamanho em Bytes Deve indicar o tamanho da distribuição em bytes. (Selo de Qualidade: Sem Selo) rdfs:Literal
dcterms:conformsTo Conforme a Deve indicar um padrão, norma ou especificação estabelecida ao qual a distribuição está em conformidade. (Selo de Qualidade: Não utilizado nos Selos) dcterms:Standard
dcat:mediaType Tipo de Mídia Deve indicar o tipo de mídia (MIME type) da distribuição, conforme IANA. (Selo de Qualidade: Sem Selo) dcterms:MediaType
dcat:compressFormat Formato de Compactação Deve indicar o formato de compactação da distribuição na qual os dados estão contidos, por exemplo, para reduzir o tamanho do arquivo para download. (Selo de Qualidade: Sem Selo) dcterms:MediaType
spdx:checksum Verificação de Conteúdo Mecanismo para verificar se o conteúdo de um arquivo ou pacote não foi alterado. (Selo de Qualidade: Não utilizado nos Selos) spdx:Checksum

Propriedades do Período de Tempo (dcterms:PeriodOfTime)

Propriedade URI Descrição Alcance
dcat:startDate Início do Período Deve indicar o início do período. (Selo de Qualidade: Ouro) rdfs:Literal
dcat:endDate Final do Período Deve indicar o final do período. (Selo de Qualidade: Ouro) rdfs:Literal

Propriedades do Local (dcterms:Location)

Propriedade URI Descrição Alcance
locn:geometry Localização Geométrica Associa uma área espacial a uma geometria correspondente. (Selo de Qualidade: Não utilizado nos Selos) rdfs:Resource
dcat:bbox Caixa Delimitadora Deve indicar a caixa delimitadora geográfica de uma área espacial. (Selo de Qualidade: Não utilizado nos Selos) rdfs:Literal
dcat:centroid Centro Geográfico Deve indicar o centro geográfico (centróide) de uma coisa espacial. (Selo de Qualidade: Não utilizado nos Selos) rdfs:Literal

Propriedades do Serviço de Dados (dcat:DataService)

Propriedade URI Descrição Alcance
dcat:endpointURL URL do Endpoint Deve indicar o local raiz ou endpoint primário do serviço (um IRI resolvível pela Web). (Selo de Qualidade: Sem Selo) rdfs:Resource
dcat:endpointDescription Descrição do Endpoint Deve indicar uma descrição dos serviços disponíveis através dos terminais, incluindo operações, parâmetros, etc. (Selo de Qualidade: Sem Selo) rdfs:Resource
dcat:servesDataset Serviço de Dados Deve indicar um conjunto de dados que este serviço de dados pode distribuir/servir. (Selo de Qualidade: Sem Selo) dcat:Dataset

Propriedades da Verificação de Integridade (spdx:Checksum)

Propriedade URI Descrição Alcance
spdx:checksumValue Valor de Verificação de Integridade Deve indicar um valor de resumo (checksum) codificado em hexadecimal minúsculo, produzido usando um algoritmo específico. xsd:hexBinary

Propriedades Extras

Propriedade URI Descrição Alcance
dcatbr:relacionadoODS Relacionamento com ODS Deve indicar se o conjunto de dados possui (Sim) ou não (Não) relação com Objetivos de Desenvolvimento Sustentável (ODS). xsd:boolean
dcatbr:ods Objetivos de Desenvolvimento Sustentável (ODS) Caso o conjunto de dados seja relacionado a ODS, deve indicar um ou mais ODS associados. (recomenda-se vocabulário controlado SKOS) skos:Concept
dcatbr:dadosRacaEtnia Dados de raça/etnia Deve indicar se o conjunto de dados possui (Sim) ou não (Não) dados de raça/etnia. xsd:boolean
dcatbr:dadosGenero Dados de gênero Deve indicar se o conjunto de dados possui (Sim) ou não (Não) dados de gênero. xsd:boolean
dcat:spatialResolutionInMeters Granularidade Espacial Deve indicar o nível de granularidade espacial do conjunto de dados. Refere-se ao nível de detalhamento/resolução com que áreas geográficas são representadas (em metros). xsd:decimal

Exemplo de catalogação em conformidade com o DCAT-BR

O exemplo a seguir ilustra a descrição de um conjunto de dados do Cadastro Único (CadÚnico) com duas distribuições (arquivo CSV e serviço de API) utilizando o vocabulário DCAT-BR em RDF/Turtle.

@prefix dct:   <http://purl.org/dc/terms/> .
@prefix dcat:  <http://www.w3.org/ns/dcat#> .
@prefix foaf:  <http://xmlns.com/foaf/0.1/> .
@prefix vcard: <http://www.w3.org/2006/vcard/ns#> .
@prefix spdx:  <http://spdx.org/rdf/terms#> .

<https://data.gov.br/conjuntodados/cadastro-unico>
  a dcat:Dataset ;
  dct:title "Cadastro Único"@pt-BR ;
  dct:description "Conjunto de dados do Cadastro Único, cadastro do governo federal
    que identifica e caracteriza famílias de baixa renda, para acesso a programas sociais."@pt-BR ;
  dcat:keyword "cadastro unico", "programa social", "familias de baixa renda"@pt-BR ;
  dct:creator  <https://www.mc.br/> ;
  dct:publisher [
    a foaf:Organization ;
    foaf:name "Ministério da Cidadania - Dados"@pt-BR
  ] ;
  dct:license <https://creativecommons.org/licenses/by/4.0/> ;
  dct:accrualPeriodicity "mensal"@pt-BR ;
  dcat:distribution [
    a dcat:Distribution ;
    dct:title "Arquivo com dados do Cadastro Único"@pt-BR ;
    dct:format "CSV" ;
    dcat:accessURL   <https://data.gov.br/dataset/cadastro-unico/resource/cadastro-unico.csv> ;
    dcat:mediaType   "text/csv" ;
    dcat:byteSize    10000 ;
    spdx:checksumValue "SHA-256:f3123234-4567-8901-2345-678901234567"
  ] ;
  dcat:distribution [
    a dcat:Distribution ;
    dct:title "API consulta Cadastro Único"@pt-BR ;
    dct:format "JSON" ;
    dcat:accessURL <https://api.data.gov.br/datasets/cadastro-unico> ;
    dcat:mediaType "application/json"
  ] .
    

Prefixos e namespaces

A Tabela a seguir lista os prefixos RDF utilizados pelo DCAT-BR.

Prefixo Namespace Vocabulário
dcathttp://www.w3.org/ns/dcat#Data Catalog Vocabulary
dcthttp://purl.org/dc/terms/DCMI Metadata Terms
dctermshttp://purl.org/dc/terms/DCMI Metadata Terms
foafhttp://xmlns.com/foaf/0.1/FOAF Vocabulary
locnhttp://www.w3.org/ns/locn#Core Location Vocabulary
spdxhttp://spdx.org/rdf/terms#Software Package Data Exchange
vcardhttp://www.w3.org/2006/vcard/ns#vCard Ontology
xsdhttp://www.w3.org/2001/XMLSchema#XML Schema Datatypes
admshttp://www.w3.org/ns/adms#Asset Description Metadata Schema
provhttp://www.w3.org/ns/prov#PROV Ontology
skoshttp://www.w3.org/2004/02/skos/core#SKOS Vocabulary
rdfhttp://www.w3.org/1999/02/22-rdf-syntax-ns#RDF Vocabulary
rdfshttp://www.w3.org/2000/01/rdf-schema#RDF Schema
dcatbrhttp://purl.org/dcat-br/DCAT-BR Extension