O DCAT-BR é um perfil de aplicação do vocabulário Data Catalog Vocabulary (DCAT) para descrever catálogos, conjuntos de dados, distribuições, serviços de dados e metadados relacionados produzidos ou mantidos pelo setor público brasileiro e por entidades vinculadas. A especificação define classes, propriedades e boas práticas para promover a interoperabilidade semântica entre catálogos nacionais, federados e internacionais, bem como para apoiar iniciativas de open data e linked data.
Esta é a primeira recomendação oficial da versão 1.0 do vocabulário DCAT-BR, elaborada pelo Grupo de Trabalho DCAT-BR. Futuras revisões seguirão o processo de governança de dados nacional, com participação de órgãos federais, estaduais, municipais e entidades vinculadas.
Comentários e propostas de alteração devem ser enviados por meio do repositório público indicado na seção de governança e manutenção.
A disseminação de dados governamentais em múltiplas plataformas exige um vocabulário comum para descrição de metadados, de forma a viabilizar a descoberta, combinação e reuso de conjuntos de dados em escala nacional. O vocabulário DCAT, criado pelo W3C, fornece um modelo RDF para a descrição de catálogos de dados na Web, permitindo a interoperabilidade entre diferentes portais.
O DCAT-BR especializa o DCAT (versão 3), alinhando-o às necessidades do contexto brasileiro e às políticas de governança de dados e proteção de dados pessoais, como a Lei Geral de Proteção de Dados (LGPD). Ele estabelece um conjunto de classes, propriedades obrigatórias e opcionais, bem como vocabulários controlados, para descrever conjuntos de dados do setor público de forma padronizada.
O vocabulário também é projetado para ser utilizado por outros atores, como empresas, academia e organizações da sociedade civil, desde que observadas as regras de adesão ao ecossistema DCAT-BR.
O DCAT-BR aplica-se a conjuntos de dados geridos pelo setor público nas esferas federal, estadual, distrital e municipal, bem como por entidades vinculadas. O padrão pode ser utilizado por outros setores, desde que preservada a compatibilidade com as diretrizes nacionais de catalogação.
O DCAT-BR é mantido com base na Política de Governança de Dados nacional. Alterações na especificação são discutidas no Grupo de Trabalho DCAT-BR e comunicadas publicamente, de modo a preservar a interoperabilidade entre implementações e a rede federada de catálogos.
O modelo de contribuição prevê:
Esta seção é normativa.
Um catálogo, portal ou serviço declara conformidade com o DCAT-BR quando:
dcat:Dataset, são fornecidos
todos os metadados marcados como obrigatórios nesta especificação;
O DCAT-BR utiliza e especializa classes do DCAT v3 e de vocabulários relacionados, organizando o modelo em torno dos seguintes tipos de recursos:
dcat:Dataset)dcat:Resource)dcat:Distribution)dcterms:PeriodOfTime)dcterms:Location)dcat:DataService)spdx:Checksum)dcat:Relationship)dcat:qualifiedRelation.
foaf:Agent)foaf:Organization ou foaf:Person.
As tabelas a seguir listam todas as propriedades definidas pelo DCAT-BR, organizadas por classe.
dcat:Dataset)| Propriedade | URI | Descrição | Alcance |
|---|---|---|---|
dcterms:accrualPeriodicity |
Periodicidade de Atualização | Deve indicar qual será a periodicidade com que o conjunto de dados será atualizado (ex.: diária, mensal, trimestral, semestral, anual). (Selo de Qualidade: Bronze) | dcterms:Frequency |
dcterms:spatial |
Área Geográfica | Deve indicar a área geográfica coberta pelo conjunto de dados, representando a extensão territorial à qual os dados se referem. (Selo de Qualidade: Ouro) | dcterms:Location |
dcterms:temporal |
Período Temporal | Utilizar para indicar o intervalo temporal coberto pelos dados, referenciando um recurso do tipo dcterms:PeriodOfTime. | dcterms:PeriodOfTime |
prov:wasGeneratedBy |
Fornecedor Negocial do Conjunto de Dados | Referencie uma instância de prov:Activity descrevendo o processo/atividade que gerou o conjunto de dados (ex.: "Cálculo anual do Conceito Enade", "Extração mensal do CNPJ", etc.). | prov:Activity |
dcat:inSeries |
Em Série | Deve indicar se o conjunto de dados faz parte de uma série de conjuntos de dados. | prov:Activity |
dcat:Resource)| Propriedade | URI | Descrição | Alcance |
|---|---|---|---|
dcterms:accessRights |
Observância Legal | Deve indicar se o conjunto de dados é público, restrito ou privado. | dcterms:RightsStatement |
dcat:contactPoint |
E-mail da Área Técnica Responsável | Deve indicar o e-mail de contato da área técnica responsável pelo conjunto de dados. | vcard:Kind |
dcterms:creator |
Organização | Deve indicar qual área técnica do órgão/entidade é responsável pelo conjunto de dados. | foaf:Agent |
dcterms:description |
Descrição | Descrição sobre o conjunto de dados, incluindo metadados que indiquem quais as Políticas Públicas ou serviços públicos impactados e metadados que descreva as principais informações do conjunto de dados. | rdfs:Literal |
dcat:keyword |
Palavras-Chave | Deve indicar palavras ou tags que resumem os principais aspectos do conjunto de dados. | rdfs:Literal |
dcterms:license |
Licença de Uso | Deve selecionar sob qual espécie de licença o conjunto de dados será publicado de acordo com as definições apresentadas. | dcterms:LicenseDocument |
dcat:theme |
Tema | Deve selecionar a área temática à qual o conjunto de dados esteja vinculado. Permite selecionar mais de uma opção. | skos:Concept |
dcterms:title |
Título | Deve conter um nome dado ao Conjunto de Dados. O título deve ser escrito por extenso utilizando sigla após o final do título, caso exista. Este é um campo obrigatório. | rdfs:Literal |
dcterms:type |
Tipo do Recurso | Deve selecionar se o recurso se refere a Distribuição (arquivo), Serviço (API) ou outros. | rdfs:Class |
dcat:version |
Versão | Deve indicar qual é a versão do conjunto de dados que está sendo cadastrada. (Selo de Qualidade: Bronze) | rdfs:Literal |
dcterms:publisher |
Área Técnica Responsável | Deve indicar qual área técnica do órgão/entidade é responsável pela disponibilização do conjunto de dados. | foaf:Agent |
dcterms:issued |
Data de Publicação | Deve indicar a data de emissão formal do conjunto de dados (por exemplo, a data de publicação). | rdfs:Literal |
dcterms:modified |
Data de Alteração | Deve indicar a data mais recente em que o recurso foi alterado, atualizado ou modificado. | rdfs:Literal |
dcterms:language |
Idioma | Deve indicar o idioma do conjunto de dados usado para metadados textuais (por exemplo, títulos, descrições) ou para os valores textuais do próprio conjunto de dados. | dcterms:LinguisticSystem |
dcat:landingPage |
URL de Obtenção de Acesso | Deve indicar uma página da Web para obter acesso a um catálogo, um conjunto de dados, suas distribuições e/ou informações adicionais. | foaf:Document |
dcterms:rights |
Observância Legal Complementar | Deve indicar uma declaração que diz respeito a todos os direitos não abordados na "Observância Legal", como declarações de direitos autorais. (Selo de Qualidade: Prata) | dcterms:RightsStatement |
dcat:hasVersion |
Atualização de Versão | Deve indicar que este conjunto de dados possui um versionamento mais específico. (Selo de Qualidade: Prata) | dcat:Resource |
adms:status |
Situação | Deve indicar o status do conjunto de dados (Ativo, Descontinuado, Em Construção, etc.). Recomenda-se utilizar um conceito SKOS de um vocabulário controlado. (Selo de Qualidade: Prata) | skos:Concept |
dcterms:relation |
Relacionamento não Especificado | Deve indicar um conjunto de dados com uma relação não especificada com outro conjunto de dados catalogado. (Selo de Qualidade: Não utilizado nos Selos) | dcat:Resource |
dcat:qualifiedRelation |
Relacionamento | Link para uma descrição de um relacionamento com outro conjunto de dados. (Selo de Qualidade: Não utilizado nos Selos) | dcat:Relationship |
dcterms:hasPart |
Faz Parte | Deve indicar conjunto de dados incluído física ou logicamente no conjunto de dados descrito. (Selo de Qualidade: Ouro) | dcat:Resource |
dcterms:isReferencedBy |
É Referenciado Por | Deve indicar recurso relacionado (ex.: publicação) que referencia, cita ou aponta para o conjunto de dados. Para descrição detalhada do relacionamento, utilizar dcat:qualifiedRelation. (Selo de Qualidade: Ouro) | dcat:Resource |
dcat:previousVersion |
Versão Anterior | Deve indicar a versão anterior de um recurso em uma linhagem. (Selo de Qualidade: Não utilizado nos Selos) | dcat:Resource |
dcterms:replaces |
Substituído Por | Deve indicar o conjunto de dados que é substituído pelo conjunto de dados descrito. (Selo de Qualidade: Ouro) | dcat:Resource |
dcat:first |
Primeiro Recurso | Deve indicar o primeiro conjunto de dados em uma coleção ordenada ou série de conjuntos de dados à qual pertence o conjunto de dados atual. (Selo de Qualidade: Não utilizado nos Selos) | dcat:Resource |
dcat:Distribution)| Propriedade | URI | Descrição | Alcance |
|---|---|---|---|
dcat:accessURL |
URL de Acesso | Deve indicar o endereço da web onde o recurso está hospedado (arquivo, API ou serviço). | rdfs:Resource |
dcterms:description |
Descrição do Recurso | Deve indicar a descrição do recurso do conjunto de dados, incluindo metadados que indiquem quais as Políticas Públicas ou serviços públicos impactados e metadados que descrevam as principais informações do conjunto de dados. | rdfs:Literal |
dcterms:title |
Título do Recurso | Deve conter um nome dado ao recurso do conjunto de dados. O título deve ser escrito por extenso utilizando siglas após o final do título, caso exista. | rdfs:Literal |
dcterms:format |
Formato | Deve selecionar sob qual formato o recurso será disponibilizado. | dcterms:MediaTypeOrExtent |
dcterms:issued |
Data de Publicação do Recurso | Data de emissão formal (por exemplo, publicação) do recurso. | rdfs:Literal |
dcterms:modified |
Data de Alteração do Recurso | Data mais recente em que o recurso foi alterado, atualizado ou modificado. (Selo de Qualidade: Sem Selo) | rdfs:Literal |
dcterms:rights |
Observância Legal Complementar do Recurso | Deve indicar uma declaração que diz respeito a todos os direitos não abordados com dcterms:license ou dcterms:accessRights, como declarações de direitos autorais. (Selo de Qualidade: Sem Selo) | dcterms:RightsStatement |
dcterms:accessRights |
Observância Legal do Recurso | Deve indicar a visibilidade do Recurso, se a visibilidade é pública ou privada. (Selo de Qualidade: Sem Selo) | dcterms:RightsStatement |
dcterms:license |
Licença de Uso do Recurso | Deve selecionar sob qual espécie de licença o recurso será publicado de acordo com as definições apresentadas. (Selo de Qualidade: Sem Selo) | dcterms:LicenseDocument |
dcat:downloadURL |
URL de Download | Deve indicar a URL de download do arquivo em um determinado formato (por exemplo, CSV, ODS ou RDF). O formato deve ser indicado por dcterms:format e/ou dcat:mediaType da distribuição. (Selo de Qualidade: Não utilizado nos Selos) | rdfs:Resource |
dcat:byteSize |
Tamanho em Bytes | Deve indicar o tamanho da distribuição em bytes. (Selo de Qualidade: Sem Selo) | rdfs:Literal |
dcterms:conformsTo |
Conforme a | Deve indicar um padrão, norma ou especificação estabelecida ao qual a distribuição está em conformidade. (Selo de Qualidade: Não utilizado nos Selos) | dcterms:Standard |
dcat:mediaType |
Tipo de Mídia | Deve indicar o tipo de mídia (MIME type) da distribuição, conforme IANA. (Selo de Qualidade: Sem Selo) | dcterms:MediaType |
dcat:compressFormat |
Formato de Compactação | Deve indicar o formato de compactação da distribuição na qual os dados estão contidos, por exemplo, para reduzir o tamanho do arquivo para download. (Selo de Qualidade: Sem Selo) | dcterms:MediaType |
spdx:checksum |
Verificação de Conteúdo | Mecanismo para verificar se o conteúdo de um arquivo ou pacote não foi alterado. (Selo de Qualidade: Não utilizado nos Selos) | spdx:Checksum |
dcterms:PeriodOfTime)| Propriedade | URI | Descrição | Alcance |
|---|---|---|---|
dcat:startDate |
Início do Período | Deve indicar o início do período. (Selo de Qualidade: Ouro) | rdfs:Literal |
dcat:endDate |
Final do Período | Deve indicar o final do período. (Selo de Qualidade: Ouro) | rdfs:Literal |
dcterms:Location)| Propriedade | URI | Descrição | Alcance |
|---|---|---|---|
locn:geometry |
Localização Geométrica | Associa uma área espacial a uma geometria correspondente. (Selo de Qualidade: Não utilizado nos Selos) | rdfs:Resource |
dcat:bbox |
Caixa Delimitadora | Deve indicar a caixa delimitadora geográfica de uma área espacial. (Selo de Qualidade: Não utilizado nos Selos) | rdfs:Literal |
dcat:centroid |
Centro Geográfico | Deve indicar o centro geográfico (centróide) de uma coisa espacial. (Selo de Qualidade: Não utilizado nos Selos) | rdfs:Literal |
dcat:DataService)| Propriedade | URI | Descrição | Alcance |
|---|---|---|---|
dcat:endpointURL |
URL do Endpoint | Deve indicar o local raiz ou endpoint primário do serviço (um IRI resolvível pela Web). (Selo de Qualidade: Sem Selo) | rdfs:Resource |
dcat:endpointDescription |
Descrição do Endpoint | Deve indicar uma descrição dos serviços disponíveis através dos terminais, incluindo operações, parâmetros, etc. (Selo de Qualidade: Sem Selo) | rdfs:Resource |
dcat:servesDataset |
Serviço de Dados | Deve indicar um conjunto de dados que este serviço de dados pode distribuir/servir. (Selo de Qualidade: Sem Selo) | dcat:Dataset |
spdx:Checksum)| Propriedade | URI | Descrição | Alcance |
|---|---|---|---|
spdx:checksumValue |
Valor de Verificação de Integridade | Deve indicar um valor de resumo (checksum) codificado em hexadecimal minúsculo, produzido usando um algoritmo específico. | xsd:hexBinary |
| Propriedade | URI | Descrição | Alcance |
|---|---|---|---|
dcatbr:relacionadoODS |
Relacionamento com ODS | Deve indicar se o conjunto de dados possui (Sim) ou não (Não) relação com Objetivos de Desenvolvimento Sustentável (ODS). | xsd:boolean |
dcatbr:ods |
Objetivos de Desenvolvimento Sustentável (ODS) | Caso o conjunto de dados seja relacionado a ODS, deve indicar um ou mais ODS associados. (recomenda-se vocabulário controlado SKOS) | skos:Concept |
dcatbr:dadosRacaEtnia |
Dados de raça/etnia | Deve indicar se o conjunto de dados possui (Sim) ou não (Não) dados de raça/etnia. | xsd:boolean |
dcatbr:dadosGenero |
Dados de gênero | Deve indicar se o conjunto de dados possui (Sim) ou não (Não) dados de gênero. | xsd:boolean |
dcat:spatialResolutionInMeters |
Granularidade Espacial | Deve indicar o nível de granularidade espacial do conjunto de dados. Refere-se ao nível de detalhamento/resolução com que áreas geográficas são representadas (em metros). | xsd:decimal |
O exemplo a seguir ilustra a descrição de um conjunto de dados do Cadastro Único (CadÚnico) com duas distribuições (arquivo CSV e serviço de API) utilizando o vocabulário DCAT-BR em RDF/Turtle.
@prefix dct: <http://purl.org/dc/terms/> .
@prefix dcat: <http://www.w3.org/ns/dcat#> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix vcard: <http://www.w3.org/2006/vcard/ns#> .
@prefix spdx: <http://spdx.org/rdf/terms#> .
<https://data.gov.br/conjuntodados/cadastro-unico>
a dcat:Dataset ;
dct:title "Cadastro Único"@pt-BR ;
dct:description "Conjunto de dados do Cadastro Único, cadastro do governo federal
que identifica e caracteriza famílias de baixa renda, para acesso a programas sociais."@pt-BR ;
dcat:keyword "cadastro unico", "programa social", "familias de baixa renda"@pt-BR ;
dct:creator <https://www.mc.br/> ;
dct:publisher [
a foaf:Organization ;
foaf:name "Ministério da Cidadania - Dados"@pt-BR
] ;
dct:license <https://creativecommons.org/licenses/by/4.0/> ;
dct:accrualPeriodicity "mensal"@pt-BR ;
dcat:distribution [
a dcat:Distribution ;
dct:title "Arquivo com dados do Cadastro Único"@pt-BR ;
dct:format "CSV" ;
dcat:accessURL <https://data.gov.br/dataset/cadastro-unico/resource/cadastro-unico.csv> ;
dcat:mediaType "text/csv" ;
dcat:byteSize 10000 ;
spdx:checksumValue "SHA-256:f3123234-4567-8901-2345-678901234567"
] ;
dcat:distribution [
a dcat:Distribution ;
dct:title "API consulta Cadastro Único"@pt-BR ;
dct:format "JSON" ;
dcat:accessURL <https://api.data.gov.br/datasets/cadastro-unico> ;
dcat:mediaType "application/json"
] .
A Tabela a seguir lista os prefixos RDF utilizados pelo DCAT-BR.
| Prefixo | Namespace | Vocabulário |
|---|---|---|
dcat | http://www.w3.org/ns/dcat# | Data Catalog Vocabulary |
dct | http://purl.org/dc/terms/ | DCMI Metadata Terms |
dcterms | http://purl.org/dc/terms/ | DCMI Metadata Terms |
foaf | http://xmlns.com/foaf/0.1/ | FOAF Vocabulary |
locn | http://www.w3.org/ns/locn# | Core Location Vocabulary |
spdx | http://spdx.org/rdf/terms# | Software Package Data Exchange |
vcard | http://www.w3.org/2006/vcard/ns# | vCard Ontology |
xsd | http://www.w3.org/2001/XMLSchema# | XML Schema Datatypes |
adms | http://www.w3.org/ns/adms# | Asset Description Metadata Schema |
prov | http://www.w3.org/ns/prov# | PROV Ontology |
skos | http://www.w3.org/2004/02/skos/core# | SKOS Vocabulary |
rdf | http://www.w3.org/1999/02/22-rdf-syntax-ns# | RDF Vocabulary |
rdfs | http://www.w3.org/2000/01/rdf-schema# | RDF Schema |
dcatbr | http://purl.org/dcat-br/ | DCAT-BR Extension |