GED - Digitalização

Atenção: este texto é parte integrante da seção "Iniciativas Públicas" do portal ECM GED. O mesmo ainda se encontra em fase de revisão, formatação e aprovação. Se o seu objetivo é ver material já publicado veja a seção Principal. Se o seu objetivo é identificar empresas que prestem serviços em digitalização e/ou desenvolvimento de soluções GED veja a seção ECM / GED - cadastro de empresas.

 

 

DERIVADA DE NAVEGAÇÃO (Thumbnail) – DN
Para a visualização de imagem a título ilustrativo em sítios da internet, deve-se utilizar um representante digital com baixa resolução, do tipo thumbnail. Nessa modalidade os formatos de arquivo digitais mais comuns são o GIF, BMP, PNG e JPEG. Esse formato apresenta uma resolução final que não é recomendada para textos ou desenhos com linhas muito finas ou caracteres muito pequenos, tornando-os, por vezes, pouco legíveis.
33 Download é o recurso de disponibilizar arquivos em formato digital por meio da internet ou intranet, permitindo a sua transferência para um dispositivos de armazenamento remoto.
34 Cópia por demanda. Essa é uma modalidade de reprodução que pode ser realizada a partir de uma gama de formatos de arquivos digitais oferecidos e formas de entrega por meio de redes de dados, ou em mídias de armazenamento. A partir de solicitação individual direta a organização (pedido de serviço) ou por meio automatizado, diferenciados formatos de arquivo digitais podem ser gerados e disponibilizados ao usuário final, como por exemplo de um item ou vários itens documentais (variadas imagens) onde esses são convertidos em um único documento em formato como o PDF.
35 JPEG -Joint Photographic Experts Group. Formato digital de imagem. É um formato de arquivo digital com compressão com perdas (lossy), padronizado pela ISO, International Standard Organization – hipte://www.iso.org, de ampla aceitação e uso, o que o limita como melhor opção para matriz digital. Tem sido avaliado o uso do formato JPEG 2000, para a produção de matrizes digitais. Disponível em: . Acesso em abril de 2009.
36 PDF -Portable Document Format. -Formato digital desenvolvido pela @Adobe em 1993, e em 2008 adotado como padrão ISO-3200, e “que permite capturar e visualizar informações consistentes -a partir de quase todo aplicativo ou sistema operacional - e compartilhá-las praticamente com qualquer pessoa, em qualquer lugar...”. Em 2005, a ISO adotou
o padrão PDF/Archive -PDF/A -ISO 19005-1:2005, que assegura o acesso a longo prazo. Disponível em: <
http://www.adobe.com/br/products/acrobat/adobepdf.html> 37 Ver em Acesso: Dez. 2009

GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

GERAÇÃO DE MATRIZES DIGITAIS
Seguem abaixo, na tabela 1, as recomendações para a captura digital, de acordo com o tipo de documento original, indicando o tipo de reprodução (modo de cor), formato de arquivo digital e resolução mínima em dpi.
GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

TABELA 1


Tipo de documento
GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

Tipo de Reprodução

GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

Formato de arquivo digital

GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

Resolução mínima, modo de cor e observações

Textos impressos, sem

 

 

Resolução mínima de 300 dpi39 , escala 1:1, com margem

ilustração, preto e branco. (*) sem

Bitonal (**)

TIFF38 sem compressão

preta de 0,2 cm ao redor do documento, 4 bits, modo bitonal(**)

manchas

 

 

 

Textos impressos, com

 

 

Resolução mínima de 300 dpi, escala 1:1, com margem

ilustração e preto e

Tons de cinza

TIFF sem

preta de 0,2 cm ao redor do documento, 8 bits, modo

branco.(*) com

(***)

compressão

tons de cinza (***)

manchas

 

 

 

Textos impressos, com ilustração e cor

Cor

TIFF sem compressão

Resolução mínima de 300 dpi , escala 1:1, com margem preta de 0,2 cm ao redor do documento, 24 bits (8 bits por canal de cor), modo RGB (****)

Manuscritos sem a presença de cor

Tons de cinza

TIFF sem compressão

Resolução mínima de 300 dpi, escala 1:1, com margem preta de 0,2cm ao redor do documento, 8 bits, modo tons de cinza (***)

Manuscritos com a presença de cor

Cor

TIFF sem compressão

Resolução mínima de 300 dpi, escala 1:1, com margem preta de 0,2 cm ao redor do documento, 24 bits (8 bits por canal de cor), modo RGB (****)

Fotografias

 

 

Resolução mínima de 300 dpi, escala 1:1, com margem

(Preto e Branco e Cor) (**)

Cor

TIFF sem compressão

preta de 0,2 cm ao redor do documento, 24 bits (8 bits por canal de cor), modo RGB, com carta de cinza para

 

 

 

ajuste de níveis (preferencialmente)

Negativos fotográficos e diapositivos (a)

Cor

TIFF sem compressão

Resolução mínima de 3000 dpi, 24 bits (8 bits por canal de cor), modo RGB (****)

Documentos cartográficos

Cor

TIFF sem compressão

Resolução mínima de 300 dpi, escala 1:1, com margem preta de 0,2cm ao redor do documento, 24 bits (8 bits por canal de cor), modo RGB, com carta de cinza para ajuste de níveis (preferencialmente) (****)

Plantas

Preto e branco

TIFF

Resolução mínima de 600 dpi, 8 bits, com possibilidade de modo tons de cinza (****)

Microfilmes e

Tons de cinza

TIFF sem

Resolução mínima de 300 dpi, 8 bits, modo tons de cinza

microfichas

(***)

compressão

(***)

Gravuras, cartazes e

 

 

Resolução mínima de 300 dpi, escala 1:1, com margem

desenhos (Preto e Branco e Cor)

Cor

TIFF sem compressão

preta de 0,2cm ao redor do documento, 24 bits (8 bits por canal de cor), modo RGB, com carta de cinza ou cores para ajuste de níveis (preferencialmente)

 

 

 

(****)

(*) Sem manchas / com manchas. (**) Bi-tonal: Captura de imagem onde não há gradação entre o claro e o escuro. Recomenda-se o seu uso somente para
textos impressos e/ou datilografados monocromáticos e muito homogêneos, sem presença de manchas ou escurecimento do suporte original. (***) Tons de Cinza / Escala de cinza: (Greyscale)-Recomenda-se o uso de escala de cinza para evitar que pequenas
manchas interfiram na leitura final do representante digital. Da mesma forma para a digitalização de microformas, caso tenham as características assinaladas acima.

GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

(****) Modo de cor: RGB (Red-Green-Blue). Padrão de cores. RGB é a abreviatura do sistema de cores aditivas formado por Vermelho (Red), Verde (Green) e Azul (Blue). Este sistema é constituído por projeções de luz como monitores de vídeo e projetores (data displays), em contraposição ao sistema substrativo, formado por impressões (CMYK). O padrão RGB é padrão para apresentação de cores na internet e seu uso é recomendado para documentos originalmente coloridos ou com informações relevantes em cor e fotografias de modo geral.
GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

METADADOS TÉCNICOS
Esta recomendação explicita um esquema mínimo de metadados técnicos referentes à captura digital, e não abrange aqueles referentes a recursos de catalogação, indexação, descrição ou de busca e pesquisa.
Os outros esquemas de metadados não serão tratados nesse documento, a saber: metadados descritivos, metadados administrativos (em grande parte contemplado pelo esquema de metadados técnicos aqui recomendado) e metadados estruturais.
Os metadados técnicos descrevem as características do representante digital no que diz respeito ao processo de captura digital, onde deve ser descrito e registrado o ambiente tecnológico (software e hardware), bem como algumas das características físicas do documento, tais como tipo e dimensão. Estes metadados devem, preferencialmente, estar inseridos ou encapsulados no representante digital e também descritos e registrados em planilhas em banco de dados.
A maior parte dos metadados discriminados abaixo são produzidos e inseridos automaticamente seja no próprio representante digital ou em planilha de banco de dados.
GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

Tabela 2

40 International Color Consortium -ICC. Especificações para sistemas de cores em formatos e plataformas abertas. Disponível em: . Acesso em abril de 2009.
41 Hashing, hash . Algoritmo que mapeia uma seqüência de bits (de um arquivo em formato digital), com a finalidade de realizar a sua verificação de integridade (checksum).

GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

IDENTIFICADOR DO REPRESENTANTE DIGITAL
É indispensável o uso de um identificador do representante digital, que seja unívoco, persistente, permanente e que sempre permita a sua localização e sua identificação.
Deve-se utilizar um esquema para geração do identificador (file name) que não permita existir no acervo dois representantes digitais com identificadores iguais. Esse identificador não é necessariamente o mesmo que é utilizado na codificação de referência do documento ou nome do documento. Deve ser sucinto, permanente, consistentemente estruturado.
Abaixo recomendações básicas para a elaboração e uso de identificadores42:


seja único
GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

seja consistentemente estruturado

GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

seja considerado o máximo de itens a serem escaneados

GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

ao utilizar um esquema numérico, use zeros à esquerda para facilitar a composição do identificador

seja concebido de forma pouco complexa e não muito longo de modo a evitar erros humanos

GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

use minúsculas e extensões de arquivo (ex. TIFF, JPEG)

GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

uso de números e/ou letras, mas não se recomenda o uso de caracteres de símbolos e espaços que possam dificultar a interoperabilidade

GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

metadados dos documentos inseridos nos nomes dos arquivos (como data da captura, número de página) também devem ser replicados em local próprio, para prover segurança e facilidades quando da movimentação da imagem para outros sistemas ou na necessidade de ser renomeado/identificado

GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

sequenciamento de informações e divisões estruturais importantes de imagens multi-partidas devem ser explicitamente registradas nos metadados estruturais e não apenas embutidos nos nomes dos arquivos

GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

embora não seja recomendado incorporar informação em demasia no nome do arquivo, uma certa quantidade de informação pode servir como metadado descritivo mínima para o documento/arquivo/imagem, e é uma alternativa econômica para o fornecimento de dados mais detalhados em outra parte

GED Gestão Eletrônica de Documentos
ECM Enterprise Content Management

na eventualidade de se utilizar um nome temporário, recomenda-se a utilização de um esquema numérico simples, associando-o intelectualmente a um nome mais complexo por meio de um banco de dados

42 Baseado e adaptado de: Technical Guidelines for Digitizing Archival Materials for Electronic Access: Creation of Production Files – Raster Images For the Following Record Types-Textual, Graphic Illustrations/Artwork/Originals, Maps, Plans, Oversized, Photographs, Aerial Photographs, and Objects/Artifacts.

Nota à equipe CRB: quando enviar o texto de avaliação ao seu orientador, lembre-se de dar sua opinião sobre a mudança de logo do portal ECM GED, ocorrida em virtude da mudança de nome do portal. A comparação entre as logos pode ser feita na página portal GED. Tão logo a mudança de logo seja concluída, esta página deixará de ter links nos menus.

 

 

Atenção: este texto é parte integrante da seção "Iniciativas Públicas" do portal ECM GED. O mesmo ainda se encontra em fase de revisão, formatação e aprovação. Se o seu objetivo é ver material já publicado clique em um dos links acima.

 

Portal ECM GED distribuindo conhecimento - Algumas empresas beneficiadas