GED - Digitalização
Atenção: este texto é parte integrante da seção "Iniciativas Públicas" do portal ECM GED. O mesmo ainda se encontra em fase de revisão, formatação e aprovação. Se o seu objetivo é ver material já publicado veja a seção Principal. Se o seu objetivo é identificar empresas que prestem serviços em digitalização e/ou desenvolvimento de soluções GED veja a seção ECM / GED - cadastro de empresas.
DERIVADA DE NAVEGAÇÃO (Thumbnail) – DN
Para a visualização de imagem a título ilustrativo em sítios da internet, deve-se utilizar um representante digital com baixa resolução, do tipo thumbnail. Nessa modalidade os formatos de arquivo digitais mais comuns são o GIF, BMP, PNG e JPEG. Esse formato apresenta uma resolução final que não é recomendada para textos ou desenhos com linhas muito finas ou caracteres muito pequenos, tornando-os, por vezes, pouco legíveis.
33 Download é o recurso de disponibilizar arquivos em formato digital por meio da internet ou intranet, permitindo a sua transferência para um dispositivos de armazenamento remoto.
34 Cópia por demanda. Essa é uma modalidade de reprodução que pode ser realizada a partir de uma gama de formatos de arquivos digitais oferecidos e formas de entrega por meio de redes de dados, ou em mídias de armazenamento. A partir de solicitação individual direta a organização (pedido de serviço) ou por meio automatizado, diferenciados formatos de arquivo digitais podem ser gerados e disponibilizados ao usuário final, como por exemplo de um item ou vários itens documentais (variadas imagens) onde esses são convertidos em um único documento em formato como o PDF.
35 JPEG -Joint Photographic Experts Group. Formato digital de imagem. É um formato de arquivo digital com compressão com perdas (lossy), padronizado pela ISO, International Standard Organization – hipte://www.iso.org, de ampla aceitação e uso, o que o limita como melhor opção para matriz digital. Tem sido avaliado o uso do formato JPEG 2000, para a produção de matrizes digitais. Disponível em: . Acesso em abril de 2009.
36 PDF -Portable Document Format. -Formato digital desenvolvido pela @Adobe em 1993, e em 2008 adotado como padrão ISO-3200, e “que permite capturar e visualizar informações consistentes -a partir de quase todo aplicativo ou sistema operacional - e compartilhá-las praticamente com qualquer pessoa, em qualquer lugar...”. Em 2005, a ISO adotou
o padrão PDF/Archive -PDF/A -ISO 19005-1:2005, que assegura o acesso a longo prazo. Disponível em: <
http://www.adobe.com/br/products/acrobat/adobepdf.html> 37 Ver em Acesso: Dez. 2009
GED Gestão Eletrônica de Documentos ECM Enterprise Content Management |
GERAÇÃO DE MATRIZES DIGITAIS
Seguem abaixo, na tabela 1, as recomendações para a captura digital, de acordo com o tipo de documento original, indicando o tipo de reprodução (modo de cor), formato de arquivo digital e resolução mínima em dpi.
GED Gestão Eletrônica de Documentos ECM Enterprise Content Management |
TABELA 1
Tipo de documento |
Tipo de Reprodução |
Formato de arquivo digital |
Resolução mínima, modo de cor e observações |
|||
Textos impressos, sem |
|
|
Resolução mínima de 300 dpi39 , escala 1:1, com margem |
|||
ilustração, preto e branco. (*) sem |
Bitonal (**) |
TIFF38 sem compressão |
preta de 0,2 cm ao redor do documento, 4 bits, modo bitonal(**) |
|||
manchas |
|
|
|
|||
Textos impressos, com |
|
|
Resolução mínima de 300 dpi, escala 1:1, com margem |
|||
ilustração e preto e |
Tons de cinza |
TIFF sem |
preta de 0,2 cm ao redor do documento, 8 bits, modo |
|||
branco.(*) com |
(***) |
compressão |
tons de cinza (***) |
|||
manchas |
|
|
|
|||
Textos impressos, com ilustração e cor |
Cor |
TIFF sem compressão |
Resolução mínima de 300 dpi , escala 1:1, com margem preta de 0,2 cm ao redor do documento, 24 bits (8 bits por canal de cor), modo RGB (****) |
|||
Manuscritos sem a presença de cor |
Tons de cinza |
TIFF sem compressão |
Resolução mínima de 300 dpi, escala 1:1, com margem preta de 0,2cm ao redor do documento, 8 bits, modo tons de cinza (***) |
|||
Manuscritos com a presença de cor |
Cor |
TIFF sem compressão |
Resolução mínima de 300 dpi, escala 1:1, com margem preta de 0,2 cm ao redor do documento, 24 bits (8 bits por canal de cor), modo RGB (****) |
|||
Fotografias |
|
|
Resolução mínima de 300 dpi, escala 1:1, com margem |
|||
(Preto e Branco e Cor) (**) |
Cor |
TIFF sem compressão |
preta de 0,2 cm ao redor do documento, 24 bits (8 bits por canal de cor), modo RGB, com carta de cinza para |
|||
|
|
|
ajuste de níveis (preferencialmente) |
|||
Negativos fotográficos e diapositivos (a) |
Cor |
TIFF sem compressão |
Resolução mínima de 3000 dpi, 24 bits (8 bits por canal de cor), modo RGB (****) |
|||
Documentos cartográficos |
Cor |
TIFF sem compressão |
Resolução mínima de 300 dpi, escala 1:1, com margem preta de 0,2cm ao redor do documento, 24 bits (8 bits por canal de cor), modo RGB, com carta de cinza para ajuste de níveis (preferencialmente) (****) |
|||
Plantas |
Preto e branco |
TIFF |
Resolução mínima de 600 dpi, 8 bits, com possibilidade de modo tons de cinza (****) |
|||
Microfilmes e |
Tons de cinza |
TIFF sem |
Resolução mínima de 300 dpi, 8 bits, modo tons de cinza |
|||
microfichas |
(***) |
compressão |
(***) |
|||
Gravuras, cartazes e |
|
|
Resolução mínima de 300 dpi, escala 1:1, com margem |
|||
desenhos (Preto e Branco e Cor) |
Cor |
TIFF sem compressão |
preta de 0,2cm ao redor do documento, 24 bits (8 bits por canal de cor), modo RGB, com carta de cinza ou cores para ajuste de níveis (preferencialmente) |
|||
|
|
|
(****) |
(*) Sem manchas / com manchas. (**) Bi-tonal: Captura de imagem onde não há gradação entre o claro e o escuro. Recomenda-se o seu uso somente para
textos impressos e/ou datilografados monocromáticos e muito homogêneos, sem presença de manchas ou escurecimento do suporte original. (***) Tons de Cinza / Escala de cinza: (Greyscale)-Recomenda-se o uso de escala de cinza para evitar que pequenas
manchas interfiram na leitura final do representante digital. Da mesma forma para a digitalização de microformas, caso tenham as características assinaladas acima.
GED Gestão Eletrônica de Documentos ECM Enterprise Content Management |
(****) Modo de cor: RGB (Red-Green-Blue). Padrão de cores. RGB é a abreviatura do sistema de cores aditivas formado por Vermelho (Red), Verde (Green) e Azul (Blue). Este sistema é constituído por projeções de luz como monitores de vídeo e projetores (data displays), em contraposição ao sistema substrativo, formado por impressões (CMYK). O padrão RGB é padrão para apresentação de cores na internet e seu uso é recomendado para documentos originalmente coloridos ou com informações relevantes em cor e fotografias de modo geral.
GED Gestão Eletrônica de Documentos ECM Enterprise Content Management |
METADADOS TÉCNICOS
Esta recomendação explicita um esquema mínimo de metadados técnicos referentes à captura digital, e não abrange aqueles referentes a recursos de catalogação, indexação, descrição ou de busca e pesquisa.
Os outros esquemas de metadados não serão tratados nesse documento, a saber: metadados descritivos, metadados administrativos (em grande parte contemplado pelo esquema de metadados técnicos aqui recomendado) e metadados estruturais.
Os metadados técnicos descrevem as características do representante digital no que diz respeito ao processo de captura digital, onde deve ser descrito e registrado o ambiente tecnológico (software e hardware), bem como algumas das características físicas do documento, tais como tipo e dimensão. Estes metadados devem, preferencialmente, estar inseridos ou encapsulados no representante digital e também descritos e registrados em planilhas em banco de dados.
A maior parte dos metadados discriminados abaixo são produzidos e inseridos automaticamente seja no próprio representante digital ou em planilha de banco de dados.
GED Gestão Eletrônica de Documentos ECM Enterprise Content Management |
Tabela 2
40 International Color Consortium -ICC. Especificações para sistemas de cores em formatos e plataformas abertas. Disponível em: . Acesso em abril de 2009.
41 Hashing, hash . Algoritmo que mapeia uma seqüência de bits (de um arquivo em formato digital), com a finalidade de realizar a sua verificação de integridade (checksum).
GED Gestão Eletrônica de Documentos ECM Enterprise Content Management |
IDENTIFICADOR DO REPRESENTANTE DIGITAL
É indispensável o uso de um identificador do representante digital, que seja unívoco, persistente, permanente e que sempre permita a sua localização e sua identificação.
Deve-se utilizar um esquema para geração do identificador (file name) que não permita existir no acervo dois representantes digitais com identificadores iguais. Esse identificador não é necessariamente o mesmo que é utilizado na codificação de referência do documento ou nome do documento. Deve ser sucinto, permanente, consistentemente estruturado.
Abaixo recomendações básicas para a elaboração e uso de identificadores42:
seja único |
|
seja consistentemente estruturado |
|
seja considerado o máximo de itens a serem escaneados |
|
ao utilizar um esquema numérico, use zeros à esquerda para facilitar a composição do identificador |
|
seja concebido de forma pouco complexa e não muito longo de modo a evitar erros humanos |
|
use minúsculas e extensões de arquivo (ex. TIFF, JPEG) |
|
uso de números e/ou letras, mas não se recomenda o uso de caracteres de símbolos e espaços que possam dificultar a interoperabilidade |
|
metadados dos documentos inseridos nos nomes dos arquivos (como data da captura, número de página) também devem ser replicados em local próprio, para prover segurança e facilidades quando da movimentação da imagem para outros sistemas ou na necessidade de ser renomeado/identificado |
|
sequenciamento de informações e divisões estruturais importantes de imagens multi-partidas devem ser explicitamente registradas nos metadados estruturais e não apenas embutidos nos nomes dos arquivos |
|
embora não seja recomendado incorporar informação em demasia no nome do arquivo, uma certa quantidade de informação pode servir como metadado descritivo mínima para o documento/arquivo/imagem, e é uma alternativa econômica para o fornecimento de dados mais detalhados em outra parte |
|
na eventualidade de se utilizar um nome temporário, recomenda-se a utilização de um esquema numérico simples, associando-o intelectualmente a um nome mais complexo por meio de um banco de dados |
42 Baseado e adaptado de: Technical Guidelines for Digitizing Archival Materials for Electronic Access: Creation of Production Files – Raster Images For the Following Record Types-Textual, Graphic Illustrations/Artwork/Originals, Maps, Plans, Oversized, Photographs, Aerial Photographs, and Objects/Artifacts.
Nota à equipe CRB: quando enviar o texto de avaliação ao seu orientador, lembre-se de dar sua opinião sobre a mudança de logo do portal ECM GED, ocorrida em virtude da mudança de nome do portal. A comparação entre as logos pode ser feita na página portal GED. Tão logo a mudança de logo seja concluída, esta página deixará de ter links nos menus.
Atenção: este texto é parte integrante da seção "Iniciativas Públicas" do portal ECM GED. O mesmo ainda se encontra em fase de revisão, formatação e aprovação. Se o seu objetivo é ver material já publicado clique em um dos links acima.