Accueil > 6ème édition des Journées "Internet pour le droit" > Les interventions > Mercredi 3 novembre 2004 : La conservation des données juridiques sous (...) > Le projet GPO visant à conserver l’ensemble des données juridiques (...)
Le projet GPO visant à conserver l’ensemble des données juridiques publiques américaines
vendredi 14 janvier 2005, par
Toutes les versions de cet article : [English] [français]
Mme Claire GERMAIN, Bibliothécaire et professeur de droit à la Edward Cornell Law School, Ithaca, New York -U.S.A.
L’objectif poursuivi par le Bureau des Publications du Gouvernement- BPG (Government Printing Office - GPO) est d’offrir un accès permanent aux publications électroniques du gouvernement fédéral des États-unis.
Résumé
L’objectif poursuivi par le Bureau des Publications du Gouvernement- BPG (Government Printing Office - GPO) est d’offrir un accès permanent aux publications électroniques du gouvernement fédéral des États-unis, en accord avec le principe américain selon lequel les citoyens doivent avoir un accès libre à l’information gouvernementale. Selon les règles de droit et la tradition, le GPO rend disponible, depuis 1813, les publications officielles des trois branches du gouvernement fédéral : l’organe législatif (le Congrès), l’organe judiciaire et l’organe exécutif. Sont considérés comme documents juridiques les lois, les rapports et les auditions du Congrès, les archives du Congrès, les lois à caractère public ou privé, le Code américain, le registre fédéral, le Code des règlements fédéraux, les décisions de la Cour suprême, les rapports et les documents de l’agence fédérale.
Le GPO travaille au développement d’un nouveau modèle pour la publication des documents gouvernementaux, basé sur l’utilisation des nouvelles technologies de l’information. Il s’agit de mettre en place une base de données informatique de tous les documents du gouvernement
fédéral existants, qui seront diffusés par différents média, pour des fins d’impression ou pour une publication sur Internet. Le BPG entend jouer un rôle de leader en ce qui concerne la création de standards pour la publication électronique des documents officiels du gouvernement des
États-unis. Cet objectif inclut, d’une part, la collecte et la création de collections électroniques insérés dans une base de données structurée et uniforme, afin d’assurer l’authentification des documents publiés sur Internet et de préserver l’information pour un accès libre permanent. D’autre part, cela implique le développement d’outils de
recherche pour la base de données, l’ identification de meta-données et d’URLs permanents (PURLs) et l’organisation de formations continues aux bibliothécaires.
Texte intégral
Le projet GPO visant à conserver l’ensemble des données juridiques publiques Américaines
Mercredi 3 novembre 2004.
Claire M. GERMAIN
Bibliothécaire Edward Cornell et professeur de droit
Cornell Law School, Ithaca, New York -U.S.A.
Sommaire : L’objectif poursuivi par le Bureau des Publications du Gouvernement- GPO (Government Printing Office) est d’offrir un accès permanent aux publications électroniques du gouvernement fédéral des États-Unis, en accord avec le principe américain selon lequel les citoyens doivent avoir un accès libre à l’information gouvernementale. Selon les règles de droit et la tradition, le GPO rend disponible, depuis 1813, les publications officielles des trois branches du gouvernement fédéral : l’organe législatif (le Congrès), l’organe judiciaire et l’organe exécutif. Sont considérés, entre autres, comme documents juridiques les lois, les rapports et les auditions du Congrès, les travaux préparatoires du Congrès, les lois a caractère public ou privé, le Code américain, le registre fédéral, le Code des règlements fédéraux, les décisions de la Cour suprême, les rapports et les documents de l’agence fédérale.
Introduction
L’objectif poursuivi par le Bureau des Publications du Gouvernement- GPO (Government Printing Office-GPO) est d’offrir un accès permanent aux publications électroniques du gouvernement fédéral des États-unis, en accord avec le principe américain selon lequel les citoyens doivent avoir un accès libre à l’information gouvernementale. Cette contribution examine la mission et l’histoire du GPO, le site Internet du GPO, GPOAccess, l’Archive Electronique du Programme Dépositaire des Bibliothèques (FDLP/EC) puis décrit l’ambitieux projet de numérisation et de conservation de toutes les publications officielles des trois branches du pouvoir fédéral, passées, présentes, et à venir.
I.Mission et Histoire du Bureau des Publications du Gouvernement des États-Unis- GPO. [1]
Mandat législatif et tradition
C’est en 1813 que le Congrès Américain édicta une loi qui demandait au GPO de diffuser des informations sur le travail des trois branches du pouvoir aux citoyens américains. Depuis cette époque, le GPO diffuse les publications officielles des trois branches du pouvoir fédéral, l’organe législatif, l’organe judiciaire, et l’organe exécutif. C’est la ressource principale et centralisée du gouvernement fédéral pour recueillir, cataloguer, produire, donner accès, et préserver l’information publiée sous toutes ses formes, toujours avec des standards de spécifications uniformes.
Le corpus du GPO depuis 1813 comprend les publications de l’organe législatif (le Congrès), l’organe judiciaire , et l’ organe exécutif. Les exemples de documents juridiques sont les Projets de lois.(Bills), les Rapports (committee reports) et les auditions (hearings) du Congrès, les Débats parlementaires (Congressional Record), le journal le plus demandé pour la numérisation de tous les documents, les Travaux préparatoires. (Legislative history) , les Lois à caractère public ou privé. (Public and private laws), le Code américain (U.S. Code), les Décisions de la Cour suprême, le Registre fédéral (Federal Register), le Code des règlements fédéraux (Code of Federal Regulations), les Rapports et documents des agences fédérales. EPA (Environmental Protection Agency), FAA (Federal Aviation Administration), etc. D’autres documents particulièrement importants sont par exemple le U.S. Government Manual, guide utile de toutes les agences fédérales, et le Statistical Abstract, avec toutes sortes de statistiques gouvernementales
Ces publications sont disponibles à la vente, mais aussi envoyées aux bibliothèques dépositaires, environ 1,300, grâce au système de bibliothèques dépositaires (Federal Depository Library Program) qui en échange, demande à ces bibliothèques de distribuer ces documents au public gratuitement, sous toutes ses formes, support papier, microforme, et électronique. [2]
Avec l’évolution des technologies, le GPO a aussi évolué. Par exemple, il a adopté la technologie des microfiches et les cd-rom. Le GPO a toujours maintenu des standards gouvernementaux uniformes. La distribution électronique des documents par l’Internet est arrivée au début des années 1990. Personne, à l’intérieur du gouvernement, ou à l’extérieur, n’a anticipé la révolution dans la publication qui allait se produire. Personne n’a vraiment imaginé qu’un jour les documents imprimés allaient devenir secondaires, ou même être remplacés par les documents crées numériquement (sans équivalent sur papier : born digital) et distribués de façon électronique directement de leur source.
Personne n’a imaginé l’impact de la micro édition sur la création, diffusion, et préservation de l’information du gouvernement fédéral. Avant l’invention des moteurs de recherche faciles à utiliser pour faire des recherches sur le texte intégral, on s’accordait à penser que l’objectif était de placer des pages “typeset” (dactylographiées, "tapuscrites") équivalentes aux pages imprimées dans une base de données électronique, sur laquelle on pourrait faire des recherches au moyen d’une table des matières sur un écran d’ordinateur. Au début, il n’y avait que des petites maisons d’édition qui offraient des recherches sur texte intégral. En conséquence, aujourd’hui, on assiste à une remise en question des standards de publication du gouvernement. Aujourd’hui, grâce à la facilité de créer une nouvelle publication sur un ordinateur, les agences fédérales publient directement sur le web, sans passer par la bureaucratie du GPO. En même temps, le public n’a plus droit à la disponibilité fiable des documents officiels du gouvernement américain. Cela empêche aussi les générations à venir d’avoir les documents originaux et fiables (accurate record) du gouvernement américain.
Si la mission fondamentale du GPO n’a pas changé, les moyens ont changé. Ce que GPO essaie de faire aujourd’hui est de construire un nouveau modèle pour les publications gouvernementales, fondé sur la technologie numérique, et en fonction des critères suivants :
(1) Accès public sans entraves à l’information officielle du gouvernement et
(2) l’assurance de la mémoire perpétuelle et authentique du travail du gouvernement.
II.Projet de Numérisation et de Conservation.
Site Web du GPO/GPO Access
Le site web du GPO (GPO Access) [3] existe depuis juin 1994, conformément à l’autorisation du Congres des Etats-Unis de distribuer les documents du gouvernement américain en format électronique en 1993 [4]. Quelques statistiques sont utiles pour donner un ordre d’idée sur l’état des publications [5]. Les titres ajoutés en 2004 par le GPO ou par les agences fédérales s’établissent à 21,073 documents en ligne ajoutés, et 11, 275 documents “tangibles” ajoutés, c’est à dire imprimés ou sur microfiche. Cela fait un total de 32,348 documents, dont. 65% en ligne. En tout, GPO Access a en 2004 un total de 110,690 documents. Si l’on ajoute les titres accessibles sur GPO Access par un lien Internet, on en arrive à 275,970 titres. Tout le monde s’accorde à dire que la publication numérique offre un plus grand service aux citoyens, car un meilleur accès public à l’ information gouvernementale.
Collection électronique FDLP/EC
L’Archive Electronique du Programme Dépositaire des Bibliothèques (Federal Depository Library Program Electronic Collection (FDLP/EC)) [6] a été créé pour offrir un accès public et permanent aux publications officielles du gouvernement américain. C’est une archive de publications qui sont identifiées, et décrites comme faisant partie de l’archive, mais qui ne font pas partie du corpus du programme dépositaire. Les utilisateurs seront ainsi aiguillés vers le serveur de l’agence fédérale qui publie le document, tant que la publication est disponible. Quand la publication n’est plus disponible de la source même, les utilisateurs seront dirigés automatiquement vers l’Archive FDLP.
Nouveau modèle de publication
Le nouveau modèle de publication consiste en une base de données informatique. Pour la première fois dans l’histoire du GPO, une base de données complément numérique de tous les documents du gouvernement américain connus est maintenant envisagée pratiquement, de telle sorte que l’on puisse rechercher de manière électronique, avec la possibilité de montrer sur un écran la copie imprimée si elle existe. On peut construire une telle banque de données pour des objectifs multiples, dont produire des documents imprimés à la demande (on demand) et diffuser des documents officiels du gouvernement sur l’internet.
L’ impression à la demande (print on demand, POD) est un type de technologie d’impression qui permet aux livres d’être produits en toute petite quantité, plutôt qu’en "large offset print runs". C’est une technologie utile pour éviter des surplus d’inventaires, et aussi pour produire des copies physiques ("tangibles") de titres qui ne sont pas disponibles autrement. Ils doivent être d’une taille standard, sans trop de couleurs, etc. [7]
Mise en Oeuvre du Projet
La tache du GPO est de devenir un leader pour créer des standards numériques pour les documents officiels du gouvernement américain. Cela veut dire recueillir et produire des documents électroniques dans une base de données structurée de manière uniforme, pour pouvoir authentifier les documents diffusés sur l’Internet, et conserver l’information pour un accès public permanent. Ce nouveau système pour gérer le contenu des publications officielles s’organise autour de quatre pôles :
1. Vérifier et suivre (tracks) les versions d’un texte pendant son cycle de vie complet. Suivre les différentes éditions, et versions, et la relation entre les différentes versions du même contenu, dans une base de données structurée et uniforme
2. Assurer l’authenticité des documents publies sur l’Internet. Vérifier que le contenu électronique est authentique ou officiel, et certifier cela aux utilisateurs accédant au contenu.
3. Assurer la validité des techniques d’authentification. Vérifier l’authenticité, et déterminer si le contenu est officiel. Certifier le caractère officiel ou authentique du contenu, y compris certifier que certaines sections ou parties d’un document sont officielles (moyen connu sous le nom de “granularité”).
4. Conserver le contenu. La conservation est la préservation et la maintenance des produits de l’information dans le temps, pour utilisation dans leur forme originale ou dans une autre forme vérifiable et utilisable. Des précautions doivent être prises en cas de désastre (disaster recovery), et il s’avère nécessaire d’avoir des systèmes de remplacement (back ups). Le GPO a négocié un accord avec une société privée, EdgeSuite, service de Akamai Technologies, qui se spécialise dans les services de disaster recovery, et débutera en mars 2006. Le GPO utilise déjà Akamai. GPO “akaimizes” les documents en ligne quand il y a surcharge, par exemple, quand le rapport de la Commission 9.11 (11 septembre 2001) est sorti en ligne, GPO n’aurait pas pu soutenir le flot de demande, 1.2 million dans les quelque premières semaines sans utiliser ce service.
La création de cette base de données s’accompagne du développement d’outils de recherche, de l’identification de méta-données, aussi de la création d’ URLs permanents (PURLs). Il ne faut pas oublier l’élément humain. Il est très important d’organiser des formations continues, et une augmentation de la formation des bibliothécaires, pour qu’ils puissent mieux servir les besoins d’information de leurs clients. .
Projets GPO (GPO) Collection of Last Resort
Le GPO a adopte le concept d’une collection of last resort [8], désormais bien connue : “Collection nationale des documents du gouvernement américain,” avec des archives légères, et des archives lourdes. Ce grand projet vise à numériser la collection nationale des documents du gouvernement américain, et créer une collection permanente des versions finales et officielles des publications du gouvernement américain sous tous ses formats, avec l’objectif de donner un accès global, à jour, permanent et public, en utilisant des standards reconnus et les meilleures pratiques (best practices), ainsi que des méta-données. Ce projet sera fait pour l’accès, et aussi pour assurer la conservation d’une copie de tous les documents. L’accès à tous les documents sera garanti dans plusieurs endroits (archives légères). La conservation de tous les documents sera assurée dans au moins deux établissements sûrs, un à l’Est, et un autre à l’Ouest des Etats-Unis, qui garderont une archive lourde de tous les documents. Ces documents ne seront pas accessibles au public. Le GPO envisage de créer une copie physique (papier ou high resolution computer-output-microfilm) des documents qui n’ont pas d’équivalent en copie imprimée [9].
Mise en oeuvre des méthodes de conversion
Les documents "tapuscrits" sont convertis en base de données dans la nouvelle base de données de GPO Access. Le prototype a été le “Congressional Record.” (Débats de l’Assemblée), le titre le plus demandé pour la numérisation. Les tomes de 1999 ont été convertis à partir de documents “tapuscrit” en une base de donnée WAIS. Le même procédé est utilisé pour Statutes at Large et pour les U.S. Reports.
Le contenu de cette base de données est organise en trois catégories :
(1) Contenu converti : Ce contenu provient de documents "tangibles" (ayant une existence concrète) qui peuvent ensuite être conservés et dérivés vers de nouveaux produits numériques ;
(2) Contenu moissonné. Les documents numériques sont publiés tout d’abord directement sur les sites web des agences fédérales, puis mis dans le système, conformément aux standards numériques ; et
(3) Contenu déposé. Le contenu numérique est mis dans le système par les agences fédérales pour sa conservation et son accès.. La mise à disposition du contenu se fait, soit par un contenu imprimé (tangible, hard copy), ou bien par une présentation numérique. .
Partenaires
Le GPO a l’intention de travailler avec ses bibliothèques partenaires pour développer ce nouveau modèle d’accès gratuit à une base de données complètement électronique de tous les documents du gouvernement américain, passés, présents et futurs, ainsi qu’à une amélioration des instruments de recherche. Les bibliothèques partenaires incluent les Archives Nationales (National Archives and Records Administration (NARA)), la Bibliothèque du Congrès (Library of Congress), d’autres bibliothèques nationales, des Bibliothèques américaines partenaires, ainsi que des organisations comme ARL (American Research Libraries). Il y a d’ores et déjà plusieurs marques d’activité des bibliothèques dans ce domaine. Certaines bibliothèques ont ainsi déjà numérisé certaines collections, par exemple, la bibliothèque de l’Université du Michigan a numérisé les documents du Président (Public Papers of the President) [10]. La bibliothèque de l’Université du Texas du Nord produit un Cyber-cimetière (Cybercemetery), en collaboration avec le GPO, afin de mettre à disposition en ligne les publications électroniques des agences qui ont cessé leurs opérations [11]. Une question qui se pose, est de savoir si le GPO acceptera le travail déjà fait par les bibliothèques qui ne sont pas à leur niveau de standard.
Conservation des documents des États
Un effort similaire est en cours de réalisation dans les cinquante États des États-Unis, d’une manière décentralisée, puisque chaque État est indépendant pour la production, la diffusion, et la conservation de ses documents. L’AALL a publié un rapport très utile sur les efforts en cours dans tous les États [12].
Conclusion
La vision stratégique de GPO en 2004 est résolument moderniste, particulièrement la déclaration que “l’impression comme moyen prédominant pour l’échange d’informations pendant des siècles a été remplacée par les technologies d’information électronique.” [13]
Le Plan de GPO prévoit la numérisation à la fois pour l’accès et pour la conservation. GPO a donné un Plan Stratégique au Congrès le 1er décembre 2004, qui prévoit un budget presque totalement pour la publication électronique des documents. Toutes les bibliothèques ont été invitées à faire des choix prioritaires pour la numérisation des documents et d’autres commentaires.
Le Plan GPO est une véritable révolution dans la transition vers un programme de FDLP numérique. Cela va changer le rôle des bibliothécaires qui doivent devenir des gestionnaires de services électroniques (comme avant, ils étaient des conservateurs de collections). La réaction des bibliothécaires a été positive. Il est capital de reconnaître l’importance des collections physiques et électroniques, ainsi que la nécessité de redondance des collections, d’une manière géographique [14].
Voir en ligne : Government Printing Office
[1] Cette partie du texte reflète les informations contenues dans des brochures produites par the GPO. Voir aussi http://www.gpoaccess.gov
[4] Public Law 103-40, the "Government Printing Office Electronic Information Access Enhancement Act of 1993,"
[5] . Statistiques pour l’annee 2004 (annee fiscale du 1 octobre 2003 au 30 sept. 2004) donnees par Judith Russell, Conservateur en Chef du GPO (Superintendent of Documents), a l’occasion de la reunion du Conseil des Bibliotheques Depositaires des Publications du Gouvernement Americain, qui donne des conseils a l’Imprimeur public, M. Bruce James (Public Printer).
[6] Voir “Managing the FDLP Electronic Collection. A Policy and Planning Document,” Second Edition. U.S. Government Printing Office. Washington, D.C. DRAFT June 18, 2004
[7] http://www.gpoaccess.gov/pod/index.html A service of the U.S. Government Printing Office.Last updated : September 28, 2004
[8] Collection of last resort. http://www.gpoaccess.gov/about/repo...
[9] Email de Judith Russell, Novembre 2004.
[12] State-by-State Report on Permanent Public Access to Electronic Government Information. Government Relations Committee and Washington Affairs Office American Association of Law Libraries, June 2003.
[13] Strategic Vision for the 21st Century 10, http://www.gpo.gov/congressional/pd... (Dec. 2004). Visite le 14 janvier 2005.
[14] Pour plus de renseignements, voir le Rapport annuel de GPO 2004 http://www.gpo.gov/congressional/in....