★ APPLICATIONS ★ BUREAUTIQUE ★ RECHERCHE DOCUMENTAIRE (CPC REVUE) ★ |
Recherche Documentaire (CPC Revue) | Applications Bureautique |
Pour la première difficulté, votre microordinateur ne vous sera d'aucun secours. Par contre, la deuxième peut lui être confiée si vous lui offrez un système de Recherche Documentaire efficace et d'utilisation agréable. Le système de Recherche proposé ici, permet de résoudre le problème d'accès à l'information d'une documentation volumineuse si vous avez pris la précaution :
Notez que ce système ne vous rendra que les services que vous lui aurez inculqué, par la richesse du dictionnaire en MOTS CLES et l'assiduité à cataloguer tous les documents concernés. Alors, il pourra répondre efficacement à une question, si elle se situe dans le domaine de votre documentaion, en vous proposant les DOCUMENTS les plus pertinents sur le sujet recherché. DEFINITIONS Il est tout d'abord nécessaire de définir les objets manipulés par le système, et les notions plus larges qu'ils peuvent recouvrir. L'ensemble de la documentation est composée de REVUES. Ces objets peuvent être réellement des revues (au sens publications) ou, au sens plus large, les éléments indissociables physiquement, qui constituent votre documentation. Une REVUE porte un nom, limité à 6 caractères, unique dans le système. Il peut donc être nécessaire de choisir une abréviation du nom réel de la REVUE afin de le ramener à 6 caractères significatifs. Chaque REVUE se compose d'un certain nombre de DOCUMENTS. Ce peut être un article (d'une publication), ou le plus petit élément identifiable dans le système, dans un sens plus large. Chaque DOCUMENT se compose :
Le DOCUMENT, objet central du système, est donc totalement identifiable par un TITRE dans une REVUE. PRINCIPE DE FONCTIONNEMENT Le but de la recherche est de fournir les identifications de DOCUMENTS (REVUE et TITRE), qui répondent à une demande de renseignements quelconque, qu'un utilisateur sollicite auprès de la documentation. Pour cela, Il faut au préalable que le gestionnaire de la documentation ait saisi les informations relatives à l'ensemble des documents concernés. Il faut aussi que la demande puisse être formulée par une association de MOTS CLES (maximum 4) du dictionnaire du système. Alors, les DOCUMENTS visés par l'association de ces MOTS CLES par ET logique, sont listés et représentent la réponse que peut fournir la documentation à la demande de renseignement. Il est donc important de souligner ici l'importance des MOTS CLES dans le système. De la pertinence de leur définition et de leur bonne utilisation dans la formulation des questions, dépend la qualité de la réponse rendue. La phase de définition, lors de la CREATION D'UN DOCUMENT doit donc être effectuée avec le plus grand soin, en tenant compte, en particulier, des MOTS CLES déjà présents dans le dictionnaire. Quelques règles de définition de MOTS CLES peuvent être citées pour exemple : — un nouveau MOT CLE ne doit être introduit au dictionnaire que s'il représente un concept inconnu jusqu'alors ; — il est souvent nécessaire d'introduire des MOTS CLES "synonymes" pour le domaine couvert par la documentation. Cette méthode facilite en effet souvent la formulation des questions. Dans ce cas, tous les synonymes doivent être associés aux mêmes DOCUMENTS. — Il est indispensable d'établir des règles grammaticales d'écriture des MOTS CLES. En effet, leur reconnaissance dans le dictionnaire par le système impose une écriture identique (par exemple : noms au singulier, adjectifs au masculin singulier,...). Ces règles sont en fait à définir par chaque gestionnaire de documentation et constituent la première phase préalable d'analyse. UTILISATION Initialisation de la disquette de données Lors de votre première utilisation du logiciel, les fichiers supports des informations DATA et INDEX doivent être initia-lisés sur une disquette. La méthode à suivre est la suivante :
Votre disquette de données est alors ini-tialisée et le logiciel de Recherche Documentaire peut fonctionner sur cette disquette. Chaque utilisation pourra enrichir ces fichiers et il ne faudra jamais les réinitialiser. Saisie des programmes Deux programmes BASIC sont à saisir :
150 maxbuf = 15 'nb max buffers résidents Ces limitations sont dues à la faible taille mémoire des CPC 464 et 664. Enfin, ils sauvegardent le programme ainsi obtenu sous le nom DOC464 et ils ont terminé. Remarque : les programmes DOCUMENT et DOC6128 (ou DOC464) doivent impérativement se trouver sur la même disquette. Par contre, la disquette de données peut être différente. Lancement de l'exécution Avant de lancer l'exécution, il est nécessaire de réinitialiser le micro et de charger le logiciel BANKMAN pour le 6128 (face 1 disquette système 1). Puis, faire RUN "DOCUMENT ; programme que vous venez dè saisir. L'écran de présentation apparaît et immédiatement il vous demande le type de CPC par la question "CPC 6128 O/N". Dans le cas d'une réponse (O)ui, il vérifie que BANKMAN a bien été chargé et dans le cas contraire, il s'arrête immédiatement. Il ne vous reste plus qu'à reprendre ce paragraphe, mais plus lentement. Si vous répondez (N)on, le nombre maximal d'enregistrements INDEX que vous voulez charger est demandé. Il est limité à 200 et permet de structurer la zone INDEX. Puis le logiciel binaire de gestion des INDEX est chargé. Le progamme principal correspondant au CPC choisi (DOC6128 ou DOC464) est alors lancé. Sa première opération est de vous demander d'introduire la disquette de données qui contient les fichiers DATA et INDEX, puis de charger en mémoire la totalité de l'INDEX. Enfin, le menu principal du svstème de Recherche Documentaire est affiché. Celui-ci est du type menu descendant : donc le déplacement s'effectue par la barre espace et la sélection de l'option en inverse vidéo par la touche RETURfJ. Principes généraux Si l'option "fin de traitement" est exclue, les autres options peuvent être classées en 2 types :
Les options de type listes peuvent à tous moments être interrompues dans leur déroulement par la frappe de la lettre "F". De plus, les options lister une revue et rechercher par mots clés, permettent d'éditer le document affiché avant de passer au document suivant de la liste par la frappe de la lettre "E". Une mise en page standard de l'édition d'un document a été retenue et est automatiquement activée sur toute demande d'édition. Sur un écran de saisie d'information, la frappe de la touche RETURN, sans avoir saisi aucun autre caractère „ permet d'abandonner l'option et de revenir au menu supérieur. Une présentation standard d'un document à l'écran a été retenue. Toutes les options qui affichent un document utilisent cette présentation. Les options n'utilisant qu'une partie des informations d'un document, n'affichent que la partie concernée. CREATION, MODIFICATION OU SUPPRESSION D'UN DOCUMENT, D'UNE REVUE Création d'un DOCUMENT L'écran général de présentation d'un document est affiché, vide. Sont à saisir :
foute saisie se termine par la frappe de a touche [RETURN], 2IRETURN] consécutifs dans la fenêtre CLES provoque le aassage du curseur dans la fenêtre RESUME. Un [RETURN] dans la fenêtre REVUE vide, provoquent le retour au menu principal. La frappe du mot réservé "SOS" dans une zone quelconque de saisie provoque la réinitialisation de l'écran. Ceci est la seule possibilité pour corriger des fautes de frappe dans les fenêtres supérieures. Le [RETURN] à la fin du RESUME entraîne une prise en compte automatique du DOCUMENT saisi, et un nouvel écran vide est proposé afin de poursuivre éventuellement la création de DOCUMENTS. A partir de cet instant, le DOCUMENT est disponible dans l'ensemble des options du menu. S'il doit être modifié, il faut alors choisir l'option "modifier un document". Modification d'un DOCUMENT Un DOCUMENT du système d'information étant identifié par son TITRE dans une REVUE, la fenêtre REVUE est affichée afin de proposer tous les DOCUMENTS qui la constitue. Après saisie de la REVUE, tous ses DOCUMENTS sont successivement affichés avec la question DOCUMENT A MODIFIER ?. La réponse ne peut être que O ou N, pour Oui ou Non. Si la réponse est Non, alors le DOCUMENT suivant de la REVUE est proposé. Dans le cas d'une réponse Oui, alors sont modifiables :
Chacune de ces zones est d'abord effacée et le curseur y est positionné. La frappe de [RETURN] indique que la zone ne doit pas être modifiée et l'ancienne valeur est réaffichée. La frappe du mot réservé "SOS" dans une de ces zones provoque le réaffichage du DOCUMENT d'origine. Enfin, le [RETURN] qui suit le résumé entraîne la prise en compte du nouveau DOCUMENT dans le système et l'affichage du DOCUMENT suivant de la REVUE. Lorsque l'affichage de la REVUE est épuisé, la fenêtre REVUE est proposée ce qui permet de poursuivre dans l'option "modifier un document" ou de revenir au menu principal par [RETURN]. Suppression d'un DOCUMENT Comme pour l'option "modifier un document", le nom de la REVUE est demandé afin de proposer tous ses DOCUMENTS successivement à la suppression. Chaque DOCUMENT est affiché avec la question DOCUMENT A SUPPRIMER ? La réponse ne peut être que 0 ou N, pour Oui ou Non. Dans le cas d'une réponse Non, alors le DOCUMENT suivant de la REVUE est affiché. Dans le cas d'une réponse Oui, le DOCUMENT affiché est totalement supprimé du système d'information, sans possibilité de le retrouver. La réponse à la question doit donc être faite avec le plus grand soin, car elle peut entraîner des pertes d'informations très rapides. Le DOCUMENT suivant de la REVUE est ensuite affiché et lorsque la fin de la REVUE est atteinte, une fenêtre REVUE est à nouveau proposée pour poursuivre dans l'option suppression, ou revenir au menu principal dans le cas de la frappe de RETURN. Suppression d'une REVUE Le nom de la REVUE est demandé afin de supprimer tous les DOCUMENTS qui la constituent. Compte tenu de la puissance de cette option, le système demande une confirmation du nom de la REVUE saisi, avant d'effectuer l'opération. Le message CONFIRMEZ-VOUS OUI ou NON ? permet de réaliser la suppression par la réponse OUI ou de redemander le nom de la REUVE par la réponse NON. Dans le cas d'une réponse OUI, alors tous les DOCUMENTS de la REVUE sont successivement supprimés et pour chacun d'eux, le titre est affiché. Après la suppression du dernier DOCUMENT de la REVUE, un message donne le nombre de DOCUMENTS supprimés et le système attend la frappe d'un caractère quelconque pour afficher une nouvelle fenêtre REVUE. Il est à noter que lorsque l'opération de suppression est déclenchée après la réponse OUI, elle s'effectue en totalité sur toute la REVUE sans possibilité de l'interrompre. Son utilisation doit donc être faite avec le plus grand soin car elle peut provoquer des pertes importantes d'informations. RECHERCHE SUR MOTS CLES La fenêtre CLES est affichée et permet la saisie des MOTS CLES (maximum 4) sur lesquels va être effectuée la recherche. La frappe du mot réservé "SOS" provoque la réinitialisation de l'écran. Le système effectue sa recherche dès que la touche [RETURN] est frappée à la place d'un MOT CLE, ou dès que le quatrième est saisi. Il sélectionne les DOCUMENTS qui sont au moins liés à tous les MOTS CLES cités (ils peuvent être en relation avec d'autres MOTS CLES). Dans le cas où aucun DOCUMENT ne satisfait à la recherche, un message PAS DE DOCUMENTS POUR CES CLES est envoyé et la frappe d'une touche quelconque permet de réafficher une fenêtre CLES vide. Si un ensemble de DOCUMENTS sont sélectionnés, le premier de la liste est affiché. Une flèche — signale que d'autres DOCUMENTS ont été retenus. 3 possibilités sont offertes à ce niveau :
Remarques Le traitement de la recherche sera d'autant plus rapide, que le premier MOT CLE cité sera rattaché à un petit nombre de DOCUMENTS. Dans le cas où plus de 100 DOCUMENTS sont rattachés au premier MOT CLE, le système ne débute pas la recherche ; il est alors nécessaire de saisir ce MOT CLE au moins en deuxième position. LES LISTES Liste des DOCUMENTS d'une REVUE La fenêtre REVUE permet de saisir le nom de la REVUE à afficher. Tous les DOCUMENTS de la REVUE sont successivement présentés. Pour chacun d'entre eux, il est possible de l'éditer sur l'imprimante par la frappe de la touche "E". De même, la touche "F" arrête la liste et provoque l'envoi d'une fenêtre REVUE vide. Toute autre touche conduit à l'affichage du DOCUMENT suivant de la REVUE. Si aucun DOCUMENT n'a été trouvé pour la REVUE demandée, le message REVUE INCONNUE est envoyé et la frappe d'une touche quelconque réinitialise l'écran. Liste des MOTS CLES Cette option fournit un tableau représen tant la liste des MOTS CLES connus du système d'information et pour chacun d'entre eux, le nombre de DOCUMENTS qu'ils référencent. Le logiciel effectue donc une charge importante de travail avant de débuter l'affichage. Pendant ce temps d'attente, le message CONSTITUTION DE LA LISTE DES MOTS CLES apparaît. Puis les MOTS CLES apparaissent triés alphanumérique croissant avec arrêt en fin d'écran. La frappe de la touche "F" permet, à cet endroit, d'arrêter la liste, et toute autre touche la poursuit. Liste des REVUES Cette option fournit un tableau donnant la liste des noms des REVUES répertoriées dans le système d'information, triés alphanumérique croissant. Pour chaque REVUE, est également indiqué le nombre de DOCUMENTS qui la constituent. L'élaboration d'une telle liste nécessite la lecture de l'ensemble du fichier de données et représente un temps supérieur aux autres options. Pendant cette attente, le message CONSTITUTION DE LA LISTE DES REVUES est émis. Les mêmes options sont disponibles en fin d'écran de la liste :
LES EDITIONS Une édition standard d'un DOCUMENT a été retenue. Elle permet d'imprimer toutes les informations de celui-ci sous la forme : En plus les éditions "à la volée" possibles dans les options "rechercher par mots clés" et "éditer une revue", une option du menu principal permet d'imprimer des listes de DOCUMENTS sans affichage. Un sous-menu présente les options :
L'option 1 permet de revenir au menu principal. L'option 2 remplit la même fonctionnalité que "lister une revue" du menu principal mais les DOCUMENTS sont automatiquement envoyés sur l'imprimante (le nom de la revue n'est pas édité pour chaque DOCUMENT). Le nombre de DOCUMENTS contenus dans la REVUE est calculé et imprimé en fin de liste. L'option 3 est identique à l'option "rechercher par mots clés" du menu principal avec impression automatique de chaque DOCUMENT. En tête de liste, les critères de sélection sont rappelés et le nombre de DOCUMENTS extraits est édité en fin de liste. L'option 4 fournit les mêmes informations que l'option "lister les revues" du menu principal. L'option 5 donne les renseignements identiques à l'option "lister les mots clés" du menu principal. Pendant l'édition, il est toujours possible d'interrompre une liste par la frappe de la touche "F". STATISTIQUES Afin de connaître l'état du système d'information, une fonction statistique est proposée. Elle s'applique successivement à l'ensemble des DOCUMENTS puis à l'ensemble des MOTS CLES. Sur les DOCUMENTS 2 tableaux successifs sont donnés :
Sur les MOTS CLES Un tableau donne les nombres réels, annulés et totaux de MOTS CLES dans le système, ainsi que le nombre de MOTS CLES liés de 1 à 15, et + 15 DOCUMENTS. La constitution de ces tableaux statistiques par le système peut représenter un temps non négligeable puisqu'elle impose un parcours de la totalité des informations. Pendant ce temps, les messages CALCUL DES STATISTIQUES SUR DOCUMENTS puis CALCUL DES STATISTIQUES SUR MOTS CLES sont affichés. Entre chaque tableau, la frappe de la lettre "F" provoque l'arrêt de l'option statistiques et le retour au menu principal. Enfin, si des mises à jour des données du système ont été effectuées avant la demande de l'option statistiques, une sauvegarde des données modifiées (sauf les index) est automatiquement exécutée avant le début de l'option. REORGANISATION Cette fonction est un utilitaire système et est induite par l'organisation interne des données (voir le chapitre qui y est consacré). Elle est à déclencher périodiquement (après plusieurs sessions de modification ou suppression de DOCUMENTS), lorsque les nombres de DOCU MENTS annulés ou MOTS CLES annu lés donnés par les statistiques sont importants. Elle entraîne une diminution de la place occupée par les fichiers sur la disquette et un recalcul de la totalité de l'INDEX et des liens entre les fichiers DATA et INDEX. Son temps d'exécution peut être relativement long. 2 messages sont affichés pendant l'exécution : NB INDEX SUPPRIMES : n ND DATA SUPPRIMES : p Il n'est pas possible d'interrompre cette option lorsqu'elle est en cours. La frappe d'un caractère quelconque à la fin de l'option entraîne le retour au menu principal. Enfin, cette option provoque une sauvegarde automatique des mises à jour éventuelles faites avant son exécution. FIN DE PROGRAMME Cette option est la seule qui permette à l'utilisateur de sortir du logiciel. Elle assure une écriture sur les fichiers, des données éventuellement mises à jour au cours de toute la session. 2 messages informent l'utilisateur : SAUVEGARDE DES INDEX, SAUVEGARDE DES DATAS. Dans tous les cas, l'écran final donne le nombre total de DOCUMENTS et d'IN-DEX dans les fichiers. ORGANISATION ET FONCTIONNEMENT DU LOGICIEL Ce chapitre présente les principes fondamentaux du fonctionnement du logiciel. Il n'est bien sûr pas possible d'entrer dans la logique de chaque opération, mais il est nécessaire de décrire la technique générale afin de comprendre la structure des fichiers et des zones mémoire. La structure des fichiers peut être mise à profit par les utilisateurs pour développer des compléments d'application sur ces fichiers. Cependant, des opérations de mises à jour de ceux-ci doivent respecter leur structuration, faute de quoi leur utilisation ultérieure par le logiciel de Recherche Documentaire devient impossible. Structure des fichiers 2 fichiers sont présents sur la disquette de données, le fichier DATA et le fichier INDEX.
Apparaît ici l'explication des statistiques : le nombre de DOCUMENT total est celui qui apparaît sur le premier enregistrement du fichier DATA. Le nombre de DOCUMENTS annulés représente les DOCUMENTS avec REVUE = " ", qui ont été supprimés logiquement par l'application. Le nombre de DOCUMENTS réels est la différence entre les deux précédents, donc le nombre de ceux qui possèdent des données dans le fichier. • INDEX : il contient tous les MOTS CLES du système d'information et les références aux DOCUMENTS qui les citent. Il est structuré en enregistrement de longueur fixe (44 caractères) de la forme :
La zone débordement possède la même structure, mais représente un numéro d'enregistrement INDEX qui fait suite à l'enregistrement considéré. En effet, dès que plus de 5 DOCUMENTS citent le même MOT CLE, il y a lieu d'ouvrir un nouvel enregistrement appelé débordement pour celui-ci. Son numéro est mémorisé dans la zone débordement de l'enregistrement précédent. Ainsi un MOT CLE peut être représenté par une liste d'enregistrement INDEX dont la figure 3 donne un exemple. Les statistiques donnent le nombre d'enregistrements total du fichier INDEX, le nombre d'INDEX réels ou entrés dans le dictionnaire donc MOTS CLES, le nombre d'enregistrements annulés : débordements ne contenant que des 0. Le premier enregistrement du fichier INDEX contient le nombre total d'enregistrements dans le fichier. Fonctionnement Les options de consultation ne font qu'exploiter les structures de données précédemment définies et ne méritent pas une explication détaillée. Par contre, les opérations de création et de suppression de DOCUMENT justifient un développement particulier. La création de DOCUMENT consiste à rajouter un nouveau DOCUMENT à la fin du fichier DATA. Il portera donc comme numéro dans le système, le nombre total de DOCUMENT + 1, qui lui-même progresse de 1. Ses MOTS CLES sont recherchés dans le fichier INDEX. Si un MOT CLE est trouvé, il suffit de rajouter le numéro de DOCUMENT à la fin des références de ce MOT CLE, en créant peut-être un débordement. La liste des références de DOCUMENTS pour ce MOT CLE reste nécessairement triée puisque le numéro attribué au DOCUMENT est le plus grand du système, et il n'est pas nécessaire d'envisager une insertion dans la liste des références pour conserver le tri. Dans le cas où un mot clé n'est pas trouvé, une entrée pour celui-ci est créée dans le fichier INDEX, à la fin de celui-ci. Le nombre de MOTS CLES et les numéros d'entrée dans l'INDEX correspondants, sont mémorisés dans le DOCUMENT. La suppression de DOCUMENT utilise un algorithme très simple. Le DOCUMENT est réécri sur DATA avec l'information REVUE = " ". Sa référence est supprimée de toutes les entrées dans l'INDEX qui pointaient sur le DOCUMENT. Les listes de références correspondantes sont "tassées" et de ce fait, peuvent libérer des débordements. Ceux-ci sont alors détachés de la liste, mais leur place n'est pas récupérée, pour ne pas décaler de 1 les enregistrements suivants dans INDEX. Ce principe est identique dans le fichier DATA. L'opération de réorganisation permet de récupérer la totalité de ces emplacements logiquement libres, mais nécessite un recalcul complet des références dans INDEX et des numéros d'INDEX dans DATA. Enfin, notons que l'opération de modification est en fait traitée comme une suppression suivie d'une création. Elle change le DOCUMENT de place et de numéro dans DATA. Organisation mémoire du logiciel Afin d'améliorer les performances, un maximum d'informations résident en mémoire centrale. Plus généralement, nous pouvons dire que pendant son exécution, le logiciel traite des fichiers logiques qui se répartissent entre des zones mémoires et des fichiers physiques sur la disquette. Il est donc impératif de conserver la disquette de données en place pendant toute une session, faute de quoi, un plantage paraît quasi certain. La totalité du fichier INDEX est chargée en début de session. Toutes les modifications qu'il subit pendant la session ne sont pas sauvegardées sur la disquette, ce qui justifie les recommandations d'utilisation (voir le paragraphe correspondant). De la même manière, les créations et modifications de DOCUMENTS sont conservées dans des buffers mémoire résidents (30 pour le CPC 6128, 1 5 pour les autres CPC). Ce procédé optimise très largement l'efficacité de ces options car il évite de recopier immédiatement les nouvelles données sur la disquette. Par contre, il impose de purger ces buffers sn cours de fonctionnement lorsqu'ils sont saturés ou pour libérer de la place mémoire centrale. Toutes les options contrôlent ce point et déclenchent l'opération de sauvegarde des DATA si nécessaire. CE QUI PEUT ETRE MODIFIE Disons tout de suite qu'il n'est pas recommandé de modifier la plupart des algorithmes qui composent chaque option. Il faut admettre que ce logiciel représente un tel niveau de complexité qu'il n'est pas possible de toucher à tout (même l'auteur...). Par contre, il est envisageable d'adapter 3 points particuliers :
RECOMMANDATIONS ET LIMITATIONS Tout d'abord, rappelons qu'une phase d'analyse détaillée du sujet à documenter doit précéder l'utilisation de ce logiciel. "L'oubli" de celle-ci amènerait le logiciel de Recherche Documentaire à rendre des services peu appréciables. Ceci admis, la préoccupation principale devient le souci de sécurité. En effet, compte tenu de la complexité d'un tel outil, en particulier la structure des fichiers, il faut se garantir contre des phénomènes tels que fausses manipulations de disquettes ou coupure d'alimentation. Il est prudent, lors de mises à jour ou de manipulations importantes, de sauvegarder au préalable les versions des fichiers DATA et INDEX sur un autre support. Ceci peut être effectué par des utilitaires systèmes standard (tels que FILECOPY...). Ainsi, si une difficulté majeure survient, il est toujours possible de restaurer les versions sauvegardées, et refaire les manipulations exécutées depuis leur sauvegarde. Bien que cette procédure paraisse contraignante, elle doit être systématique. Il faut être conscient qu'un simple déphasage entre les versions de DATA et INDEX suffit pour entraîner la perte de la totalité des informations, peut-être des semaines de travail. Les limitations introduites sont soit théoriques (dues au logiciel) sont induites par les possibilités de la machine : taille mémoire centrale et volume disponible sur la disquette. Le nombre maximum théorique de DOCUMENTS dans le système est de 9999 (sa référence est toujours représentée par 4 caractères dans le fichier INDEX). Cependant, la capacité de la disquette et la taille mémoire qui serait nécessaire pour exécuter les options statistiques et réorganisation, rendent cette limite impossible à atteindre. En fait, quelques milliers (2 à 3) semblent possibles, mais aucune valeur ne peut être fournie car le volume disquette nécessaire dépend de la quantité moyenne d'informations rattachées à un DOCUMENT. Les limitations du fichier INDEX sont les suivantes :
Bonne documentation CPC n°22
|