creator ihw@cs.waikato.ac.nz public true beta false groupsize 200 supercollection cltext-e cltbib-e searchtype form plain indexes text metadata plugin ZIPPlug plugin BibTexPlug plugin GAPlug plugin ArcPlug plugin RecPlug -use_metadata_files classify AZList -metadata Title classify AZCompactList -metadata Author -buttonname Creator classify DateList format VList "
_AuthoredBy_: | [Creator] |
_PaperTitle_: | [Title] |
_Editors_: | [Editor] |
_EditorRole_: | [EditorRole] |
_BookJournalTitle_: | [Booktitle] |
_In_: | [Journal] |
} {If}{[Number], _Number_ [Number] } {If}{[Volume], _Vol_ [Volume]} {If}{\"[Volume][Number]\", | |
_MeetingDate_: | [MeetingDate] |
_MeetingPlace_: | [MeetingPlace] |
_PublicationPlace_: | [PublicationPlace] |
_Publisher_: | [Publisher] |
_PublicationDate_: | [Month] [Year] |
_Pages_: | [Pages] |
_DocType_: | [DocType] |
_LocationURL_: | [Location] |
_Annotations_: | [Notes] |
_Abstract_: | [Abstract] |
_Keywords_: | [Keywords] |
The purpose of the collection, whose name is \"cltext-e\", is to illustrate Greenstone\'s \"supercollection\" facility.\n
It is a very small collection with only _about:numdocs_ documents, as you can see by clicking the titles a-z button. It has the same structure as the much larger bibliography collection, except that there is no phrases button (because it\'s far too small for a phrase index to make sense).\n
The collection configuration file is just the same as that for the bibliography collection (which is called \"cltbib-e\"), except for one small but crucial difference: a line that states\n
supercollection cltext-e cltbib-e\n
This only affects searching, not browsing. It means that when you do a search, the cltbib-e collection is automatically searched as well. For example, if you look in the titles a-z list you will see that a couple of the items are about \"genetics\". But if you search for genetic you will find that 38 documents match the query. That\'s because the same search in the bibliography collection finds 36 documents.\n
Supercollection has two principal uses. One is when a collection is be continually updated with new material, but is impractical to rebuild after each addition. New material can be accumulated in a small supplementary collection that rebuilds very quickly. Periodically, the two are amalgamated and rebuilt. The main collection would contain a supercollection statement. (The present collection has a main \"bibliography\" and a smaller \"supplement\", but here -- because of the way we have decided to explain it -- the supercollection statement is in the wrong collection!)\n
Supercollection is also useful for gigantic collections. Ordinary Greenstone collections can be very large -- we have built one with 11 million short documents, and another with 7 GB of text. However, gigantic collections may have be split up. One smaller-scale example is a collection of over a million small documents that is delivered on 5 CD-ROMs, each of which works individually as an independent Greenstone collection. When several are insalled on the hard drive, they can be searched together as a seamless unit.\n
The supercollection facility only works for searching. The present collection, when browsed, is very small; but when searched it is much larger. We have found that browsing is of limited use for very large collections anyway. For example, in the above-mentioned CD-ROM collection, there are no browsing buttons, only searching.\n
In the present example the two collections have precisely the same structure. Supercollection still works even if they are different. Each collection appears as it would normally, and cross-collection searching works as expected. When documents are displayed, they\'re shown according to the format defined in the collection to which they belong.\n
Each collection can be used individually by following the instructions below (which Greenstone generates automatically).\n
Le but de la collection dont le nom est \"cltext-e\", est d'illustrer la fonctionnalité \"supercollection\" de Greenstone.
C'est une petite collection avec environ seulement _about:numdocs_ documents, comme vous le voyez en cliquant le bouton titles a-z. Elle a la même structure que la plus grande Bibliography Collection, excepté qu'il n'y a pas de bouton phrase (parce qu'elle est beaucoup trop petite pour qu'un index d'expression ait un sens).
Le fichier de configuration de la collection est le même que celui de la collection de bibliographies (qui est appelé \"cltbib-e\"), excepté une petite mais cruciale différence: une ligne qui stipule
supercollection cltext-e cltbib-e
Ceci affecte seulement la fonction \"rechercher\", mais pas \"parcourir\". Ceci signifie que quand on effectue une recherche dans la collection, une recherche est automatiquement effectuée dans la collection cltbib-e aussi. Par exemple, si vous regardez dans la liste titles a-z, on voit que quelques éléments sont sur \"genetics\". Mais si on recherche genetic, on trouvera 38 documents qui traitent le sujet. C'est par ce que la même recherche dans la collection de bibliographie trouve 36 documents.
Supercollection a deux principales utilisations. L'une est quand la collection est continuellement mise à jour avec du nouveau matériau, et qu'il n'est pas pratique de reconstruire la collection après chaque ajout. Les nouveaux matériaux peuvent être accumulés dans une petite collection supplémentaire qu'on peut reconstruire très rapidement. Périodiquement, les deux sont unifiées et reconstruites. La collection principale contiendrait une déclaration supercollection. (La présente collection possède une \"bibliographie\" principale et un \"supplément\" plus petit. Mais ici -- à cause dela manière dont nous avez décidé de l'expliquer -- la déclaration supercollection n'est pas dans la bonne collection!)
Supercollection est aussi utile pour les collections gigantesques. En général, les collections Greenstone peuvent être très grandes. Nous en avons construit une avec 11 millions de courts documents et une autre avec 7 GB de texte. Cependant, les très grandes collections peuvent être segmentées. Un exemple a échelle réduite est une collection de plus d'un million de documents qui est produite dans 5 CD-ROMs, chacune travaillant individuellement dans une collection Greenstone indépendante. Quand plusieurs de ces CD-ROMs sont installées sur le disque dur, on peut y effectuer des recherches comme s'ils formaient une seule unité.
La fonctionnalité \"supercollection\" ne marche que pour la recherche. Quand on parcourt la présente collection, on voit qu'elle est très petite. Mais quand on effectue des recherches sur elle, elle devient beaucoup plus grande. De toutes les façons, nous avons trouvé que parcourir de très grandes collections n'est que d'une utilité très limitée. Par exemple, dans la collection CD-ROM mentionnée ci-dessus, il n'y a pas de boutons pour \"Parcourir\" mais seulement pour \"Rechercher\".
Dans le présent exemple, les deux collections ont exactement la même structure. Supercollection fonctionne aussi même si elles sont différentes. Chaque collection apparaît comme elle le serait normallement, et la recherche \"inter-collection\" marche comme prévu. Quand des documents sont affichés, ils sont présentés selon le format défini dans la collection à laquelle ils appartiennent.
Chaque collection peut être utilisée individuellement en suivant les instructions ci-dessous (que Greenstone génère automatiquement).
El propósito de esta colección, cuyo nombre es \"cltext-e\", es ilustrar el programa \"supercolección\" de Greenstone.
Se trata de una colección muy pequeña con unos cuantos documentos _about:numdocs_, como se puede ver haciendo click en el botón de títulos de la \"a\" a la \"z\". Tiene la misma estructura que la colección bibliográfica más grande, excepto que ésta no cuenta con el botón de frases (ya que es demasiado pequeña para que el índice de frases tuviera sentido).
El archivo de configuración de la colección es el mismo que el de la colección bibliográfica (llamada \"cltbib-e\"), excepto por una pequeña pero muy importante diferencia: la línea
supercollection cltext-e cltbib-e\n Este enunciado sólo afecta a la búsqueda y no a los navegadores. Esto significa que cuando se hace una búsqueda también se busca automáticamente en la colección cltbib-e. Por ejemplo, si se mira en la lista de títulos de la \"a\" a la \"z\" se verá que un par de ítems son acerca de \"genética\". Pero si se busca genetic, entonces aparecerán 38 documentos. Esto se debe a que se encontraron al mismo tiempo 36 documentos en la colección bibliográfica.
La supercolección tiene dos usos principales. Una es cuando la colección se va actualizar continuamente con nuevos materiales, pero no resulta práctico reconstruirla después de cada adición. Los nuevos materiales se pueden acumular en una pequeña colección suplementaria que se reconstruye rápidamente. Periódicamente ambas colecciones se juntan y reconstruyen. La colección principal tendrá un enunciado de supercolección. (La presente colección tiene una \"bibliografía\" principal y un \"suplemento\" más pequeño, pero debido a la forma en que hemos querido explicarlo, aquí el enunciado de supercolección no está en la colección que le corresponde.)
La supercolección también es útil para colecciones de gran tamaño. Las colecciones Greenstone pueden ser muy grandes: una vez construimos una con 11 millones de pequeños documentos y otra con 7 GB de texto. Sin embargo, es posible que las colecciones de gran tamaño tengan que dividirse. Un ejemplo a pequeña escala es una colección de más de un millón de pequeños documentos que se distribuyen en 5 CD-ROMs, cada uno de los cuales trabaja de manera individual como una colección Greenstone independiente. De esta manera, cuando se instalan varios en la unidad de disco duro pueden buscarse como una unidad continua y sin interrupciones.
El programa de supercolección únicamente sirve para búsquedas. Cuando se explora la presente colección resulta muy pequeña, pero cuando se busca es mucho más grande. De cualquier manera hemos encontrado que los navegadores tienen un uso limitado para colecciones muy grandes. Por ejemplo, en el caso arriba mencionado de la colección en CD-ROM no hay botones que permitan realizar exploraciones, sólo búsquedas.
En el presente ejemplo las dos colecciones tienen precisamente la misma estructura. No obstante, el programa supercolección trabaja incluso si son diferentes. Cada colección aparece tal como lo haría normalmente y la búsqueda a través de las colecciones funciona como es de esperarse. Cuando los documentos aparecen en pantalla lo hacen de acuerdo al formato definido en la colección a al que pertenecen.
Cada colección puede usarse de manera individual siguiendo las instrucciones que aparecen a continuación (que Greenstone genera automáticamente).
Цель этой коллекции, имя которой \"cltext-e\", состоит в том, чтобы проиллюстрировать возможности \"суперколлекции\" Greenstone.
Это очень маленькая коллекция, содержащая только документы about:numdocs, что Вы можете видеть, щелкая кнопку titles a-z. Она имеет такую же структуру, что и гораздо большая библиографическая коллекция, за исключением того, что здесь нет кнопки phrases, поскольку она слишком мала для того, чтобы индекс фразы имел смысл.
Конфигурационный файл коллекции является таким же, каким он является для библиографической коллекции (которая называется \"cltbib-e\"), за исключением одного небольшого, но критического различия в строке состояния.
Supercollection cltext-e cltbib-e
Это затрагивает только поиск, но не просмотр. Это означает, что когда Вы делаете поиск, коллекция cltbib-e также автоматически подвергается просмотру. Например, если Вы просматриваете список titles a-z, Вы увидите, что несколько элементов коллекции относится к \"генетике\". Но если Вы проведете поиск по слову genetic, то Вы найдете, что 38 документов соответствуют этому запросу, тогла как тот же самый поиск в библиографической коллекции обнаружит только 36 документов.
Суперколлекция имеет два основных направления использования. Одно -- это, когда коллекция непрерывно пополняется новым материалом, но непрактично обновлять её после каждого дополнения. Новый материал может накапливаться в небольшой дополнительной коллекции, которая обновляется очень быстро. Периодически эти две коллекции объединяются и обновляются. Главная коллекция будет содержать оператор -- supercollection. Настоящая коллекция содержит -- \"библиографию\" и меньшую -- \"приложение\", но здесь из-за способа, который мы решили использовать для объяснения, оператор supercollection находится в неправильной коллекции(!).
Супперколлекция также полезна для гигантских коллекций. Обычные коллекции Greenstone могут быть очень большими -- мы создали одну, содержащую 11 миллионов коротких документов, и другую, содержащую 7 Gb текста. Однако гигантские коллекции могут быть раздробленными. Одним из примеров меньшего масштаба является коллекция, содержащая более миллиона небольших документов, которая поставляется на 5 CD-ROM, каждый из которых работает индивидуально как независимая коллекция Greenstone. Когда несколько из них инсталлированы на жестком диске, в них может проводиться поиск как в едином массиве.
Средства суперколлекции предназначены только для поиска. Данная коллекция, когда ее просматривают, очень мала, но когда в ней производится поиск, она значительно больше. Мы обнаружили, что просмотр так или иначе имеет ограниченное использование для очень больших коллекций. Например, в вышеупомянутой коллекции на CD-ROM нет никаких кнопок просмотра, а имеются только поисковые.
В представленном примере эти две коллекции имеют одинаковую структуру. Суперколлекция продолжает работать, даже если они имеют отличия. Каждая коллекция появляется как обычно, и поиск в объединенной коллекции возможен, как и ожидалось. Когда документы выходят на монитор, они выглядят согласно тому формату, который определен в коллекции, к которой они принадлежат.
Каждая коллекция может использоваться самостоятельно, если следовать инструкциям, приведенным ниже, которые Greenstone генерируют автоматически. "