Informationssökning
Informationssökning, hur man efter teorier och olika metoder, strukturerat söker efter information i databaser finns representerat i flera olika moment vid Borås bibliotekarieutbildning: bl.a i grundkursen 1-40 poäng och även i kursen Kunskapsorganisation på C-nivån.
Det finns flera olika typer av informationssystem:
1. Kommandostyrda system, t.ex DIALOG
2. Menybaserade system, t.ex Malmö stadsbiblioteks katalog (MALIN)
3 Fulltext-system, t.ex Alta Vista eller Mediearkivet
Det krävs olika sökmetoder för de olika systemen. Idag ökar den tredje sortens system medan de två övr. minskar i betydelse drastiskt. Sk. "Naturale language search" med total indexering av fulltext-dokument on-line är idag den mest dominerande formen för databas konstruktioner. Systemet innebär att man kan söka på vilket/vilka ord som helst, vilket dock inte innebär att man ej kan begränsa och ringa in sin sökning: använder man precisering och kombination av sökord, gäller fortfarande att man slipper en massa irrelevanta träffar som man måste plöja igenom!
Man kan definiera de idag två dominerade söksystemen efter de två söksätt man använder i resp. system:För att bygga upp en databas är det viktigt att tänka igenom hur ämnesdata skall struktureras: dessa är fält i posten som fungerar som hjälp att finna relevanta dokument för informationssökaren utifrån innehållsmässiga kriterier. Det finns explicita ämnesdata, t.ex ämnesord och klassificeringskoder. Vidare finns implicita ämnesdata, t.ex författare, titlar.
Hjörland definierar ämnesanalysen, vad i ett dokument skall synliggöras, värdering:
1. analys av ämnet-innehåll (läsning av dokumentet)
2. begreppskapande-viktiga begrepp i dokumentet
3. översätta begreppen till aktuellt IR-språk (dvs. informationssystemets språk)
Den subjektiva bedömningen av relevanta ämnesord är den viktiga processen som innebär att man strukturerar databasen så att information kan hittas på ett logiskt och enkelt sätt. Detta har blivit alltmer viktigt, ju större informationsmängden blir.
Soergel talar om systemanalys: användarbehovet och vilket material som skall in i databasen styr systemet. Det är menar författaren viktigt att använda problemlösning och beslutsfattande för konstruktion av ISAR (information storage and retriew system). Indexeringsspråket beskriver dokumentets ämnesinnehåll m h a descriptorer, dvs indexeringstermer som författare, titel, ämne osv.. Därför är det viktigt att IR-systemet hjälper användaren att se vikten i ett dokument med rätt sorts indexering och med descriptorer (användarorientering). Indexering i fulltext av hela dokumentet ställer till problem idag: om jag t.ex söker på "miljö* och japan*" i Alta Vista får jag fler 100.000-tals träffar, sökmotorn visar först alla dokument med ordet miljö (trunkerat) och sedan alla med ordet japan och sedan alla med båda sökorden i samma dokument.. Antalet irrelevanta dokument blir oftas stort, speciellt jämfört med strukturerade databser som t.ex SUNET eller Yahoo..
Litteratur:
Hjörland: The Concept of "Subject" in Information Science
Soergel: Organizing Information