Proces stjecanja znanja kao problem informacijskih znanosti

Boris Bosančić

Libellarium, IX, 1 (2016)

Izvorni znanstveni rad

DOI: http://dx.doi.org/10.15291/libellarium.v9i1.249

Sažetak

Kroz perspektivu osobitoga, problemskog stajališta, u radu je dan osvrt na nekoliko problema informacijskih znanosti koji se eksplicite spominju u literaturi. Riječ je o problemima informacijske eksplozije i informacijske poplave te poplave podataka, zatim informacijskog pretraživanja i relevantnosti informacija te, na koncu, problemu znanstvene komunikacije. Svrha je rada obrazložiti zašto se i način stjecanja znanja, implementiran odgovarajućim procesom, može smatrati problemom informacijskih znanosti. U skladu s tim, postojeća teorijska osnova u okviru same informacijske znanosti – DIKW-hijerarhija – utemeljena na njezinim ključnim pojmovima – podatku, informaciji, znanju i mudrosti, u radu se prepoznaje kao simbolički prikaz i teorijsko utemeljenje procesa stjecanja znanja. Štoviše, čini se da je veza između DIKW-hijerarhije i procesa stjecanja znanja od ključne važnosti za čvršće utemeljenje informacijske znanosti u 'tijelu' sveukupnog ljudskog znanja. Nadalje, dan je osvrt na povijest čovjekova i strojnog stjecanja znanja te iznesen prijedlog da DIKW-hijerarhija zauzme mjesto simbola općeg načina stjecanja znanja, koji bi se u jednakoj mjeri mogao odnositi na čovjekovo i strojno stjecanje znanja. Za ostvarenje tog cilja, temeljem iznesenih kritika, nužno je izmijeniti postojeći koncept DIKW-hijerarhije. Odgovarajuća izmjena koncepta DIKW-hijerarhije (od kojih je jedna u radu i spomenuta) mogla bi imati za posljedicu znatno čvršće teorijsko utemeljenje procesa stjecanja znanja, kao i informacijske znanosti u cjelini.

Na kraju rada obrazložene su i teorijske pretpostavke na kojima se proces stjecanja znanja može zasnovati kao problem informacijskih znanosti. Proces stjecanja znanja nužno ne mora biti predmetom epistemologije; kao takav može ostvariti čvršću vezu između pojmova podatka i znanja; nadalje, može se rabiti u kontekstu znanstveno-istraživačkog rada, ali na primitivnijoj razini od one na kojoj se provode znanstvene metode; osim toga, njegov opis, za razliku od drugih problema informacijske znanosti, nužno uključuje sva četiri DIKW-koncepta, a njegovo rješenje može voditi potpunijoj informacijskoj teoriji, odnosno teoriji informacija.

Ključne riječi: stjecanje znanja, proces stjecanja znanja, znanje, informacija, podaci, DIKW-hijerarhija


1. Uvod

U teorijskim raspravama unutar informacijske znanosti, tijekom njezina relativno kratkoga i burnog razvoja, prepoznata je nekolicina temeljnih problema. Neki istraživači, poput K. van Rijsbergena, P. Ingeversena i P. Vakkarija, problem informacijske znanosti prepoznaju u učinkovitom pretraživanju informacija (engl. information retrieval); drugi istraživači, poput T. Saračevića, vide ga u proučavanju fenomena relevantnosti informacija. Za mnoge istraživače inicijalni problem informacijske znanosti predstavlja informacijska eksplozija, fenomen enormnog porasta tiskanih publikacija, zabilježen još u devetnaestom, a koji je kulminirao sredinom dvadesetog stoljeća (De Solla Price 1963; Bush 1945; Gleick 2011).[1]

Međutim kada se govori o nabrojanim problemima, stječe se dojam da se radi o usko specijaliziranim područjima koja se još uvijek ne mogu teorijski smisleno povezati u jednu cjelinu. Stoga se nametnula potreba još jednom preispitati postojeće i moguće probleme informacijske znanosti te eventualno predložiti onaj koji bi u narednom periodu razvoja mogao postati njezinim primarnim problemom. Osim toga taj bi problem možda mogao obuhvatiti i povezati ako ne sve, a onda veliku većinu drugih problema. Kao posljedica toga informacijska znanost zadobila bi čvršće temelje na kojima bi se mogla nastaviti nesmetano razvijati.

Kroz perspektivu osobitoga, problemskog, stajališta u radu će se najprije dati osvrt na nekoliko problema informacijskih znanosti koji se spominju u literaturi. Osim problema informacijske eksplozije, informacijskog pretraživanja i relevantnosti informacija, koji su već spomenuti, rad će se osvrnuti na problem znanstvene komunikacije, s posebnim osvrtom na probleme komunikacije znanja i razmjene podataka znanstvenih istraživanja te, u novije vrijeme prepoznat, problem informacijske poplave, koji je nastao kao izravna posljedica sve masovnije uporabe informacijske i komunikacijske tehnologije na početku ovog stoljeća.

Dakako, lista problema ovdje ne završava, ali svrha ovog rada nije iscrpsti se na njihovu dokumentiranju, nego, u njihovu svjetlu, istaknuti jedan problem koji bi ih mogao povezati. Stoga će se u drugom dijelu rada, zahvaljujući postojećoj teorijskoj osnovi u okviru same informacijske znanosti, nastojati ukazati na jedan osobit problem informacijske znanosti koji bi mogao doći u fokus istraživanja u sljedećem periodu njezina razvoja. Riječ je o problemu načina stjecanja znanja, odnosno provedbe procesa stjecanja znanja u okviru postojećeg teorijskog okvira. Taj okvir nosi naziv DIKW-hijerarhije (Data-Information-Knowledge-Wisdom hierarchy), odnosno modela koji znanje postavlja u odnos s drugim srodnim konceptima podatka, informacije i mudrosti. Taj koncept uostalom i omogućuje da se znanju odsada prilazi kao nečemu što je strojno obradivo. Osim toga upravo se DIKW-hijerarhija može shvatiti kao ono teorijsko ishodište iz kojega izrastaju pojmovi pomoću kojih postaje moguće opisati proces stjecanja znanja. U radu će se nastojati pokazati kako upravo taj proces može biti od ključne važnosti za čvršće utemeljenje informacijske znanosti u 'tijelu' sveukupnog ljudskog znanja.

2. Problemsko stajalište u informacijskim znanostima

Još je C. S. Peirce ustvrdio kako znanost definiraju njezini problemi (Peirce i Buchler 1955, 66), dok je K. Popper, na istom tragu, kazao da znanstvenici ne proučavaju neki predmet, nego probleme i da bi svaki problem mogao nadići granice određene discipline koja se njime bavi (Popper 1989, 67). U skladu s tim u znanosti se pojavilo tzv. problemsko stajalište prema kojemu su upravo problemi ključni za uspostavu pojedine znanstvene discipline u 'tijelu znanosti' kao cjeline.

Kao odgovor na temeljni problem znanstvenog komuniciranja tijekom 20. stoljeća razvilo se nekoliko zasebnih znanstvenih disciplina. Na početku 20. stoljeća razvila se dokumentacija koja se uglavnom bavila rješavanjem problema organizacije znanja; nakon Drugog svjetskog rata pojavila se informacijska znanost koja je svoj problem prepoznala u pribavljanju znanstvene informacije (Saračević 2006, 18). Informacijska znanost, prema T. Saračeviću, „upravo je i definirana problemima kojima se bavi i metodama koje koristi u pronalaženju rješenja tijekom vremena” (isto, 110). Prema Borkovoj definiciji informacijska znanost veže se uz postupke ”…proizvodnje, prikupljanja, organiziranja, spremanja, pretraživanja, interpretacije, prijenosa, transformacije (procesuiranja) i korištenja informacija” te se „odnosi na ono 'tijelo znanja' koje nastaje ovim postupcima” (Borko 1968, 3). Svaki od spomenutih postupaka može poslužiti i kao ishodište zasebnog problema informacijske znanosti, a presudni utjecaj na uobličavanje pojedinog problema, dakako, vrše njezini temeljni pojmovi. U slučaju Borkove definicije radi se o informaciji, a zatim i znanju. Međutim promatrajući današnje trendove, plauzibilno je u raspravu uključiti i pojam podatka te priznati kako i on danas pripada ključnim pojmovima informacijske znanosti premda postoje inicijative iz poslovnog sektora da bi ih se trebalo promatrati u odvojenom kontekstu, odnosno kao predmet proučavanja zasebne znanosti.[2] Ne ulazeći u rasprave o tom pitanju, u ostatku ovog poglavlja dat će se osvrt na nekoliko problema informacijske znanosti koji su obilježili njezin razvoj u drugoj polovici 20. stoljeća.

2.1. Informacijska eksplozija… pa zatim poplava

U svom, nadaleko poznatom, članku Vanevar Bush, utjecajni američki inženjer, pozabavio se rješenjem problema pred kojim se našla znanost njegova doba i koji bi se u najkraćim crtama mogao okarakterizirati kao nesnalaženje znanstvenika pred naglim porastom izdavačke djelatnosti u svim poljima ljudskog znanja i djelatnosti. Fenomen, prepoznat još u 19.stoljeću, svoju kulminaciju doživljava sredinom 20. stoljeća. Obilježava ga enorman porast broja časopisa, knjiga, znanstvenih radova, znanstvenih priopćenja, osvrta, prikaza i sl. Ne rabeći eksplicite termin informacijska eksplozija, V. Bush prije govori o „rastućoj planini istraživanja” (Bush 1945, 101) za koju su potrebne nove znanstvene metode temeljene na informacijskoj tehnologiji. Potreba stalnog ažuriranja članaka i knjiga, brzo i učinkovito istraživanje najnovijih dostignuća u određenom području za potrebe znanstveno-istraživačkog rada, to su bili konkretni problemi pred kojima se znanstvena zajednica njegova vremena našla i koje je trebalo riješiti.

Iako je članak bio u prvom redu namijenjen znanstvenicima, a ponuđeno rješenje u obliku „sveznajućeg“ stroja memex trebalo služiti poboljšanju učinkovitosti njihova znanstveno-istraživačkog rada, neizravna posljedica bila je vizija svijeta u kojem će „zapisi ljudskog znanja biti dostupni svakome na pritisak gumba“ (Caspi, Shankar i Wang 2004). Sâm memex, kao utjelovljenje mogućeg rješenja informacijske znanosti, Bush je definirao kao „napravu koju pojedinac koristi za pohranjivanje knjiga, vlastitih zapisa i komunikacije (korespondencije), za kasnije konzultiranje” (Bush 1945, 106), odnosno svrhu memexa Bush je vidio, a što se i iz današnje perspektive može činiti zanimljivim, u osvježavanju memorije znanstvenika. Sama razrada rješenja međutim obilovala je nedostacima. Caspi, Shankar i Wang (2004) navode Bushove promašaje u predviđanju tehnološkog razvoja, poput izostanka predviđanja digitalnog oblika pohrane informacija, a odatle i njihove mogućnosti full-text pretraživanja te dijeljenja informacija putem mreže.[3] To je vjerojatno i bio razlog zašto Bush primjerice nije koristio izraz pretraživanje, već odabir (engl. selection) dokumenata. Međutim u smislu „pristupa zbunjujuće velikom skladištu znanja” (Bush 1945, 101) taj se propust ne čini pretjeranim u konceptualnom smislu.[4]

Kroz povijest znanosti često se događalo da rješenje jednog problema u jednom dobu postane uzročnikom novog problema u drugom dobu. Čini se kako je upravo sve masovnija primjena informacijske i komunikacijske tehnologije, koja je donekle uspjela riješiti problem informacijske eksplozije u 'Bushovu dobu', u današnjem dobu stvorila nov problem – problem informacijske poplave (engl. information flood) (Gleick 2011). Informacijsku poplavu, u najkraćim crtama, karakterizira olakšano i prekomjerno objavljivanje svih vrsta sadržaja u digitalnom obliku.[5] Često se kaže kako na internetu svi mogu objaviti što god žele, aludirajući pritom na pozitivni i negativni aspekt mogućnosti objavljivanja na mreži – pozitivni jer ne postoje prepreke objavljivanju sadržaja, a negativni jer kvaliteta takvog sadržaj postaje problematična. Ta izjava možda i najbolje dočarava fenomen informacijske poplave koji se počeo širiti internetom u najvećoj mjeri kao posljedica širenja društvenih mreža i ostalih aplikacija Web 2.0 poput Facebooka, Twittera, Flickra i sl.

Ipak, prateći razvoj informacijske znanosti od njezinih početaka, dakle sredine 20. stoljeća, nakon problema informacijske eksplozije, koji je i doveo do ubrzanog razvoja informacijske i komunikacijske tehnologije, jedan drugi problem oživio je u novom obliku – to je bio problem znanstvene komunikacije.

2.2. Teorija informacije i tri razine komunikacijskih problema

Inicijalnu 'informacijsku teoriju' ili 'teoriju informacija' mnogi istraživači prepoznaju u radu matematičara Clauda Elwooda Shannona naziva A mathematical theory of communication koji datira iz davne 1948. (Shannon 1948). Međutim dok je pisao svoj rad, Shannon nije mislio da stvara teoriju informacije. Zabavljen problemima optimalnog prijenosa signala između dvije točke telekomunikacijskog voda, dakle baveći se izričito problemom komunikacije, što je ostavilo traga i na naslovu njegova rada, ni na kraj mu pameti nije bilo stvoriti univerzalni obrazac po kojemu se primaju i odašilju informacije. Pojam informacije rabio je u svom uskom, inženjerskom kontekstu. Međutim njegov kolega W. Weaver nagovorio ga je da vlastiti okvir usmjeren na rješavanje inženjerskih problema proširi na ostala područja. Sâm se potrudio napisati poseban članak u kojem je predložio da se Shannonov komunikacijski model, namijenjen telekomunikacijskim inženjerima, može promatrati kao opći komunikacijski model prijenosa informacija. Možda bi takva interpretacija Shannonove teorije stekla više pobornika da se u cijelu priču nije upetljalo značenje, na neki način 'pojmovna svojina' istraživača iz društvenih i humanističkih znanosti. Naime u Shannonovoj teoriji značenje nije igralo nikakvu ulogu. Štoviše, sâm je Shannon naglasio da je irelevantno za cijelu priču (Shannon i Weaver 1949, 31). Mogućnost da se jedna teorija informacija utemelji na nečemu što nije uključivalo značenje odmah je pobudila sumnju istraživača iz društvenih i humanističkih znanosti. Mnogi od njih bili su uvjereni da je Weaver bio u krivu, a velika je većina to i danas.

U svom radu koji je objavljen zajedno sa Shannonovim, u posebnoj publikaciji sljedeće godine, Weaver je detektirao tri razine komunikacijskih problema s kojima se suočavala znanost njegova doba:

  • Razina A - odnosila se na tehničke probleme na razini kvantificiranja informacija u skladu sa Shannonovom teorijom
  • Razina B – obuhvaćala je semantičke probleme vezane uz značenje i istinitost sudova; problemom značenja bave se lingvistika, semiotika i druge srodne znanosti, dok istinitost sudova proučava epistemologija
  • Razina C – odnosila se na problem učinkovitosti (engl. effectiveness) poslane poruke, odnosno utjecaj informacija na ljudsko ponašanje (engl. information behavior); taj problem u najvećoj mjeri razmatra knjižnična znanost (Shannon i Weaver 1949, 4).

Na taj način Weaver je ipak jasno naznačio opseg Shannonove teorije, dok je sâm problem značenja, i kako ga inkorporirati u teoriju informacija, ostavio drugim znanostima.

2.3. Problem informacijskog pretraživanja

U daljnjem periodu razvoja informacijske znanosti potreba pristupa ogromnom skladištu znanja, uočena s otkrićem digitalnog načina pohranjivanja informacija, nužno je dovela do ideje informacijskog pretraživanja kakvu poznajemo danas. Informacijsko pretraživanje ili pretraživanje i ponovno pronalaženje informacija (engl. information retrieval - IR), u najkraćim crtama, predstavlja procesuiranje informacija temeljeno na formalnoj logici. Jednostavnim jezikom, radi se o manipulaciji tekstualnom informacijom u svrhu njezina ponovnog pronalaženja. Informacijsko pretraživanje u teoriju informacijskih znanosti uvelo je mnoge nove termine, poput pretraživanja cjelovitog teksta (engl. full text), pretraživanja Booleovim operatorima (engl. Boolean retrieval), odziva (engl. recall), preciznosti (engl. precision), tražilica (engl. search engines) itd. Započevši sa svojim intenzivnijim razvojem 1960-ih, informacijsko pretraživanje privuklo je značajan broj računalnih stručnjaka od kojih je možda najpoznatiji Gerald Salton. U skladu s tim problem informacijskog pretraživanja predstavlja tipičan primjer problema koji su istraživači informacijske znanosti, htjeli-ne htjeli, morali podijeliti s istraživačima neke druge znanosti, u ovom slučaju sa stručnjacima računalne znanosti, koja se u to doba također ubrzano razvijala.

Sustavi informacijskog pretraživanja započeli su s ciljem da korisnicima isporuče ne bilo koju informaciju, nego onu koja odgovara njihovim informacijskim potrebama. U skladu s tim problem relevantnosti informacija postao je gorući problem informacijske znanosti.

2.4. Relevantnost informacija i problem znanstvene komunikacije

U nizu članaka objavljenih u drugoj polovici 20. stoljeća hrvatski znanstvenik s američkom putovnicom Tefko Saračević značajno je doprinio isticanju ključnih problema informacijskih znanosti. Već pri površnom pogledu na njegovu, na hrvatski jezik prevedenu, knjigu Prilozi utemeljenju informacijske znanosti, sastavljenu od odabranih članaka iz njegove plodonosne karijere, može se uočiti da naziv prvog dijela knjige glasi O informacijskoj znanosti i njezinim temeljnim problemima. U tom dijelu knjige, kroz pet odabranih članaka, obrađena su najmanje tri različita problema informacijskih znanosti: relevantnost, pretraživanje i vrednovanje informacija.

U najkraćim crtama relevantnost je mjera „…učinkovitosti kontakta između izvora i odredišta u komunikacijskom procesu” (Saračević 2006, 13) te na taj način izravno upućuje na Weaverovu treću razinu komunikacijskih problema. Drugim riječima, relevantnost je teorijski konstrukt koji održava učinkovitost svake komunikacije. Za Saračevića relevantnost, kao središnji pojam informacijske znanosti, predstavlja ujedno i odgovor na problem znanstvene komunikacije (isto). Prema autoru problem znanstvene komunikacije eskalirao je još u prošlom stoljeću manifestirajući se kao posljedica sljedećih učinaka:

  • velikog kvantitativnog povećanja broja znanstvenika i zbog toga i broja publikacija
  • kvalitativnih poteškoća pri odabiru
  • uklanjanja granica između predmetnih područja
  • povećanja specijaliziranosti (isto, 18).

Na ovom mjestu valja spomenuti da se na prijelazu stoljeća u literaturi sve češće započinje koristiti termin komunikacija znanja (Capurro i Hjorland 2003; Saračević 1999). U preglednom radu o konceptu informacije Capurro i Hjorland (2003) spominju komunikaciju znanja kao kontekst u kojem se u novije doba rabi pojam informacije.

Početkom 21. stoljeća problem se znanstvene komunikacije diferencirao; osim problema komunikacije znanja pojavio se i problem razmjene podataka znanstvenih istraživanja. Tom problemu posvetit će se pozornost u nastavku rada.

2.4.1. Problem razmjene podataka znanstvenih istraživanja

Na prijelazu stoljeća znanost obilježavaju inicijative i prijedlozi oko novog pristupa znanstveno-istraživačkom radu, koji ponajviše karakterizira uporaba interneta i drugih srodnih informacijskih i komunikacijskih tehnologija. U literaturi se započinju javljati novi pojmovi i izrazi s prefiksom e- u svom nazivu poput e-znanosti (engl. e-Science), e-infrastrukture (engl. e-infrastructure), e-humanistike (engl. e-Humanities) te e-istraživanja (engl. e-Research). U isto se vrijeme u Sjedinjenim Američkim Državama za označavanje istog fenomena pojavio trend korištenja prefiksa kiber- (engl. cyber-) u nazivima pojmova poput kiberinfrastruktura (engl. cyberinfrastructure) ili kiberinženjerstvo (engl. cyberengineering) (Borgman 2006, 359).[6] Svi nabrojani izrazi ticali su se potpuno nove paradigme shvaćanja znanstveno-istraživačkog rada koju se polako počinje dovoditi u vezu s izrazima dijeljenja i distribuiranja podataka (i/ili informacija) te suradnje znanstvenika u mrežnom okruženju. C. L. Borgman sve spomenute e- i kiberizme u svojoj knjizi Scholarship in the digital age: information, infrastructure and the Internet preslikava na opći pojam znanstvene informacijske infrastrukture ili samo informacijske infrastrukture koja na taj način postaje važan segment razvoja znanstveno-istraživačkog rada u budućnosti (Borgman 2007, 19). Štoviše, podaci vezani uz proces znanstveno-istraživačkog rada zauzimaju središnje mjesto u informacijskoj infrastrukturi kakvu opisuje Borgman.

Podaci koji se proizvode i rabe u okviru znanstveno-istraživačkog rada u literaturi su poznati pod različitim nazivima. Borgman spominje najmanje tri oblika: kao podaci znanstvenog istraživanja (engl. research data), znanstveni podaci (engl. scientific data) ili samo podaci (engl. data) (isto, 126). Isto tako, ako se baza podataka sastoji od podataka koji zahtijevaju minimalnu obradu (uobičajeno se radi o numeričkim podacima), onda se riječ „podaci“ koristi uz pojmove vezane uz njihovu pohranu na računalu, poput arhiva podataka (engl. data archive), repozitorija podataka (engl. data repository) ili čak digitalnih knjižnica podataka (engl. digital library of data). Priroda podataka najuže je povezana s činjenicom da ih različite zajednice koje ih proizvode i koriste mogu na različite načine interpretirati ovisno o kontekstu vlastitih istraživanja. Osim toga definicije podataka razlikuju se od znanstvene zajednice do znanstvene zajednice kao što se razlikuju i prema tome na koji ih način znanstvenici unutar zajednica kreiraju i koriste (isto).

Dijeljenje, odnosno „zajedničko korištenje podataka znanstvenog istraživanja temeljni je element znanstvene suradnje”, drži Borgman (2007, 121). O tom složenom procesu koji uključuje pitanja povjerenja, rizika, intelektualnih prava i sl. pisali su P. A. David (2004), P. A. David i M. Spence (2003), G. C. Bowker (2005) i dr.

S druge strane, izraz 'poplava podataka' (engl. data deluge), koji su skovali T. Hey i A. Trefethen (2005), odnosi se na fenomen naglog povećanja podataka u istraživanju koji se jedino mogu strojno obraditi. Uzročnici su fenomena naglog povećanja podataka znanstvenog istraživanja svakako vrlo napredni i skupi instrumenti koji se koriste u istraživačkim projektima, poput satelita, seizmografskih uređaja, akceleratora čestica i sl., a koji sami po sebi već predstavljaju najnaprednije vidove informacijske i komunikacijske tehnologije. Znanstvenici humanističkih znanosti također za potrebe svog znanstveno-istraživačkog rada generiraju velike količine teksta, slika, videozapisa i sl., koji predstavljaju podatke znanstvenog istraživanja humanističkih znanosti. Očigledno da fenomen 'poplave podataka' dovodi do neuporabljivosti dosadašnjih, uglavnom 'ručnih', tehnika upravljanja podacima znanstvenog istraživanja. Ipak, razvojem generatora podataka znanstvenog istraživanja, poput primjerice akceleratora čestica, ukorak ide i razvoj računalne podrške za obradu tih podataka. Informacijsku infrastrukturu već danas čine širokopojasna internetska veza, robustan sustav organizacije diskovnih prostora za pohranu podataka i napredni računalni programi za obradu istih.

Na osnovi izloženog lako je u analogiju dovesti fenomene 'informacijske eksplozije' (velike količine analognog znanja kao posljedice enormnog povećanja izdavačke tiskarske djelatnosti), 'informacijske poplave' (velike količine digitalnih informacija svih vrsta iz svih vrsta izvora i ne nužno znanja, koje kolaju internetom) i 'poplave podataka' (velike količine digitalnih podataka generiranih mjernim instrumentima). Postaje očito da je svaki od navedenih fenomena usko vezan uz odgovarajući ključni pojam informacijske znanosti koji je zastupljen u DIKW-hijerarhiji.

Iz dosad izloženog može se zaključiti kako određeni problemi mogu obuhvatiti druge probleme. Primjerice problem znanstvene komunikacije može obuhvatiti probleme relevantnosti informacija, komunikacije znanja, pa čak i razmjene podataka znanstvenih istraživanja, pa se može postaviti i pitanje postoji li takav problem informacijske znanosti koji bi u naznačenom smislu mogao obuhvatiti barem većinu problema informacijske znanosti? Jedan se takav problem, prema mišljenju autora ovoga rada, u ovom kontekstu posebno ističe. To je problem načina stjecanja znanja, a o kojem će biti više riječi u sljedećem poglavlju.

3. Proces stjecanja znanja

3.1. Pojam i vrste znanja

Znanje je širok i apstraktan pojam oko čijeg su se značenja, u okvirima zapadnoeuropske filozofske tradicije, rasprave začele još među starogrčkim filozofima. Prvo određenje znanja kao „opravdanog, istinitog vjerovanja“ seže još od Platona (Platon 1979, 43). Znanje se, u svom najširem vidu, najprije izjednačava s teorijskim ili praktičnim razumijevanjem nekog predmeta, a pribavljanje znanja uključuje složene kognitivne procese percipiranja, učenja, komuniciranja, pridruživanja i zaključivanja.

Oxford English Dictionary znanje definira različito: kao „informacije i vještine koje je pojedinac stekao vlastitim iskustvom i obrazovanjem“ (I.), „što je znano u pojedinom polju ili općenito“ (II.) i „svjesnost ili bliskost stečena iskustvom na osnovu neke činjenice ili situacije“(III) (Compact Oxford English Dictionary). Prema Filozofijskom rječniku znanje se definira kao „rezultat spoznaje, objektivno zasnovana uvjerenost i istinitost suda ili sudova, također sud ili skup sudova u čiju je istinitost netko s pravom uvjeren“ (Filosofijski rječnik 1965, 436). Postoji i definicija znanja koja predstavlja proširenu verziju Platonove: „Znanje je opravdano vjerovanje koje povećava kapacitet entiteta koji ga posjeduje za određenu efektivnu akciju.“ (Nonaka i Takeuchi 1995, 56)

Međutim jedan od problema Platonove definicije znanja proizlazi iz činjenice da se znanje u današnjem društvu više ne može tretirati kao apsolutno, nego otvoreno za reviziju. Sasvim je moguće da će i sama definicija znanja doživjeti reviziju. Tako francuski filozof J. F. Lyotard (1997) piše o trenutku kada će informacija i znanje postati ključni temelj ekonomije u postindustrijskim društvima. U tom se smislu prema Lyotardu znanje više neće povezivati s konceptom istinitosti, već s konceptima ekonomskih vrijednosti. Drugim riječima, znanje će posjedovati bitna svojstva koja će se ticati njegove mogućnosti da može biti proizvedeno, ali i prodavano (isto).

Krajem prošlog stoljeća znanje se počinje tretirati i kao važan organizacijski resurs te postaje sastavni dio sustava upravljanja znanjem u istoimenom području. Upravljanje znanjem opći je trend u današnjem poslovnom svijetu koji snažno afirmira znanje u suvremenom društvu. To je područje naročito važno zato što poklanja izuzetnu pozornost tumačenju i razvoju koncepta DIKW-hijerarhije, o kojoj će više riječi biti u nastavku rada.

U pogledu vrsta znanja važno je istaknuti Nonakinu podjelu znanja na implicitno (engl. tacit knowledge), koje se nalazi u glavi pojedinca, te eksplicitno (engl. explicit knowledge), koje se odnosi na znanje koje se na neki način uspjelo formalizirati, odnosno izraziti nekom vrstom medija (Nonaka 1994). Ta je podjela do današnjeg dana imala izniman utjecaj na cjelokupno područje upravljanja znanjem. Pritom stručnjaci za upravljanje znanjem ističu važnost postupka pretvorbe implicitnog u eksplicitno znanje. Inače, najpoznatija klasifikacija znanja dolazi iz izvornoga, epistemološkog stajališta koje razlikuje deskriptivno (opisno) ili deklarativno znanje (engl. declarative knowledge), odnosno znanje činjenica, poznato kao i 'znanje-što' (engl. knowledge-what), zatim proceduralno znanje (engl. procedural knowledge), znanje kako nešto napraviti, poznato i kao 'znanje-kako' (engl. knowledge-how) te znanje poznavanja (engl. acquaintance knowledge), znanje o nečemu, poznato i kao znanje o nečijoj egzistenciji (Milton 1994).

M. Alavi i D. Leidner (2001) sažimaju viđenje znanja kroz različite perspektive: kao stanje uma, objekt, proces, uvjet za pristup informacijama ili sposobnost. Znanje kao stanje uma odnosi se na ono osobno znanje pojedinca koje je on u mogućnosti primijeniti u praksi. Iako to znanje na prvi pogled ne predstavlja nikakvo usustavljeno znanje, upravo je ono neizmjerni izvor i početna točka svakog procesa konverzije znanja u usustavljeno, odnosno eksplicitno znanje. Znanje kao objekt promatra se kao stvar koja može biti pohranjena i kojom se može manipulirati. Znanje kao proces uzima se kao simultano izmjenjivanje znanja i djelovanja, odnosno znanje kao proces najprije se shvaća kao primjena znanja u praksi. Znanje kao uvjet pristupa informacijama prošireni je oblik perspektive znanja kao objekta i odnosi se na svojevrsnu dostupnost objekata znanja. I konačno, znanje se kao sposobnost u prvome redu odnosi na potencijal koji može utjecati na buduće djelovanje, a onda i na sposobnost korištenja informacija općenito (isto, 110). Glavna posljedica takvog pogleda na znanje sastoji se u tome da svaka perspektiva nudi i različite strategije za upravljanje samim znanjem kao i strategije za izgradnju sustava koji će podržavati taj proces.

U recentnoj literaturi postoji i skepsa spram pokušaja definiranja tog višeznačnog pojma. Primjerice za Williamsona (2000) znanje je primitivan pojam koji se ne može analizirati te su svi pokušaji da ga se definira pomoću nužnih i dovoljnih uvjeta unaprijed osuđeni na neuspjeh. Stoga se može i postaviti pitanje znamo li išta? Ako nešto znamo, onda bismo to trebali pouzdano znati sa stopostotnom sigurnošću. Danas smo međutim u daleko većoj mjeri svjesni pretjerane strogoće tog zahtjeva. Nakon otkrića zakonitosti koje vladaju u kvantnom svijetu, poput Heisenbergovih načela neodređenosti ili poststrukturalistčkoga uvida u duboku vezu između onoga što znamo i jezika kojim to znanje izričemo, više ne možemo inzistirati na jasnom i održivom znanju. Mnogi današnji istraživači i znanstvenici stoga znanju neće nametnuti uvjet njegove nepobitne istinitosti. Radovi Karla Poppera, Thomasa Kuhna, pragmatista i drugih istraživača u drugoj polovici 20. stoljeća, koji će biti spomenuti u nastavku, utrli su put razumijevanju znanja kao održive, ali i izmjenjive supstance naših svjetonazorskih stavova o svijetu koji nas okružuje.

3.2. Čovjekovo stjecanje znanja

U filozofiji proces stjecanja znanja najprije upućuje na metodu učenja. Prema Aristotelu čovjek je na početku svog života svojevrsna 'prazna ploča' (tabula rasa) koju procesom učenja tek treba ispisati. Prva metoda uopće, koja je donosila neko znanje o svijetu, odnosila se na kategoriziranje stvari. Za Aristotelove kategorije kaže se da se radi o prvom pokušaju uspostave formalne ontologije, odnosno formalnog znanja o svijetu koji nas okružuje. Rođena je znanost o klasifikaciji – taksonomski/hijerarhijski uređeno znanje prema kategorijama.

Međutim filozofe stare Grčke kopkalo je puno dublje pitanje znamo li uopće išta? Pokušaj odgovora na to pitanje, kao što je poznato, kroz povijest filozofije doveo je do nastanka čitavog niza misaonih pokreta, svjetonazora i sl., poznatih pod više ili manje uglednim imenima skepticizma, fundacionalizma, koherentizma, pragmatizma itd. Tako je skepticizam ponudio plauzibilan stav (usko vezan uz potrebu za istinitošću znanja) da odgovor na to pitanje ne možemo znati te da se u skladu s tim trebamo suzdržavati od suda. Fundacionalisti su bili nešto blaži: tvrdili su da naše znanje mora imati temelje, fundamente, nešto na čemu počiva, međutim teškoća tog pristupa odnosila se na određivanje tih temelja. Jesu li to osjetilni podaci (kao što su to tvrdili empiristi), neposredni sadržaji svijesti (na koje su se pozivali fenomenolozi), jasne i odjelite ideje (koje je spominjao Rene Descartes), 'protokol rečenice' (spomen nekih koherentista), neposredna danost (na koju su se pozivali logički pozitivisti) ili pak vlastito neposredno iskustvo, teško je bilo odlučiti (Berčić 2012). Jednu zanimljivost može predstavljati činjenica da fundacionalisti ljudsko znanje zamišljaju u obliku piramide koja predstavlja i najčešći simbolički prikaz DIKW-hijerarhije. Koherentisti pak, za razliku od fundacionalista, smatraju da ljudsko znanje ima strukturu splavi (Sosa 1980).[7] Ono što splavi omogućuje da plovi jest to što se različiti dijelovi drže na okupu. Prema Neurathu ljudsko je znanje poput broda na kojem se vrši remont u vožnji na otvorenom moru. Može se zamijeniti bilo koji dio broda, ali se ne mogu zamijeniti svi dijelovi broda odjednom! Drugim riječima, ne možemo dovesti u pitanje sve naše znanje odjednom! (Neurath 1932; Berčić 2012). Na taj način stiglo se i do uvida da naše znanje može biti pogrešivo.[8] Konačno, pragmatisti izvjesnost znanja ocjenjuju s obzirom na uspješnost znanja u interakciji s okolinom. Za pobijanje znanja nije dovoljna mogućnost pogreške, nego stvarna pogreška!

Nakon velikog interesa starogrčkih filozofa da proniknu u bit znanja interes za proučavanje znanja ponovno se pobudio u srednjem vijeku. Ramon Llull u 13. stoljeću stvorio je prvi logički sustav koji je trebao kreirati novo znanje na osnovi poznatih činjenica. Empirist John Lock u 16. stoljeću došao je do uvida da objekti u svijetu ‘in-formiraju’ naših pet čula, odnosno osjetila te na taj način stvaraju znanje u glavi čovjeka (iako se na ovom mjestu može postaviti i pitanje kako naša čula informiraju naš um) (Berčić 2012). David Hume bio je među prvim novovjekovnim filozofima koji su izrazili skepsu spram onoga što znamo o svijetu koji nas okružuje. Odričući mogućnost metafizičke spoznaje, empirističko gledište doveo je do skepticizma. Konačno, njemački filozof Immanuel Kant, kojeg je iz 'dogmatičkog drijemeža' svojim postavkama probudio upravo David Hume, ustvrdio je da osim znanja iz iskustva mora postojati i znanje koje prethodi svakom iskustvu. Matematičke istine primjer su takvoga apriornog znanja koje prethodi svakom iskustvu. Međutim u iskustvu, promatrajući zbilju pomoću osobitih subjektivnih oblika opažanja, prostora i vremena, u prilici smo spoznati samo pojave stvari, ali ne i ono što su one 'po sebi'. Pored svega Kant je osmislio i vlastiti sustav kategorija (Kalin 1995).

U novije vrijeme filozofi znanosti preuzeli su na sebe zadatak utvrđivanja izvjesnosti naše spoznaje. Izrasla na revolucionarnim dosezima logicizma u 19. stoljeću i radovima matematičara Dedekinda, Fregea i Cantora, struja logičkih pozitivista, na čelu s Ludwigom Wittgensteinom (iz rane faze), Bertrandom Russelom, Rudolphom Carnapom i drugima, dovela je do različitih ideja vezanih uz razumijevanje prirode ljudskog znanja. Poznato je i kako je rad austrijskog filozofa K. Gödela zadao odlučni udarac takvim stremljenjima. Iako se on u prvom redu odnosio na ograničavanje područja važenja 'matematičke istine', ujedno je pokazao da su i dosezi ljudskog znanja u bitnoj mjeri ograničeni (Šikić 1995).[9]

Nedavna događanja u matematičkom svijetu, koja su u povijesti znanosti dobila primjeren naziv 'kriza osnova matematike', morala su se nekako preliti i na epistemološku pozornicu. U svojoj knjizi Logika znanstvenih otkrića, prvi put objavljenoj 1934., Karl Popper udario je nove temelje teoriji znanja. Popper je među prvima, u koherentističkom duhu, predložio da od znanja više ne zahtijevamo da bude istinito, nego samo provjerljivo (Popper 1972). Izvjesnost znanstvene istine, odnosno znanja postala je relativna. Ako teorije ne možemo dokazati, možemo ih pobiti. Naše znanje, odnosno teorija koja ga zastupa, sadržajno je bogatije ako puno više toga zabranjuje nego dopušta. To ga u znatno većoj mjeri izlaže mogućnosti testiranja, a posredno, i opovrgavanja. Što je neka znanstvena teorija otpornija na testiranja to će ona biti istinitija (O'Hear 2007, 38). Jasno je da poperovski svjetonazor izrasta iz prihvaćanja činjenice da je naše znanje pogrešivo u duhu koherentističke teorije znanja. Ono što možda ima još dalekosežnije posljedice u reviziji shvaćanja pojma znanja odnosi se na Popperovu kritiku induktivne metode. Naime Popper je među prvima ustvrdio da ne postoji mogućnost prikupljanja čistih podataka (engl. pure data) bez prethodnog utjecaja nekakve pozadinske teorije. Podaci znanstvenog istraživanja umnogome su oslonjeni na teoriju koju pokušavaju potvrditi; oni su ovisni o teoriji (engl. theory-laden) (Popper 1972).

Thomas Kuhn u svojoj knjizi Struktura znanstvenih revolucija, prvi put objavljenoj 1959, ide korak dalje u relativiziranju čovjekova stjecanja znanja. Po njemu se razvoj znanosti događa od jedne do druge znanstvene revolucije između kojih 'vegetiraju' razdoblja tzv. 'normalne znanosti' u kojima se ne događa ništa posebno osim razrješavanja anomalija postojećih teorija (Kuhn 2013). Za potrebe ovog rada vrlo zanimljivim se čini pojam znanstvene paradigme koji je Kuhn uveo u diskurs filozofije znanosti. Pod pojmom znanstvene paradigme Kuhn ne podrazumijeva „…samo načine na koji istraživači pristupaju i opažaju podatke, već i same podatke” (O'Hear 2007, 59). Na taj način uspostavljena je mnogo čvršća veza između podataka i znanja. Znanje defacto postaje ovisno o podacima znanstvenih istraživanja.

Nakon razmatranja čovjekova stjecanja znanja mahom s epistemološkog stajališta u narednom poglavlju izložena je povijest strojnog stjecanja znanja, odnosno načina stjecanja znanja računala.

3.3. Strojno stjecanje znanja

Iako zadaća razumijevanja pojma znanja i načina njegova stjecanja, kako je pokazano u prethodnom poglavlju, izvorno pripada području epistemologije ili teorije znanja, grane filozofije, znanje se od sredine 20. stoljeća s razvojem informacijske tehnologije počinje promatrati i u kontekstu informacijskih sustava koji započinju s njegovom manipulacijom. Područje umjetne inteligencije prvo je područje koje resurse znanja na velika vrata uvodi u arenu 'strojne obradivosti' s namjerom da računala učini sposobnima percipirati i primjenjivati znanje na isti način na koji to čini čovjek. Za razliku od drugih grana u polju računalne znanosti koje se bave proučavanjem algoritamskih metoda za potrebe rješavanja stanovitih problema umjetna inteligencija fokusira se na manipuliranje simbolima u postupcima rješavanja problema nastojeći emulirati ponašanje ljudskog mozga u tim situacijama (Jackson 1998). Ovdje se dakle radi o skupljanju činjenica te njihovu povezivanju kroz jednostavan set pravila koji će naknadno omogućiti pravilno zaključivanje unutar cjelokupnog sustava. Za to je potrebno mnogo dublje zaći u značenjski aspekt informacije, a što za posljedicu ima zbližavanje područja umjetne inteligencije i informacijske znanosti.

Postoje mnoga potpodručja umjetne inteligencije, ali u kontekstu odnosa s informacijskom znanosti vrijedno je izdvojiti ono koje se bavi kreiranjem i proučavanjem sustava utemeljenih na znanju ili ekspertnih sustava (engl. knowledge-based or expert systems).[10]

3.4. Ekspertni sustavi

Ekspertni sustavi prvi su računalni sustavi temeljeni na znanju koji su naišli na raznoliku primjenu u svim područjima ljudske djelatnosti još od sredine druge polovice 20-og stoljeća. U svojoj osnovi ekspertni sustav jest sustav koji pojedini problem iz određene domene ljudske djelatnosti rješava u koracima – odlučivanjem za jednu od unaprijed definiranih mogućnosti (Alberico i Micco 1990). Odlučivanje ekspertnog sustava oslanja se na informacije, odnosno znanje ljudskog eksperta danog područja koje je prethodno ekstrahirano i ugrađeno u bazu znanja ekspertnog sustava.[11] Način organizacije znanja u bazi znanja zasniva se na korištenju tehnika logičkog programiranja. Znanje se predstavlja činjenicama (engl. facts) povezanim setom pravila (engl. rules), koja su podvrgnuta logičkom zaključivanju tipa 'ako-onda' (engl. if-then). Svrha je sustava omogućiti što veći stupanj formaliziranja znanja. Stroj za zaključivanje (engl. inference engine) predstavlja zaseban dio ekspertnog sustava koji, kako mu samo ime govori, sudjeluje u pravilnom zaključivanju na postavljeni upit ekspertnom sustavu. To čini na osnovi brižljivo sročenih petlji zaključivanja koje kao ulazne informacije koriste činjenice i pravila iz baze znanja. Stroj za zaključivanje primjerice može odlučiti koja pravila prizvati, po kojem redoslijedu i kada. Pritom se mogu koristiti različite izvedbe stroja za zaključivanje uključujući i one zasnovane na indukciji, odnosno zaključivanju na osnovi konkretnih primjera. Konačno, sam korisnički upit ekspertnom sustavu postavlja se preko posebno dizajniranog sučelja koje služi i za unos novih činjenica i pravila, odnosno proširivanje baze znanja (isto).

Stjecanje znanja računala (engl. knowledge acquisition) relativno je nova disciplina koja se brzo razvila u računalnim, a potom i u informacijskim znanostima, temeljem daljnjeg razvoja sustava umjetne inteligencije. Ubrzo su nastala i druga srodna područja poput područja organizacije znanja (engl. knowledge organization) u knjižničnoj i informacijskoj znanosti ili predstavljanja znanja (engl. knowledge representation) u računalnim znanostima, a istraživači poput Ingetraut Dahlberg i Birgera Hjørlanda, u području organizacije znanja te Johna Sowe, Ronalda Brachmanna i dr. u području predstavljanja znanja doprinijeli su njihovu ubrzanom razvoju.

Tradicionalnim sustavima organizacije znanja poput autorskih datoteka, klasifikacijskih shema, kontroliranih rječnika termina i tezaurusa, pridružili su se i neki novi, tipično računalni, sustavi poput ontologija. Osim toga i sami su zaživjeli u digitalnom obliku (npr. LSCH,[12] Mesh tezaurus[13] i sl.)

U konačnici, u novije doba, s implementacijom aplikacija semantičkog weba u mrežno okruženje, na važnosti su dobile računalne ontologije. Prema filozofskoj tradiciji ontologija predstavlja znanost o onome što jest, o vrstama i strukturama objekata, svojstvima, događajima, postupcima i odnosima u svim područjima stvarnosti (Smith i Welty 2001). Prema tome ontologija je pojam koji je bio predmet proučavanja filozofa daleko prije dolaska računalnog doba. Zbog toga se u tom smislu u našem dobu može govoriti o prijeporu koji vlada između tzv. 'filozofske' i 'računalne' ontologije, kao što se može raspravljati i o prijeporu između čovjekova i računalnog stjecanja znanja.

Formalna ili računalna ontologija, koju Gruber (1993) definira kao eksplicitnu specifikaciju konceptualizacije određene domene ili kraće 'specifikaciju konceptualizacije', omogućuje dosad najvišu razinu strojne obradivosti znanja nekog područja. Znanje se u formalnim i strojno obradivim ontologijama definira klasama i potklasama, njihovim instancama, objektnim i podatkovnim svojstvima te njihovim vezama, omogućujući pritom iznimno visok stupanj formalizacije koji pak omogućuje izvođenje novog znanja iz postojeće ontologije. Upravo izvođenje novog znanja iz ontologije čini se najvažnijom karakteristikom dobre ontologije i njemu se posvećuje posebna pozornost u procesu njezina kreiranja (Legg 2010; Antoniou et al. 2012).

Kao primjere danas najčešće korištenih ontologija na webu mogu se navesti CyC (projekt formalne ontologije pokrenut 1984. ili svjetske baze znanja), WordNet (leksikon engleskog jezika organiziran kao ontologija, 1985.), Gene Ontology (bioinformatička ontologija gena i proizvoda gena, 1998), SNOMED CT (ontologija kliničkog ili zdravstvenog nazivlja, 1999.), DBPedia (Wikipedijina ontologija, 2007), GoodRelations (ontologija vezana uz elektroničko poslovanje, 2007) i dr.

3.5. DIKW-model kao simbol procesa stjecanja znanja

U skladu s navedenim postaje očito da se u novije vrijeme sve češće postavlja zahtjev da se čovjekov i strojni način stjecanja znanja nekako približe. Računala će u svojoj obradi pohranjenog znanja biti učinkovitija ne samo ako su to znanje u stanju razmjenjivati nego i ako su u stanju to znanje predstaviti čovjeku na njemu razumljiv način. Na taj način računalno stjecanje znanja u neku ruku mora biti komplementarno s ljudskim.

Stoga je sasvim moguće da je spomenuta potreba da ih se približi u drugoj polovici 20. stoljeća rezultirala stvaranjem DIKW-hijerarhije odnosno modela u okviru kojeg su se procesi stjecanja znanja čovjeka i računala nastojali prikazati kao jedan. Postoji brojna literatura o

DIKW-hijerarhiji. Od inicijalnih radova H. Clevelanda (1982), M. Zelenyja (1987) i R. Ackoffa (1989), preko preglednih poput radova J. Rowley (2007), J. Heya (2004), A. Liewa (2007) i N. Sharme (2008), do, u konačnici, i onih otvoreno kritičkih koji se javljaju u novije vrijeme poput radova M. Frickea (2009) i L. Ma (2012), koncept DIKW-hijerarhije razvio se u plauzibilan teorijski konstrukt na koji je postalo moguće utemeljiti nekoliko područja, među kojima i informacijsku znanost. Za potrebe ovog rada naglasak je stavljen na tumačenju DIKW-modela kao simbola procesa stjecanja znanja.[14]

DIKW-koncept u jednom od svojih najpopularnijih prikaza tvori piramidu (ili trokut) sačinjenu od slojeva podatka, informacija i znanja s vrhom u najkompleksnijem konceptu – mudrosti (slika 1).

Slika 1. DIKW-hijerarhija u svom najjednostavnijem obliku
Slika 1. DIKW-hijerarhija u svom najjednostavnijem obliku

Postoje i drugačije grafičke reprezentacije DIKW-koncepta. Shedroff (2001) ga prikazuje u obliku preklapajućih krugova, dok ga Clark (2004) zamišlja u okviru koordinatnog sustava.[15] Svima je njima međutim zajedničko da ga rabe kako bi predstavili po sebi vrlo slične procese učenja, razumijevanja i, dakako, stjecanja znanja.

Definiranje znanja na osnovi DIKW-modela u literaturi se provodilo na način njegova razlikovanja u odnosu na pojmove podatka, informacije i mudrosti. Najčešći pristup tom problemu polazi od pretpostavke da su podaci jednostavni simboli i činjenice, informacije procesuirani podaci, a znanje procesuirana i potvrđena informacija u umu pojedinca (Rowley 2007; Liew 2007). S informacijom se u najužu vezu dovode termini komunikacije, poruke i značenja. Kad se informacija procesuira u glavi pojedinca, ona postaje znanje. Međutim znanje postoji samo kao znanje jedne specifične domene. Mudrost bi bilo znanje koje prelazi granice područja, znanje s epitetom univerzalnosti.

Na osnovi takvih razmatranja M. Alavi i D. E. Leidner (2001, 109) zaključuju da se informacija pretvara u znanje kad se procesuira u ljudskom umu, a znanje u informaciju kad se artikulira i predstavlja u obliku teksta, slike i sl. Ključna je implikacija tog tumačenja da pojedinci koji žele imati jednako razumijevanje određenih podataka i informacija moraju dijeliti i odgovarajuću bazu znanja. Isto tako sustavi informacijske tehnologije koji bi podržavali pretvorbu navedenih pojmova ne bi morali biti značajno različiti od već postojećih. Ono što se također može istaknuti u tom tumačenju pretpostavljena je jednakost podatka, informacije i znanja u sadržajnom smislu, odnosno dojam, koji naglašava i Liew (2007), da se ovdje uistinu radi o istoj vrsti nečega, što prelazeći s medija na medij prolazi kroz postupak procesuiranja, poprimajući tek čovjeku uočljive različite oblike.

DIKW-modelu kao simbolu i čovjekova i računalnog stjecanja znanja bliži se čine istraživači područja upravljanja znanja. Prema R. Ackoffu (1989, 3) sadržaj ljudskog uma može se podijeliti u pet kategorija: podaci (simboli), informacije (procesuirani podaci koji odgovaraju na pitanja tko, što, gdje i kada), znanje ( aplikacija podataka i informacija koja odgovara na pitanje kako), razumijevanje – shvaćanje zašto – i mudrost (vrednovanje razumijevanja).

Međutim prema Ma (2012) Ackoff koncept DIKW-hijerarhije poistovjećuje s modelom obrade podataka (engl. data processing model), vezujući ga uglavnom uz računala. Općenito, Ma smatra kako DIKW-koncept dovodi do zanemarivanja pojedinih društvenih i kulturnih aspekata u procesu oblikovanja pojma informacije i da nikako ne može odražavati i čovjekov način stjecanja znanja. Stoga je za Ma DIKW-hijerarhija u ovom obliku i dalje samo 'tehnička metafora' iako može poslužiti kao temelj za uspostavu jedne sveobuhvatnije teorije znanja (Ma 2012).

M. Frické (2009) još je rezolutniji u svojoj kritici DIKW-koncepta, kritizirajući same logičke pretpostavke danog modela koje dopuštaju da se informacije izvode isključivo iz podataka. Po Frickeu postoje informacije koje prvotno nisu bile podaci i koje se dobivaju složenijim logičkim zaključivanjem od onog kojim se generiraju sami podaci. Pritom se i Frické slaže s Popperovom tvrdnjom da je prikupljanje čistih podataka podložno utjecaju pozadinske teorije. I premda je suglasan sa stavom da naše znanje ne može u potpunosti udovoljiti zahtjevu da bude istinito, M. Frické zahtijeva da barem podaci budu istiniti, jer neistiniti podaci uopće nisu podaci. Čini se da strogoća Frickéova pristupa podacima proizlazi iz njegove sklonosti operacionalizmu, pristupu po kojem „moramo biti apsolutno sigurni što pod nečim mislimo i apsolutno sigurni koje su naše izjave u svezi s tim istinite” (Fricke 2009, 134). Na osnovi izloženih kritičkih pristupa DIKW-modelu možda i ne čudi što je ugledni informacijski teoretičar R. Capurro DIKW-hijerarhiju proglasio bajkom (Zins 2007, 481).

Ipak, valja voditi računa o tome da se u slučaju DIKW-hijerarhije prije svega radi o prikazu, a posredno i simbolu i metafori, koju je moguće, prema potrebi, izmijeniti kako bi ispunila svoju svrhu – u našem slučaju predstaviti proces stjecanja znanja i čovjeka i računala. Jedan takav pokušaj nedavno je predstavljen u radu Information in knowledge acquisition process (Bosančić 2016). U njemu se DIKW-piramida zamjenjuje DIKW-stablom, koje nakon metaforičke elaboracije zadobiva novo ime – stablo znanja.

Na simboličkoj slici ‘stabla znanja’ informacija se u obliku soka prepoznaje kao jedan od ključnih supstrata koji omogućuju njegov rast. ‘Zemlja podataka’ na kojoj ‘stablo znanja’ izrasta predstavlja simbol dohvatljivoga, mjerljivog ‘vanjskog svijeta’, dok njegova krošnja simbolizira čovjekovo eksplicitno znanje o tom ‘vanjskom svijetu’. Daljnjom analogijom deblo stabla može simbolizirati komunikacijski kanal kojim se prenose informacije, dok njegovo korijenje može predstavljati simbole mjernih instrumenata za dohvaćanje podataka iz ‘vanjskog svijeta’ itd.

Slika 2. Modifikacija DIKW-hijerarhije: iz piramide u 'stablo znanja'
Slika 2. Modifikacija DIKW-hijerarhije: iz piramide u 'stablo znanja'

Kako je vidljivo sa slike 3, na sveukupni rast ‘stabla znanja’, a odatle i našega znanja, pored toka ‘informacijskog soka’ od korijenja prema vrhu stabla, utječe i tok ‘značenjskog soka’ koji je potaknut djelovanjem ‘zraka’ ‘umnog sunca’ u listovima ‘stabla znanja’ (i koje su odmijenile sloj mudrosti). U ovom smislu ‘zrake umnog sunca’ simboliziraju čovjekovu sposobnost apstraktnog mišljenja nužnog za potrebe usvajanja i organizacije znanja (isto).

Ovdje valja naglasiti da su ovim putem sva četiri koncepta DIKW-hijerarhije, pa bilo to samo u metaforičkom smislu, uključena u opis procesa stjecanja znanja. Ali na koji način 'stablo znanja' simbolizira opći proces stjecanja znanja u kojemu se načini stjecanja znanja čovjeka i računala bitno ne razlikuju? I računalo svoje izvorne podatke crpi iz 'vanjskog svijeta' kao i čovjek. Međutim i njegovo 'znanje' (baš kao i čovjekovo), a kako to slika 'stabla znanja' zorno prikazuje, odnosi se na sadržaj koji je pohranjen u njegovoj memoriji. Ono što računalu nedostaje i po čemu se kvaliteta njegova znanja razlikuje od kvalitete čovjekovog znanja, odnosi se jedino na umnije 'umno sunce', drugim riječima na učinkovitiju umjetnu inteligenciju koja bi tim znanjem inteligentnije upravljala... To je dovoljno da se izvede zaključak da se načini strojnog i čovjekova stjecanja znanja u temelju i ne moraju razlikovati.

U završnom dijelu rada pokušat će se pokazati na koji način proces stjecanja znanja ispunjava uvjete za postajanje problemom informacijskih znanosti.

4. Teorijske pretpostavke uspostave procesa stjecanja znanja kao problema informacijske znanosti

Najprije valja naglasiti kako namjera ovog rada nije bila razmatrati problem stjecanja znanja s drugih stajališta poput pedagoškog, psihološkog i sl. Djelomična pozornost usmjerila se jedino prema epistemološkom stajalištu. No kako je u prethodnom poglavlju izloženo, postoji i stajalište prema ovom problemu koje nužno nije zahtijevalo čak ni epistemološke konotacije. Pozornost se usmjerila na sâm proces stjecanja znanja o svijetu kojim su čovjek i računalo okruženi, bez potrebe za odgovorom na pitanja 'postoji li uopće taj svijet' i 'je li on dohvatljiv ljudskim osjetilima'. Pritom se prešutno pretpostavljalo da se uvijek radilo o stjecanju 'znanstvenog znanja'. Stoga ova razmatranja valja smatrati posebnim slučajem vjerojatno šireg okvira načina stjecanja znanja koje bi se odnosilo ne samo na znanstveno nego i ono, uvjetno rečeno, praktično znanje koje je čovjek u trenutku spreman zaboraviti, a kojim barataju njegovo sjećanje i iskustvo. Poopćenje predloženog okvira na sve situacije trebalo bi donijeti usuglašavanje shvaćanja procesa stjecanja znanja u tom širem kontekstu.

Okvirno gledano, na osnovi dosad izloženoga, uspostava procesa stjecanja znanja kao problema informacijskih znanosti počiva na nekoliko pretpostavki. U tom smislu, može se reći da proces stjecanja znanja:

  • ne mora nužno biti predmet epistemologije
  • uspostavlja čvršću vezu između podatka i znanja
  • može se rabiti u kontekstu znanstveno-istraživačkog rada, ali na dubljoj razini od razine na kojoj se razmatra provedba znanstvenih metoda
  • za razliku od drugih problema informacijske znanosti može se opisati pomoću sva četiri DIKW-koncepta
  • može voditi potpunijoj informacijskoj teoriji.

Dakako, svaka od predloženih pretpostavki zahtijeva i svoje pojašnjenje.

1. Kada se pretpostavlja da proces stjecanja znanja nužno ne mora biti predmet epistemologije, u prvom se redu misli da proces stjecanja znanja, za svoju provedbu, ne zahtijeva nužno odgovor na pitanje je li ikakvo znanje moguće. Drugim riječima, problem načina stjecanja znanja ne nalazi se na istoj ravni na kojoj se nalazi problem stjecanja znanja kojim se bavi epistemologija. Za njegovo nesmetano odvijanje nije nužno znati je li riječ o istinitom ili 'vječno istinitom' znanju ili pak znanju koje će tijekom vremena doživjeti svoju reviziju. Proces stjecanja znanja bavi se isključivo praktičnim aspektima načina stjecanja znanja te ne zadire u sudove o istinitosti stečenog znanja. U skladu s Popperovom teorijom o pogrešivosti teorija, to se stajalište čini itekako prihvatljivim. S druge strane, pitanja epistemologije ostaju otvorena na jednak način na koji su to bila i prije računalnog doba.

2. Kuhnov relativistički pogled na razvoj znanosti, kao i Popperova tvrdnja da znanstvenik nikada ne započinje svoje istraživanje pukim promatranjem prirode, u konačnici su doveli do potrebe uspostavljanja čvršće veze između pojma podatka s jedne i pojma znanja s druge strane. Ako su podaci ovisni o teoriji (engl. theory-laden) i time defacto relativni, kao što to sugerira Popper, postaje očito da i za pojam znanja mora vrijediti isti princip. Znanje kao takvo uvijek će biti moguće, ali samo ako je ovisno o prethodno utvrđenim podacima istraživanja. Svi znanstvenici svoja istraživanja temelje na znanstvenim podacima. To znači da se u funkciji podataka mora nalaziti i njihovo, stečeno znanje.

Kako je pokazano, područje računalnog stjecanja znanja (engl. knowledge acquisition), kao i druga srodna područja poput predstavljanja znanja (knowledge representation), ostvaruje vezu podataka i znanja kroz metode računalnog ekstrahiranja podataka i njihova pohranjivanja u bazama znanja. Jedina distinkcija koju valja imati na umu tiče se činjenice da se sâm proces stjecanja znanja u određenoj mjeri različito odvija u čovjeku i računalu.

3. Proces stjecanja znanja često se razmatra u kontekstu odvijanja znanstveno-istraživačkog rada. Međutim ovdje je važno naglasiti da se on pritom izravno ne dotiče provedbe bilo koje znanstvene metode koja se u istraživanju rabi jer se 'odvija' takoreći apriori, prije svake znanstvene metode, indukcije i dedukcije, analize i sinteze i sl., po svoj prilici na dubljoj razini našeg, ali ne samo našega, odnošenja spram stvarnosti.[16]

Svaka od znanstvenih metoda najprije je prisiljena generirati podatke istraživanja i, kako Popper sugerira, najčešće to čini prema obrascu neke već postojeće teorije. Međutim sam odabir i kodiranje podataka ostaje u domeni informacijske teorije i time defacto izvan dosega utjecaja znanstvenih metoda. Dakako, taj problem zahtijeva daljnje promišljanje te je daleko ne samo od svog rješenja nego i od svoje jasne artikulacije.[17]

4. Za razliku od drugih problema informacijske znanosti, proces stjecanja znanja praktički je jedini problem koji za svoj opis zahtijeva sva četiri koncepta DIKW-hijerarhije. S jedne se strane tako nalaze teorijski pojmovi koji se rabe za utemeljenje jedne znanosti, a s druge specifičan elementaran proces koji se pomoću njih može opisati i koji može obuhvatiti većinu, ako ne i sve njezine probleme.

Hvalevrijedan napor, gotovo epskih razmjera, vezan uz utemeljenje informacijske znanosti poduzeo je Chaim Zins u periodu između 2003. i 2007 godine. Na osnovi Kritičke Delphi studije Knowledge Map of Information Science, provedene između 2003. i 2005., napisao je i do 2007. objavio četiri rada u kojima je nastojao iscrtati konture kompletnog područja. Pritom je svoje istraživanje temeljio na analizi i dokumentiranju odgovora uglednih LIS-stručnjaka vezanih uz četiri temeljna aspekta informacijske znanosti: definicije njezinih temeljnih koncepata, uključujući tu i samu definiciju informacijske znanosti, konceptualne pristupe definiranju tzv. primitivnih pojmova informacijske znanosti − podatka, informacije, znanja i klasifikacijske sheme − te na koncu, sustavnu i sveobuhvatnu mapu znanja informacijskih znanosti (Zins 2007).

Čini se da proces stjecanja znanja može poslužiti kao poveznica temeljnih aspekata informacijske znanosti obuhvaćenih Zinsovim istraživanjem, a koja može dovesti do njihove veće integracije. U tom smislu on se nadaje kao jedan od prioritetnih problema informacijske znanosti u narednom periodu njezina razvoja.

5. I u konačnici, čini se da bi pristup proučavanju procesa stjecanja znanja kao problema informacijskih znanosti u narednom periodu mogao dovesti do uspostavljanja potpunije i konzistentnije informacijske teorije, u kojoj ne bi bili samo zastupljeni pojmovi informacije i podatka nego i znanja, značenja, vrednovanja i mudrosti.

Proces stjecanja znanja definitivno je u stanju obuhvatiti sve razine komunikacijskih problema koje je u svom radu spomenuo W. Weaver. Na tehničkoj razini on se odnosi na prijenos informacija, ali i na postupak ekstrahiranja podataka iz 'vanjske stvarnosti' i njihovu ugradnju u postojeće 'tijelo znanja'. Na semantičkoj razini riječ je o pridruživanju značenja prethodno ekstrahiranim podacima odnosno informacijama i uspostavi novog znanja u postojećem 'tijelu znanja', na razini učinkovitosti pak on se može odnositi na postupke vrednovanja i izvođenja novog znanja iz postojećeg.

Shannonova teorija odatle predstavlja teorijski opis samo jednog dijela procesa stjecanja znanja, i to onog koji se odnosi na odabir podataka i prijenos informacija. Kako će izgledati potpunija inačica informacijske teorije, koja bi uključivala sve DIKW-koncepte te se temeljila na svim aspektima procesa stjecanja znanja, ostaje vidjeti.

5. Zaključak

Problem stjecanja znanja u prvom je redu problem epistemologije ili teorije znanja, zasebne grane filozofije. Međutim problem načina stjecanja znanja, kako je u radu pokazano, ne mora nužno imati epistemološke konotacije.

U radu je dan prikaz procesa stjecanja znanja koji se može primijeniti kako na tradicionalno odnosno čovjekovo stjecanje znanja, koje se razmatra u filozofskoj literaturi, tako i na strojno, koje je u novije doba predmet računalne, informacijske i drugih znanosti. Proces stjecanja znanja zamišljen je da se odvija na razini na kojoj nije nužno znati je li znanje koje u njemu nastaje istinito ili ne. Na taj način, slijedom radova T. Kuhna i K. Poppera, i samo znanje, zajedno s podacima na kojima se temelji, postaje relativno. Tako shvaćen proces stjecanja znanja pronalazi svoj izraz u konceptu DIKW-hijerarhije, modelu na kojemu se već temelji dio teorije informacijske znanosti. Iako DIKW-model u literaturi nailazi na sve ozbiljnije kritike, naglašeno je da bi uz odgovarajuću reviziju mogao zadržati ulogu simbola i teorijskog utemeljitelja informacijske znanosti i drugih srodnih područja. Ali isto bi tako mogao postati i simbolom općeg procesa stjecanja znanja, koji bi se u jednakoj mjeri mogao odnositi na čovjekovo i strojno stjecanje znanja. Temeljem još nekih pretpostavki, poput ostvarivanja čvršće povezanosti pojmova podatka i znanja te neovisnog odvijanja tog procesa u odnosu na provedbu znanstvenih metoda u kontekstu znanstveno-istraživačkog rada, proces stjecanja znanja stječe sve uvjete da istakne svoju kandidaturu za mjesto primarnog problema informacijskih znanosti (pored drugih problema spomenutih u ovom radu, poput informacijskog pretraživanja ili znanstvene komunikacije).

Proces stjecanja znanja od ključne je važnosti za uspostavu čvršćih temelja informacijske znanosti u strukturi 'tijela znanja' te u budućnosti može dovesti i do revizije postojeće informacijske teorije. Međutim ovaj put informacijska teorija mogla bi se temeljiti i na pojmovima znanja i značenja, koji, u neku ruku, predstavljaju 'svojinu' znanstvenika društvenih i humanističkih znanosti. Zahvaljujući tomu ta bi teorija mogla evoluirati u potpuniju i općenitiju teoriju informacije koja bi se u znatno konzistentnijoj mjeri mogla nadovezivati na postojeću, ali i svaku buduću, teoriju znanja. 


Literatura

  • Ackoff, R. L. 1989. From data to wisdom." Journal of Applied Systems Analysis 16: 3 − 9. Alavi, M. i D. Leidner. 2001. Review: knowledge management and knowledge management systems: conceptual foundations and research issues." MIS Quarterly 25, 1: 107 − 142.Alberico, R. i M. Micco. 1990. Expert systems: for reference and information retrieval, London: Meckler.
  • Antoniou, G., P. Groth, F. Van Hermelen i R. Hoekstra. 2012. A semantic web primer. Cambridge, Massachusetts; London, England: MIT Press.
  • Berčić, B. 2012. Filozofija: svezak drugi. Zagreb: Ibis grafika.
  • Borgman, C. L. 2006. What can studies of e-learning teach us about collaboration in e-research? Some findings from digital library studies." Computer Supported Cooperative Work 15: 359 − 383.
    https://doi.org/10.1007/s10606-006-9024-1
  • Borgman, C. L. 2007. Scholarship in the digital age: information, infrastructure, and the Internet. Cambridge, Massachusetts: MIT Press.
  • Borko, H. 1968. Information science: What is it?" American Documentation 19, 1: 3 − 5.
    https://doi.org/10.1002/asi.5090190103
  • Bosančić, B. 2016. "Information in the knowledge acquisition process." Journal of Documentation 72, 5: 930-960. http://dx.doi.org/10.1108/JD-10-2015-0122
  • Bowker, G.C. 2005. Memory practices in the sciences, Cambridge, Massachusetts: MIT Press.
  • Bush, V. 1945. As We May Think." Atlantic monthly 176, 7: 101 − 108. Capurro, R. i B. Hjørland. 2003. The concept of information." Annual Review of Information Science and Technology 37, 1: 343 − 411.
  • Caspi E., A. J. Shankar i J. Wang. 2004. As We May Think, Vannevar Bush. http://www.moralfiber.org/eylon/berkeley/cs294-classics/bush-lecture/bush-as-we-may-think.pdf (pristupljeno 29.4.2016.)
  • Clark, Donald. 2004. The continuum of understanding. http://www.nwlink.com/~donclark/performance/understanding.html (pristupljeno 29.4.2016.)
  • Cleveland, H. 1982. Information as resource." The Futurist 12: 34 − 39.
  • Compact Oxford English Dictionary. http://www.askoxford.com/concise_oed/knowledge?view=uk (pristupljeno 29.4.2016.)
  • David, P. A. 2004. Towards a cyberinfrastructure for enhanced scientific collaboration: providing its 'soft' foundations may be the hardest part. Oxford Internet Institute research reports: University of Oxford.
  • David, P. A. i M. Spence. 2003. Towards institutional infrastructures for e-science: the scope of the challenge. Oxford Internet Institute research reports: University of Oxford. http://www.oii.ox.ac.uk/research/publications/RR2.pdf (pristupljeno 14.05.2016)
  • De Solla Price, D. J. 1963. Little science, big science. New York, London: Columbia University Press.
  • Dhar, V. 2013. Data science and prediction." Communications of the ACM 56, 12: 64 − 73.
    https://doi.org/10.1145/2500499
  • Filozofijski rječnik. 1965. Zagreb: Matica hrvatska.
  • Floridi, L. 2010. Information: a very short introduction. Oxford: University Press.
    https://doi.org/10.1093/actrade/9780199551378.001.0001
  • Floridi, L. 2011. The philosophy of information. Oxford: Oxford University Press.
    https://doi.org/10.1093/acprof:oso/9780199232383.001.0001
  • Frické, M. 2009. The knowledge pyramid: a critique of the DIKW hierarchy." Journal of Information Science 35, 2: 131 – 142.
    https://doi.org/10.1177/0165551508094050
  • Gleick, J. 2011. The information: a history, a theory, a flood. London: Fourth Estate.
  • Gruber, T. R. 1993. A translation approach to portable ontology specifications." Knowledge Acquisition 5, 2: 199 – 220.
  • Hey, T. i A. Trefethen. 2003. The data deluge: an e-science perspective, http://eprints.soton.ac.uk/257648/1/The_Data_Deluge.pdf (pristupljeno 14.05.2016)
  • Jackson, P. 1999. Introduction to expert systems. Harlow, England; Reading, Massachusetts: Addison-Wesley
  • Kalin, B. 1995. Povijest filozofije: s odabranim tekstovima filozofa. Zagreb: Školska knjiga.
  • Kuhn, T. 2013. Struktura znanstvenih revolucija. Zagreb: Jesenski i Turk.
  • Legg, C. 2010. Ontologije na semantičkom webu." Vjesnik bibliotekara Hrvatske 53, 1: 155 − 206.
  • Lyotard, J. F. 1997. The postmodern condition: A report on knowledge. Minneapolis: University of Minnesota Press.
  • Ma, L. 2012. Meanings of information: the assumptions and research consequences of three foundational LIS theories." Journal of the American Society for Information Science and Technology 63, 4: 716 – 723.
  • Neurath, O. 1932. Protokolsatze." Erkenntnis 3: 204 − 214. Nonaka, I. 1994. A dynamic theory of organizational knowledge creation." Organization Science, 5, 1: 14-37.
  • Nonaka, I. i H. Takeuchi. 1995. The knowledge-creating company: how Japanese companies create the dynamics of innovation. New York: Oxford University Press.
  • O'Hear, A. 2007. Uvod u filozofiju znanosti. Zagreb: Hrvatski studiji.
  • Peirce, C.S. i J. Buchler. 1955. Philosophical writings of Peirce. Mineola, New York: Dover Publications.
  • Platon. 1979. Fileb : [ili o nasladi, etički dijalog] ; i Teetet : [ili o znanju, istraživački dijalog]. Zagreb: Naprijed.
  • Popper, K. Logika naučnog otkrića. Beograd: Nolit, 1972.
  • Rowley, J. 2007. The wisdom hierarchy: representations of the DIKW hierarchy." Journal of Information Science 33, 2: 163 − 180. Saračević, T. 1999. Information science." Journal of the American Society for Information Science 50, 12: 1051 – 1063.
  • Saračević, T. 2006. Informacijska znanost." U: Prilozi utemeljenju informacijske znanosti, urednica T. Aparac-Jelušić, 109-131. Osijek: Filozofski fakultet Osijek.
  • Shannon, C. E. 1948. A mathematical theory of communication." Bell System Technical Journal 27, 3: 379–423, 623 − 656.
    https://doi.org/10.1002/j.1538-7305.1948.tb01338.x
  • Shannon, C. E. i W. Weaver. 1963. The mathematical theory of communication. Urbana: University of Illinois Press.
  • Sharma, N. 2008. The origin of the data information knowledge wisdom (DIKW) hierarchy, https://www.researchgate.net/publication/292335202_The_Origin_of_Data_Information_Knowledge_Wisdom_DIKW_Hierarchy (pristupljeno 14.05.2016)
  • Shedroff, N. 2001. An overview of understanding." Information anxiety 2, 27 – 29.
  • Šikić, Z. 1995. Filozofija matematike. Zagreb: Školska knjiga.
  • Smith, B. i C. Welty. 2001. Ontology: towards a new synthesis." Proceedings of the International conference on formal ontology in information systems, iii-x. Sosa, E. 1980. The raft and the pyramid: coherence versus foundations in the theory of the knowledge." Studies in the epistemology, Midwest studies in philosophy 5.
  • Williamson, T. 2000. Knowledge and its limits. Oxford University Press.
  • Zeleny, M. 1987. Management support systems: Towards integrated knowledge management." Human Systems Management 7, 1: 59 − 70. Zins, C. 2007. Conceptual approaches for defining data, information, and knowledge." Journal of the American Society for Information Science and Technology 58, 4: 479 – 493.

Abstract

Knowledge acquisition process as an issue in information sciences

The paper presents an overview of some problems of information science which are explicitly portrayed in literature. It covers the following issues: information explosion, information flood and data deluge, information retrieval and relevance of information, and finally, the problem of scientific communication. The purpose of this paper is to explain why knowledge acquisition, can be considered as an issue in information sciences. The existing theoretical foundation within the information sciences, i.e. the DIKW hierarchy and its key concepts - data, information, knowledge and wisdom, is recognized as a symbolic representation as well as the theoretical foundation of the knowledge acquisition process. Moreover, it seems that the relationship between the DIKW hierarchy and the knowledge acquisition process is essential for a stronger foundation of information sciences in the 'body' of the overall human knowledge. In addition, the history of both the human and machine knowledge acquisition has been considered, as well as a proposal that the DIKW hierarchy take place as a symbol of general knowledge acquisition process, which could equally relate to both human and machine knowledge acquisition. To achieve this goal, it is necessary to modify the existing concept of the DIKW hierarchy. The appropriate modification of the DIKW hierarchy (one of which is presented in this paper) could result in a much more solid theoretical foundation of the knowledge acquisition process and information sciences as a whole.

The theoretical assumptions on which the knowledge acquisition process may be established as a problem of information science are presented at the end of the paper. The knowledge acquisition process does not necessarily have to be the subject of epistemology. It may establish a stronger link between the concepts of data and knowledge; furthermore, it can be used in the context of scientific research, but on the more primitive level than conducting of scientific methods. Moreover, the description of this process, as opposed to other problems of information sciences, necessarily involves all four DIKW concepts. Finally, the solution of this problem may result in a more complete theory of information.

Keywords: knowledge acquisition, knowledge acquisition process, information, data, knowledge, DIKW hierarchy


[1] U svojoj knjizi Little science, Big science (1963) Derek J. De Solla Price pružio je uvid u etimologiju problema informacijske eksplozije eksplicitno pokazavši da porast broja objavljenih znanstvenih časopisa, kao i radova u njima, podliježe eksponencijalnim zakonitostima.

[2] U novije vrijeme, pogotovo u poslovnoj literaturi, sve češće je prisutan termin 'podatkovna znanost' (engl. data science) i shodno njoj 'podatkovni znanstvenici' (engl. data scientist) (usp. Dhar, 2013).

[3] Sam memex zamišljen je kao stroj koji dokumente pohranjuje ili na mikrofilmu ili u obliku skeniranih slika. Pretraživanje teksta po ključnim riječima nije bilo predviđeno, već samo navigacija kroz pohranjene dokumente.

[4] U Bushovu obranu vrijedno je izdvojiti njegovu ideju povezivanja dokumenata putem stiska gumba, a što se smatra idejom pretečom hipertekstualnog povezivanja dokumenata na današnjem webu.

[5] Knjiga Jamesa Gleicka The Information: A Theory, a flood, objavljena 2011., iako popularno znanstvene provenijencije, koristan je pregledni izvor informacija o fenomenu informacijske poplave koji je, čini se, zahvatio sve segmente današnjeg društva. 

[6] E- prefiks posjeduje dugu povijest značenja „elektronički“ (npr. elektronička pošta, elektronička prodaja i sl.) dok cyber- prefiks vuče svoje porijeklo od pojma cyberspace koji je prvi put spomenut u romanu W. Gibsona Neuromancer 1984.

[7] Na metaforu piramide i splavi ukazao je Ernest Sosa svojim radom iz 1980. "The Raft and the Pyramid: Coherence versus Foundations in the Theory of Knowledge."

[8] U vezi s tim pitanjem filozofija, konkretno epistemologija, nebrojeno je puta završila u slijepoj ulici. Konačno, uvid da znanje može biti pogrešivo dobilo je i svoj naziv – falibilizam – iako falibilizam znači i da možemo znati kada ne znamo da znamo. U kontekstu falibilizma u filozofskoj literaturi često se spominje upravo metafora Neurathova broda (usp. Berčić 2012).

[9] Kurt Gödel dokazao je 1931. svoje teoreme nepotpunosti i nekonzistentnosti 'matematičkih istina'. Prvim teoremom dokazao je da je nemoguće matematičku teoriju potpuno formalizirati, čak i ako ona obuhvaća elementarnu matematiku. Drugim teoremom pokazao je da konzistentnost takve formalizacije nije dokaziva u tom formalnologičkom sustavu. Drugim riječima, matematika ne može biti u isto vrijeme i potpuna i konzistentna (usp. Šikić, 1995).

[10] Drugo područje koje bi se moglo spomenuti jest procesuiranje prirodnog jezika (engl. natural language processing). Problem procesuiranja prirodnog jezika čini se osobito teškim, a posebno se tiče standardne računalne znanosti jer ukoliko bi bio riješen, odnosno ukoliko bi računalo nedvosmisleno moglo razumjeti sve što mu se kaže, to bi imalo za posljedicu suvišnost tradicionalnog programiranja kao takvog. To se ipak u dogledno vrijeme ne čini ostvarivim.

[11] Postupak ekstrahiranja znanja od ljudskog eksperta poznat je pod nazivom inženjerstvo znanja (engl. knowledge engineering).

[12] Library of Congress Subject Headings. URL: http://id.loc.gov/authorities/subjects.html

[13] Mesh - http://www.thesaurus.com/browse/mesh

[14] Za iscrpniji prikaz DIKW hijerarhije, s posebnim osvrtom na suvremena kretanja oko tog koncepta, vidjeti u Bosančić (2016).

[15] Apscisa je Clarkova koordinatnog sustava Razumijevanje, a ordinata Kontekst. Pritom su podacima dodijeljene najmanje vrijednosti Razumijevanja i Konteksta, a mudrosti najveće.

[16] U svojoj knjizi The Philosophy of Information (2011) Luciano Floridi naglašava metodu razina apstrakcije (engl. level of abstraction) kao temeljnu metodu filozofije informacije, kojom se stvarnost može na taj način 'dohvatiti'.

[17] Neke naznake ovog problema spominju se i u radu Information in the knowledge acquisition process (Bosančić 2016). Ukratko, u kontekstu Shannonove teorije informacije podaci znanstvenih istraživanja mogu se svesti na skup mogućnosti 'vanjske stvarnosti', odnosno prostorno-vremensku zbilju kao takvu, a matematičke metode (geometrija, algebra i sl.) kojim ih dohvaćamo na način njihova kodiranja.

Article Metrics

Metrics Loading ...

Metrics powered by PLOS ALM

Refbacks

  • There are currently no refbacks.
X




Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Libellarium (Online). ISSN 1846-9213 © 2008

ERIH PLUS
doaj.png



Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.