Informacije i podaci
Većina ljudi koristi termine "informacija" i "podatak" kao sinonime, iako oni to nisu. Termin podatak se odnosi na podatke zapisane u računaru. Veoma često oni ne znače mnogo ljudima. Uglavnom su kodirani i nerazumljivi za ljude. Informacija je podatak kome je dodata neka vrednost ili oznaka kako bi bio razumljiv za čoveka. Na primer, "3" i "L" su podaci. Oni se međusobno razlikuju, ali oba sama za sebe ne znače ništa. Međutim, ukoliko ispred broja 3 dodamo znak za dolar, "$3", tada ovaj podatak dobija određeno značenje. Slično, ukoliko se drugi podatak, slovo L, nalazi na majici koju želite da kupite, tada je potpuno jasno njegovo značenje. Dakle, informacija je podatak koji se nalazi u određenom kontekstu koji mu daje značenje.
Prikupljanje i priprema podataka
Da bi kompjuterski sistem uradio bilo šta korisno, neophodno je da ima podatke sa kojima radi. Bez njih, sistem ne bi imao šta da procesira, pa samim tim ni šta da proizvede. Da bi podaci bili ubačeni u računar, neophodno je da oni prvo budu prikupljeni.
Prikupljeni podaci često nisu u odgovarajućoj formi, kako bi bili ubačeni u računar. Najjednostavniji primer je nečiji datum rođenja, koji može biti zapisan u nekoliko oblika:
18 novembar 1983, 18-11-1983, 18.11.1983 i dr.
Pre nego što ovi podaci budu ubačeni u računar, neophodno je da se pripreme kako bi svi bili u zapisani u istoj formi. U suprotnom, prilikom procesiranja bi došlo do nepredviđenih grešaka.
I drugi tipovi podataka treba da se pripreme za unos. Na primer, ako merite temperaturu termometrom, ona može da ima bilo koju vrednost i može da sadrži nekoliko decimalnih mesta. Ovakvi podaci se nazivaju analognim. Analogni podaci su fizičke veličine, kao što su temperatura, dužina i druge. Kompjuteri nisu u stanju da obrađuju analogne podatke. Zbog toga je neophodno da se ovakva vrsta podataka prvo digitalizuje, kako bi računari mogli da ih koriste. Ovo je takođe vid pripreme podataka.
Unos podataka i provera
Kada se podaci unose u kompjuter, neophodno je da se spreči mogućnost unosa pogrešnih podataka. Nema svrhe potrošiti velike iznose novca na skupu opremu i softver, ako se pogrešni podaci unose u sistem. Postoje dva vida provere ulaznih podataka:
- verifikacija
- validacija.
Verifikacija podataka je proveravanje da li su podaci koje su unose u sistem zaista oni koji su predviđeni da se unesu. Na primer, ukoliko se na formularu nalazi datum rođenja neke osobe 18/11/83, a operater unese 19/11/83, tada je načinjena greška prilikom unosa. Postoje dva načina da se ovo izbegne:
- provera unetih podataka naknadnim čitanjem i poređenjem sa originalnim podacima (koji su se unosili)
- istovremeni unos istih podataka od strane dve osobe. Kompjuter poredi unete podatke i ukoliko dođe do neslaganja, traži da podaci budu ponovo uneti.
Koji će se metod koristiti, zavisi od konkretne primene i važnosti podataka. Ukoliko se radi o datumu rođenja studenta, tada nije toliko važno ukoliko dođe do greške. Međutim, ukoliko se radi o bankovnom računu, tada ne sme da dođe greške pri unosu, pa je trošak angažovanja dve osobe za unos podataka isplativ u tom slučaju.
Validacija podataka je provera da li je unet odgovarajući tip podataka. Validaciju obavlja sam kompjuter, sledeći pravila koja su mu unapred data. Na primer, ako želite da računar proveri da li je datum unet u odgovarajućem obliku, tada čete mu zadati da uporedi prve dve cifre da li su manje od 32. Ukoliko greškom operater unese broj 35, računar će znati da je pogrešan, jer ne zadovoljava pravilo.
Postoji veliki broj načina validacije. Prethodno opisan se naziva provera opsega. Drugi često korišten je provera karaktera. Na primer, u slučaju sa unosom datuma, mogli bismo računaru da zadamo da proverava da li su uneti karakteri cifre i kosa crta. Ukoliko bi neko uneo 18/e1/83, pravilo bi bilo prekršeno i računar bi znao da ulazni podaci nisu dobri. Provera dužine unosa bi osigurala da bude uneto 8 karaktera, dok bi provera formata osigurala da cifre budu podeljene u grupe po dve, odvojene kosom crtom.
Pri unosu bar kodova vrši se poseban tip provere. Nakon skeniranja bar koda, računar vrši posebne aritmetičke operacije sa svim ciframa sem jedne. Rezultat tih operacija treba da bude preostala cifra. Ukoliko se dobije drugačiji rezultat, znači da je bar kod pogrešno pročitan.
Organizacija fajlova
Pogledajte sledeći skup podataka o studentima:
Ovo je samo mali deo podataka koji bi se verovatno čuvali u sekretarijatu nekog fakulteta. Ceo skup podataka o studentima se naziva fajl. Obzirom da podataka ima puno, oni su organizovani u grupe, u ovom slučaju jednu grupu čine podaci o jednom studentu. Ove grupe se nazivaju slogovi (records). Svaki slog je predstavljen jednim redom.
Svaki od slogova sadrži nekoliko različitih podataka. Svaki od podataka se naziva stavka (item) i smešten je u posebnom polju (field). U jednom od polja (ID) se stavke u svim slogovima razlikuju. Ovakvo polje služi za identifikaciju sloga i naziva se ključno polje (key field).
Na ovaj način je ceo fajl podeljen na manje delove, koji sad mogu biti lako pretraživani.
Slogovi unutar tabele na slici su složeni u određenom redosledu u odnosu na ključno polje. Ovakvi fajlovi se nazivaju sekvencijalni. Ovakav način smeštanja podataka olakšava pretraživanje i lociranje pojedinog sloga.
Ukoliko slogovi nisu složeni u nekom posebnom redosledu, već se čuvaju onim redom kojim su unošeni, radi se o serijskom fajlu. Ovakvi fajlovi nisu preterano korisni, obzirom da je u njima veoma teško pronaći informaciju. Serijski fajlovi se obično kreiraju za čuvanje podataka koji neće odmah biti korišćeni. Na primer, zapisi o svim transakcijama neke radnje mogu biti sačuvani kao serijski fajl, a zatim na kraju dana taj fajl može biti konvertovan u sekvencijalni, kako bi se podaci dalje pretraživali i obrađivali.
Alternativa konvertovanju serijskog u sekvencijalni fajl jeste kreiranje indeksa i dozvoljavanje da slogovi budu snimljeni svuda na disku. Svaki slog tada može biti pronađen jednostavnim pretraživanjem indeksa, u kome je upisana i lokacija sloga. Ovakvi fajlovi se nazivaju fajlovi sa direktnim pristupom (direct access file) i koristi se u slučajevima kada je nemoguće predvideti u kome redosledu će podaci biti potrebni.
Bez obzira na vrstu fajla (zapisa), neophodno je da oni obezbede i sledeće mogućnosti:
- promenu podataka
- umetanje novih podataka
- brisanje podataka
Različiti tipovi podataka
Podaci se čuvaju u računaru u binarnom obliku. To znači da je svaki podatak kodiran na poseban način, kako bi mogao da bude zapamćen u računaru. Kada pritisnete taster A, kompjuter karakter A transformiše u odgovarajući kod koji se čuva u kompjuteru. Kod za karakter A je 01000001. Slično ako unesete broj 65, on prvo biva kodiran u 01000001, pa tek onda zapamćen. Problem nastaje kada računar treba da pročita iz memorije ono što je upisano. Kodovi za slovo A i broj 65 su isti. Da bi računar mogao da zna da pravilno pročita podatak, neophodno je da zna koji tip podataka je upisan, da li je to karakter ili broj.
Zbog toga je neophodno da kažete računaru koji tip podataka upisujete, bilo prilikom programiranja ili prilikom upisivanja u bazu podataka.
Numerički tipovi
- celi brojevi (integer) – ne sadrže decimale
- realni brojevi – sadrže decimalni deo
Novčani iznosi
Poseban tip podataka, koji se često koristi u bazama podataka, jeste currency. On služi za predstavljanje realnih brojeva sa dva decimalna mesta, kojima je pridružena i oznaka valute.
Datum
Iako je i datum numerički podatak, u bazama podataka se koristi kao poseban tip podatka, kako bi bilo moguće izvršiti validaciju.
Tekst
Tekstualni tipovi podataka se koriste za smeštanje podataka koji nemaju nikakvo skriveno značenje i sa kojima se ne vrše nikakva izračunavanja. Ovakvi podaci samo treba da budu sačuvani onako kako su uneti sa tastature. Nazivaju se i alfanumeričkim tipovima.
Logički podaci
Logički podaci (boolean) imaju dve moguće vrednosti, obično true i false. Puno se koriste za proveru različitih uslova.
Zadatak 11.1
Pogledajte tabelu sa podacima o studentima datu u ovoj lekciji.
Odgovor:
Ime – alfanumerički tip, sastoji se od karaktera unetih sa tastature.
Pol – boolean tip. Ima samo dve moguće vrednosti.
Mentor – alfanumerički tip. Predstavlja ime osobe koje se sastoji samo od karaktera unetih sa tastature.
Datum – datum rođenja studenta
Integer – broj dana koliko je student izostao sa nastave
Zadatak 11.2
Bolnica koristi računarski sistem za čuvanje podataka o pacijentima.
a) Objasnite dve provere koje bi lekar trebalo da obavi kako bi bio siguran da gleda u podatke o odgovarajućem pacijentu.
b) Navedite tip fajla koji bi se koristio u sistemu i objasnite zbog čega.
Odgovor:
- proveriti da li se simptomi podudaraju
- proveriti datum rođenja
- proveriti fotografiju
b) – fajl sa direktnim pristupom
- indeksiran sekvencijalni fajl
razlog: neophodno je brzo pristupanje podacima
3. promena:
- promena adrese
- promena imena
- ispravljanje greške nastale pri unosu podataka
brisanje:
- pacijent više ne treba tretman
- pacijent se odselio
- pacijent je umro
ubacivanje:
- novi pacijent se doselio
- pacijent dolazi prvi put
- novorođeno dete
4. – podaci moraju da budu aktuelni
- podaci mogu da se koriste samo za svrhe lečenja pacijenta
- podaci moraju da budu precizni i tačni
- podaci moraju da budu uništeni kada više ne postoji potreba za njima
- korisnik podatka mora da bude registrovan
- samo ovlašćene osobe mogu da imaju pristup podacima
5. – nadgledanje pacijentovog stanja
- administrativni poslovi bolnice
- skener
- plate
- ekspertski sistem za dijagnostiku
- e-mail / podsetnik / rokovnik
- kontrolisanje različitih uređaja (klime, alarma i sl.)