Sisukord Arhiiv Toimetus Tellimine Reklaam
Arvutimaailm
Arvutimaailm


E-Riik Võrgud Riistvara Tarkvara Varia


Avatud lähtekoodiga tarkvara

Rakendustarkvara

OP süsteemid

> Tarkvara > OP süsteemid
Print
Failiformaadid, 2
21. veebruar 2004
Autor: Veiko Kukk

Levinud dokumendiformaadid

Elektroonilistele dokumentidele on loendamatu hulk vormingud. Et nende visuaalset eristamist lihtsustada, koosnevad failinimed nimest ja laiendist kujul NIMI.LAIEND, kus viimane on tavaliselt kolmekohaline, harva pikem.

Pikkuse piirang tuleneb ajaloost: DOS võimaldas luua vaid 8.3 failinimesid (nime pikkus võis olla kaheksa märki ja laiendil kolm märki). Taoline tava on eelkõige Microsofti operatsioonisüsteemide pärand. Linuxi ning teiste Unixite kasutajale on abiks käsk file, mille abil saab väga mugavalt kindlaks määrata formaati.

Järgnevalt kirjeldame levinumaid vorminguid, hinnates nende sobivust mingiks tööks.

Pildiformaadid (graafika)

Neid kasutatakse tüüpiliselt fotode, illustratsioonide, tekstilehekülgede ja muu graafilise materjali puhul. Internetis kasutatavatest on levinumad JPEG, GIF, PNG, TIFF, populaarsust kogub ka SVG.

TIFF

on lühend sõnadest Tagged Image Format, laiend on .tif või .tiff.

Loodi algselt Alduse ja Microsofti poolt skannerite ja DTP (desktop publishing) tarkvara ühisformaadiks. Hetkel on see kasutatav nö vaheformaadina erinevate rakenduste vahel, sest selle põhiline trump on kadudeta pakkimine. Viimase eelis ilmeb eriti OCR tarkvara ja digifotograafia puhul, kus soovitakse näiteks fotoaparaadist tulnud infot arvutis töödelda ja kadudega pakkimine tekitaks rohkelt lisaprobleeme (töödeldav peab olema võimalikult originaalilähedane). Ka OCR tarkvarale „meeldib” võimalikult originaalilähedast kujutist analüüsida, et tuvastada sealt kirjamärke.

TIFF on bittraster: tekstiline informatsioon sellel ei ole masinloetav, indekseeritav jne. Samas säilitab laotuse täielikult, suutes ka edasi anda kõikvõimalikke kirjamärke. Pakkimata TIFF on suure mahuga, selle üle võrgu liigutamine ja salvestamine ressursinõudlik. TIFF ei toeta multimeediat ega linke, vajades suure mahu tõttu erinevaid ekraanil esitamise ja prindiversiooni.

GIF

on lühend sõnadest Graphics Interchange Format — laiend on .gif. Vormingu lõi CompuServe Incorporated aastal 1987 (GIF87a) ning seda täiendati 1989 (GIF89a).

GIF sai aastatel 1987–1994 populaarseimaks pildivorminguks Internetis. Sellel on kahjuks mitmeid puudusi, näiteks vaid 256 värvi– või halltooni võimalus, segased patendiküsimused jm. 1994 lõpus teatasid Unisys ja CompuServe, et GIF–i kasutajad peavad litsentsitasusid maksma. Nimelt on Unisys patenteerinud siin pakkimiseks kasutatava algoritmi LZW (Lempel Ziv Welch), mille kasutamisõigust oma rakendustesse on ostnud üle 3000 kliendi.

Viimane riik, kus LZW tehnoloogia patent kaotab kehtivuse, on Jaapan, kus see toimub 20.06.2004. GIF–i patendinduse teemal saab pikemalt lugeda aadressil burnallgifs.org.

Nagu kõik graafikaformaadid, pole ka GIF–is sisalduvat (teksti) võimalik masinlugeda. GIF võimaldab salvestada mitu pilti ühte faili ja panna need vahelduma — seda nimetatakse ka animeeritud GIF–iks. Vorming ei sobi fotodele, küll aga näiteks kuvatõmmistele, graafikutele jms. Üldiselt tuleks eelistada PNG–i.

PNG

on lühend sõnadest Portable Network Graphics — laiend on .png. See loodi GIF–i asendajaks ja järeltulijaks ning sobib osaliselt ka TIFF–i asendajaks.

Veebis on PNG–il GIF–i ees kolm põhilist eelist:

  • erinevate läbipaistvuste toetus (alpha–channel transparency, binary transparency);
  • gamma korrektsioon selleks, et tagada eri platvormidel ühesugune heleduse tase;
  • 2D progressiivne esitlus (2D interlacing).

Üks GIF–i omadus, mida PNG ei püüagi saavutada, on mitmete kujutiste ühes failis hoidmine ja animatsioon. Selleks on loodud MNG (Multiple–image Network Graphics). PNG laseb end pakkida üldiselt umbes 5–25% paremini kui GIF. Kuna kasutatakse kadudeta pakkimist ja toetatakse nii 48–bitist värvussügavust kui 16–bitiseid halltoone, sobib see ka töötluse vaheastmetel kasutamiseks. Samuti kuvatõmmistele, graafikutele ja muude selliste kujutiste salvestamiseks, mille allikas on digitaalne.

Mustvalgete, nii jooniseid kui ka teksti sisaldavate kujutiste puhul annab sageli parema tulemuse TIFF grupp 4 faksikompressioon, samas on PNG laiemalt toetatud.

PNG toetab põhimõtteliselt kolme tüüpi kujutisi — täisvärvides, halltoonides ja paletil baseeruvaid; JPEG toetab esimest kaht ja GIF vaid kolmandat.

Binaarne läbipaistvus tähendab, et iga piksel saab olla läbipaistev või läbipaistmatu, alfa kanaliga läbipaistvus on meetod pildi erinevate osade erineva läbipaistvuse määramiseks. PNG võimaldab alfakanali kaudu kuni 65534 erineva läbipaistvusastme kasutamist! Kõik kolme tüüpi kujutised saavad kasutada alfa kanali informatsiooni. Alfa kanal võimaldab tekitada mitmesuguseid efekte nagu sujuvat läbipaistvuse muutumist, varje, mille värv sõltub taustast (tumedal taustal automaatselt hele vari ja heledal taustal automaatselt tume vari), konaruste silumist (anti–aliasing) jt.

Gamma info salvestamine faili ja selle abil tehtav gammakorrektsioon püüab saavutada olukorda, kus näiteks PC–l tehtud PNG oleks Maci ekraanil sama heledusega, millega see loodi ja vastupidi. Progressiivne esitlus võimaldab sammhaaval, järjest kasvava detailsusega, pilti näidata. Eriti kasulik on see aeglase andmesideühenduse ja suurte failide puhul — sisust võib aimu saada enne, kui see on täielikult laetud.

JPEG

on lühend sõnadest Joint Photographs Expert Group — laiend on .jpg. See on Internetis enim kasutusel olev graafikaformaat (täpsemalt vaid kompressiooniformaat — korrektne nimetus failiformaadile oleks JPEG–JFIF).

Sobib eelkõige analoogallikast pärit graafika (näiteks fotod) salvestamiseks. JPEG–i ei tohiks kasutada kuvatõmmiste ja muu arvutiga loodud graafika salvestamiseks, sest JPEG ei saa hästi hakkama järskude üleminekutega (muudab need uduseks, ähmaseks, moonutab). Trump on sujuvad toonimuutused ja üleminekud. Ka on mõttetu pakkida JPEG formaati mustvalgeid pilte.

JPEG pakib kadudega, mis tähendab, et faili mahu vähendamiseks kaotatakse informatsiooni nii, et inimsilm seda võimalikult vähe märkaks. Sarnasel, meie meeli petval põhimõttel, töötavad enamik video ja heli pakkimise süsteemidest. Pettus põhineb JPEG puhul inimsilma omadusel märgata muutusi värvitoonides vähem kui muutusi heleduses.

JPEG ongi seetõttu loodud inimsilmaga vaatamiseks. Kui soovitakse masinaga pilti analüüsida, peaks see olema kadudeta pakkimise formaadis, sest kuigi silmale paistab pilt kvaliteetne, võivad JPEG–i pakkimise vead masinat eksitada. JPEG võimaldab kompressiooni suures ulatuses reguleerida: on võimalik tekitada hea kvaliteediga, kuid suhteliselt suuremahulisi, ja väga väikese mahuga, kuid kohutava kvaliteediga faile. JPEG–i tuleks salvestada vaid üks kord, sest muidu tekib kadude akumuleerumine, kus eelmine viga võimendab järgmist.

JPEG–i huvitav omadus on see, et esitluskvaliteet sõltub päris palju kasutatavast tarkvarast, õigemini seal kasutatud võtetest. Üks ja sama fail võib sõltuvalt vaatamisprogrammist või selle seadistustest olla erineva kvaliteediga. Muidugi, kvaliteedi kasv tähendab ka suuremat ajakulu.

Ka JPEG toetab progressiivset esitlust, kuid mitte läbipaistvust. Üks oluline asi, mida meeles pidada — ka kõrgeima kvaliteediga JPEG formaadis kujutis on siiski kadudega pakitud!

2000. a detsembris võeti vastu ISO standard JPEG2000, mis kogu vormingut defineerib.

SVG

on lühend sõnadest SVG (Scalable Vector Graphics) — laiend on .svg.

See on vektrograafika vorming veebi jaoks (standard võeti vastu 1. oktoobril 1996. a). Hetkel vähetoetatud, kuid saab lähitulevikus kindlasti väga populaarseks. Praegu on menukaim vektorgraafikaformaat muide SWF, mida enamik tunnevad nimega Flash.

SVG on masinloetav, väikesemahuline; ekraanil esitamiseks ja printimiseks sobib sama versioon; toetab linke, multimeediat ja mitut „lehekülge”. Sellest saab lähemalt lugeda aadressil www.w3c.org/Graphics/SVG.

VRML

on lühend sõnadest Virtual Reality Modeling Language — laiend on .vrml.

Avatud standard kolmemõõtmelise virtuaalse maailma loomiseks veebis, esimene versioon võeti vastu 1997. a detsembris, kuid VRML oli juba enne seda mitteametlik standard andmete liigutamiseks CAD–, animatsiooni– ja 3D–modelleerimisprogrammide vahel.

VRML toetab linke, multimeediat ja on masinloetav. Ilmselt hakatakse seda tulevikus veebikeskkondade loomiseks enam kasutama.

Mille poolest erineb vektorgraafika rastergraafikast?

Rastergraafika on punktmaatriks, milles olevate punktide arv ja maatriksi suurus on konstantsed. Kui pilti suurendada, muutuvad punktid nähtavaks ja visuaalne kvaliteet väheneb.

Vektrograafika on kirjeldus. Kujutise suurendamisel ei teki visuaalse kvaliteedi kadu — vektorgraafika on igal suurendusel „sile”, samuti on enamasti väiksemahulisem, sest ei kirjelda kõiki pildipunkte (vaid umbes nii: siin on ring raadiusega x, mis on seest sinine).

Kahjuks pole vektorformaadi olemuse tõttu võimalik selles esitada muud kui sünteetilisi, inimkäe loodud kujutisi.

(järgneb)

 



Lingid samal teemal:






Arvutimaailm
Telefon: 6938260, E-post: am@am.ee
Aadress: Rahukohtu 2, Tallinn 15169


EIK
Struktuur Meedia