Faili yoyote ya kompyuta imeundwa na ka. Baiti inaweza kuchukua maadili kutoka 0 hadi 255. Entropy ya habari ni kigezo cha takwimu ambacho kinaonyesha uwezekano wa kutokea kwa ka fulani kwenye faili.
Unaweza kuibua kutazama kiwango cha entropy ukitumia histogram - usambazaji wa uwezekano wa kurudia ka sawa kwenye faili. Kutoka kwa entropy ya faili, tunaweza kudhani ni aina gani ya faili iliyo mbele yetu, tukiona tu histogram yake.
Kwa maonyesho, wacha tuchukue faili tatu za aina tofauti na linganisha histogramu zao. Wacha kwanza iwe faili ya maandishi (*. TXT). Histogram yake imeonyeshwa kwenye takwimu:
Faili ya maandishi ina maandishi tu. Kila tabia ya maandishi imefungwa na ka fulani kulingana na jedwali la usimbuaji. Ingawa kuna idadi kubwa ya aina za usimbuaji, ni dhahiri kuwa kuna idadi ndogo ya herufi za alphanumeric, ambayo kawaida huwa chini ya 255. Kwa hivyo, ni maeneo kadhaa tu ambayo huchukuliwa kwenye histogram ya kwanza, na baiti zingine sio kabisa.
Faili ifuatayo itakuwa katika muundo wa PDF:
Faili hii ina kaiti zote zinazowezekana, kwani PDF imesimbwa tofauti na faili za maandishi. Inahifadhi habari nyingi za huduma: fomati, fonti, picha, nk. Lakini histogram yake inaonyesha kwamba baadhi ya kaa zinaonekana na uwezekano sawa, wakati zingine - mara nyingi zaidi kuliko zingine. Kwa hivyo milipuko mikali kwenye histogram, na kwa jumla ina muonekano "chakavu" badala yake, ingawa inachukua upana wote unaopatikana.
Na faili ya mwisho imefungwa kwa muundo wa 7Z:
Histogram hii ina sifa kuu mbili: kwanza, ka zote zinapatikana kwenye faili iliyofungwa na uwezekano zaidi au chini sawa (ukingo wa juu tambarare), na pili, hakuna nafasi ya bure juu ya histogram, ambayo inaonyesha kutokuwepo kabisa. ya upungufu wa faili kama hiyo. Kwa hivyo, tunaweza kuhitimisha kuwa hesabu ya jalada kwa njia fulani maalum "inachanganya" kaiti za faili ili kufikia usambazaji wao wa kiwango cha juu.
Kwa hivyo, entropy katika sayansi ya kompyuta, kama fizikia, ni kipimo cha shida katika mfumo, katika kesi hii, shida katika usambazaji wa ka kwenye faili. Entropy hukuruhusu kuhukumu kiwango cha ukandamizaji wa faili na - moja kwa moja - kuhusu aina yake.