Tömörítő program a jegyzetben levő redundancia megállapításához
Mióta vannak modern számítógépek, azóta van egy egyszerű módszer arra,
hogy valamilyen becslést végezzünk egy adott információhalmaz (szöveg,
adatsor, kép) redundanciájának megállapítására. Elég elindítani egyet
az elterjedt tömörítő programok közül, amelyek megpróbálják a számítógépes
állományokat a lehető legkisebbre összezsugorítani (természetesen úgy,
hogy az eredeti információ később visszaállítható legyen), és megnézni
az eredeti és a tömörített állomány méretének hányadosát.
Próbáljuk meg lefuttatni az alábbi parancsokat, melyekkel betömöríthetjük
a jegyzet fő szövegét és megnézhetjük az így keletkező állomány méretét.
Természetesen a tömörítés fokára kapott érték (kb. 63%) csak a szövegben
előforduló jelek statisztikai redundenciájára vonatkozik (a tömörítő
programok az ismétlődő karaktersorozatokat helyettesítik egy rövidebb
kóddal), a szöveg jelentésének redundanciája (az ismétlődő gondolatok
száma) így nem számolható ki.
[dos prg\pkarc -a proba ?].....az összes fő szövegfile betömörítése
egy PROBA.ARC nevű állományba
[dos prg\pkarc -v proba].......az eredeti és a tömörített file-ok
méretének listája és a tömörítés foka
[dos del proba.arc]............a tömörített file letörlése