KomputerTéhnologi informasi

Encoding inpormasi téks dina komputer

Komputer - a alat canggih jeung nu bisa nyieun, ngarobah, sarta nyimpen informasi. Sanajan kitu, komputer nu teu dianggo jalan pisan kaharti pikeun urang - grafis, téks na data numerik disimpen salaku arrays binér angka. Dina artikel ieu kami baris nempo kumaha encoding tina informasi téks.

Naon keur urang nyaeta teks komputer - tina sekuen karakter. Tiap simbul ngalambangkeun sahiji set tangtu nol na leuwih. Dina simbol dimaksudkan teu ukur luhur jeung hal handap hurup tina Latin alfabét, tapi ogé tanda aos, tanda arithmetic, karakter husus, lambang husus na malah spasi.

encoding binér inpormasi tékstual

Ku mencét hiji tombol nu tangtu dina controller internal ngirimkeun sinyal éléktrik anu dirobah ka kode biner. Kode ieu loyog sareng simbol nu tangtu, anu dipintonkeun dina layar. Pikeun kaluman ka alfabét Latin dina ASCII format digital coding sistem internasional dijieun. Merlukeun 1 bait pikeun ngarekam hiji simbol sahingga ngawengku runtuyan dalapan lambang nol na leuwih. The rekaman interval - ti 00000000 mun 11111111, nyaéta coding inpormasi téks ngagunakeun sistem ieu ngamungkinkeun urang keur ngagambarkeun 256 karakter. Dina kalolobaan kasus, ieu cukup.

ASCII anu dibagi jadi dua bagian. Kahiji 127 karakter (ti 00000000 mun 01111111) mangrupakeun internasional tur mangrupakeun simbul sarta hurup ti aksara Inggris husus. Bagian kadua - di extension (ti 10000000 mun 11111111) - ieu dimaksudkeun pikeun ngawakilan Aksara nasional, tulisan tina nu béda ti Latin.

Inpo téks encoding dina ASCII anu diwangun dina prinsip beuki runtuyan, nyaéta nu leuwih gede jumlah runtuyan hurup, anu gede nilai ASCII-kode na. Pekuncén sarta bagian Rusia meja anu diwangun dina prinsip nu sarua.

Sanajan kitu, di dunya aya sawatara jenis encoding pikeun hurup Sirilik. Paling umum - nyaeta KOI-8 (dalapan bit encoding anu geus dipaké pikeun di 70an di ruifitsirovannyh munggaran sistem operasi Unix), ISO 8859-5 (dikembangkeun ku Biro Standardisasi Internasional), nu CP 1251 (coding informasi tékstual dipaké dina modern OS Windows), kitu ogé 2-bait encoding of Unicode, nu bisa dipaké pikeun ngawanohkeun 65.536 karakter. Misalna rupa-rupa encodings alatan kanyataan yén maranéhanana dimekarkeun dina waktu nu beda, pikeun sistem operasi béda jeung pertimbangan béda. Kusabab ieu, sering boga kasusah basa keur mindahkeun téks ti hiji midiyeum ka midiyeum lianna - ti mismatch panyandian pamaké bakal ningali susunan ikon ngabingungkeun. Kumaha carana abdi tiasa ngalereskeun ieu kaayaan? Dina Kecap, contona, lamun dokumen hiji dibuka, pesen ngeunaan masalah sareng tampilan téks na nawarkeun sababaraha pilihan pikeun transcoding.

Ku kituna, coding jeung ngolah émbaran tékstual di bowels komputer - prosés éta hese jeung waktu-consuming diayakeun. Sadaya lambang alfabét sagala anu hijina réntétan tangtu digit tina sistem biner, hiji sél - ieu téh salah sahiji bait inpormasi.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 su.birmiss.com. Theme powered by WordPress.