Coimpiutaran, Prògramadh
ASCII (còd inbheach Ameireaganach airson eadar-theangachadh fiosrachaidh) - encoding teacs bunaiteach airson aibidil Laidinn
A rèir an Aonaidh Cian-chonaltraidh Eadar-nàiseanta, ann an 2016 chleachd trì gu leth billean duine an eadar-lìon leis an seo no gu cunbhalach. Chan eil a 'mhòr-chuid dhiubh eadhon a' smaoineachadh gu bheil teachdaireachd sam bith air a bheil còd teachdaireachdan a chuir iad tro choimpiutairean no innealan-làimhe, a bharrachd air teacsaichean a tha air an taisbeanadh air a h-uile seòrsa de sgrùdaidhean. Tha e a 'solarachadh agus a' toirt gu mòr a 'stòradh, a làimhseachadh agus a sgaoileadh. Ann an 1963, chaidh an còdachadh ASCII Ameireagaidh a leasachadh, is e cuspair an artaigil seo.
Taisbeanadh fiosrachaidh anns a 'choimpiutair
Bho thaobh coimpiutair dealanach sam bith, is e cruinneachadh de shamhlaidhean fa leth a th 'anns an teacsa. Chan eil a-mhàin litrichean san àireamh aca, a 'gabhail a-steach litrichean mòra, ach cuideachd comharran puingeachaidh, àireamhan. A bharrachd air sin, tha samhlaidhean sònraichte "=", "&", "(" agus tha àiteachan air an cleachdadh.
Is e an aibidil a th 'air an t-seata de shamhlaidhean a tha a' dèanamh suas an teacsa, agus is e an àireamh a tha an cumhachd (air ainmeachadh mar N). Gus a dhearbhadh, cleachd an abairt N = 2 ^ b, far a bheil b an àireamh de dhuilleagan no cuideam fiosrachaidh samhla sònraichte.
Tha e air a dhearbhadh gu bheil aibidil le comas de 256 caractar a 'ceadachadh na samhlaidhean riatanach a riochdachadh.
On a tha 256 an 8mh cumhachd de dhà, tha 8 cuideam aig cuideam gach samhla.
Is e aonad de 8 bit a th 'air aonad de 8 bit, mar sin tha e àbhaisteach a ràdh gu bheil còd dàimheach caractar sam bith anns an teacsa a tha air a stòradh air a' choimpiutair a 'fuireach ann an aon bhreac de chuimhne.
Mar a tha còdadh ag obair
Thèid teacsaichean sam bith a chur a-steach mar chuimhneachan air a 'choimpiutair pearsanta a' cleachdadh iuchraichean a 'mheur-chlàr, air a bheil àireamhan sgrìobhte, litrichean, comharran puingeachaidh agus samhlaidhean eile. In memory a tha iad a chraoladh ann an Binary code, ie, gach samhla chlàradh gu eòlach deicheach code for neach bho 0 gu 255, a tha a 'co-fhreagairt gu Binary code - .. Bho 00000000 gu 11111111.
Tha còdachadh charactaran Byte-byte a 'leigeil leis a' phròiseasar a bhith a 'coileanadh teacsadh airson gach caractar air leth. Aig an aon àm, tha 256 caractar gu leòr airson fiosrachadh caractaran sam bith a riochdachadh.
Encoding charactaran ASCII
Tha an geàrr-chunntas sa Bheurla mar chòd inbhe Ameireaganach airson eadar-theangachadh fiosrachaidh.
Fiù 's aig àm a' choimpiutaireachd, dh'fhàs e follaiseach gum faod thu diofar dhòighean fiosrachaidh a chòdachadh. Ach, airson fiosrachadh a ghluasad bho aon choimpiutair gu fear eile, bha e riatanach aon inbhe a leasachadh. Mar sin, ann an 1963 anns na Stàitean Aonaichte, nochd clàr de chòdachadh ASCII. Ann, tha samhla sam bith den aibidil coimpiutair air a thoirt dha àireamh srathaidh anns an riochdachadh dà-chànanach. An toiseach, cha deach an còdachadh ASCII a chleachdadh ach sna Stàitean Aonaichte, agus an uairsin thàinig e gu bhith na inbhe eadar-nàiseanta airson a 'choimpiutair.
Clàr-innse Clàr-innse
Tha na còdan ASCII air an roinn ann an 2 phàirt. Chan e an ìre eadar-nàiseanta a-mhàin a 'chiad leth den chlàr seo. Tha e a 'toirt a-steach samhlaidhean le àireamhan òrduighil bho 0 (air a chòdachadh mar 00000000) gu 127 (còd 01111111).
Àireamh nan sreath N | Encoding Teacsa ASCII | Samhla |
0 - 31 | 0000 0000 - 0001 1111 | Is e comharran-stiùiridh a th 'ann an samhlaidhean le N bho 0 gu 31. Is e an obair aca a bhith a "stiùireadh" a 'phròiseas airson teacsa a thoirt gu monitor no inneal clò-bhualaidh, a' toirt comharra claistinn, msaa. |
32 - 127 | 0010 0000 - 0111 1111 | Caractaran le N bho 32 gu 127 (pàirt àbhaisteach a 'bhùird) - litrichean àrda agus nas ìsle de aibidil Laidinn, 10 àireamhan, comharran puingeachaidh, a thuilleadh air diofar camagan, samhlaidhean malairteach agus eile. Tha samhla 32 na àite. |
128 - 255 | 1000 0000 - 1111 1111 | Faodaidh eadar-dhealachaidhean eadar-dhealaichte a bhith aig samhlaidhean le N bho 128 gu 255 (pàirt eile den chlàr no duilleag còd), le àireamh aca fhèin. Tha duilleag còd air a chleachdadh gus na h-aibidil nàiseanta a chomharrachadh, a tha eadar-dhealaichte bhon Laideann. Gu h-àraidh, is e a chuideachadh a tha ASCII air a chòdachadh airson caractaran Ruiseanach. |
Clàr còdachadh uppercase agus lowercase litrichean a 'leantainn a chèile ann an òrdugh aibidileach agus àireamhan - dìridh luachan. Tha am prionnsabal seo air a ghleidheadh cuideachd airson aibidil na Ruis.
Caractaran smachdachaidh
Chaidh an clàr còdachadh ASCII a chruthachadh an toiseach gus fiosrachadh fhaighinn agus a tharraing thairis air inneal nach deach a chleachdadh airson ùine mhòr, mar teletpeit. Ann an co-cheangal ris an seo, bha neo-phrìomhachas air a ghabhail a-steach ann an seata caractaran, air a chleachdadh mar òrdughan airson smachd a chumail air an inneal seo. Chaidh òrdughan coltach coltach a chleachdadh ann an dòighean teachdaireachd precomputer mar a 'chòd Morse, agus mar sin air adhart.
Is e an samhla "teletype" as cumanta NUL (00, "neoni"). Tha e fhathast air a chleachdadh anns a 'mhòr-chuid de chànanan phrògraman, a' comharrachadh a 'charactar deireadh-loidhne.
Far a bheil an còdachadh ASCII air a chleachdadh
Feumar còd inbheach Ameireaganach chan ann a-mhàin airson a bhith a 'teacsadh fiosrachadh teacsa bhon mheur-chlàr. Tha e cuideachd air a chleachdadh ann an grafaigs. Gu sònraichte, ann am prògram ASCII Art Maker, tha ìomhaighean de dhiofar leudachadh a 'riochdachadh raon de shamhlaidhean charactar ASCII.
Tha dà sheòrsa de dhà sheòrsa ann: a 'dèanamh obair luchd-deasachaidh grafaigeach le bhith a' tionndadh ìomhaighean gu teacsa agus ag atharrachadh "dealbhan" gu grafaigean ASCII. Mar eisimpleir, tha smiley aithnichte na dheagh eisimpleir de shìmplidh còdachaidh.
Faodar ASCII a chleachdadh cuideachd nuair a bhios tu a 'cruthachadh sgrìobhainn HTML. Anns a 'chùis seo, faodaidh tu seata sònraichte de charactaran a chur a-steach, agus nuair a sheallas tu air an duilleag, nochdaidh samhla air an sgrion a fhreagras ris a' chòd seo.
Tha feum air ASCII cuideachd gus làraichean ioma-chànanach a chruthachadh, oir thèid còdan ASCII a thoirt nan caractaran nach eil nam pàirt de chlàr nàiseanta.
Cuid de na feartan
Gus fiosrachadh teacsa a chòdachadh ann an còdachadh ASCII, chaidh 7 bidean a chleachdadh an toiseach (bha aon falamh), ach an-diugh tha e ag obair mar aon 8-bit.
Tha na litrichean a tha sna colbhan aig a 'mhullach agus aig a' bhonn eadar-dhealaichte bho chèile ach le aon aon rud. Tha seo gu mòr a 'lùghdachadh iom-fhillteachd dearbhaidh.
A 'cleachdadh ASCII ann an Microsoft Office
Ma tha feum air, faodar an seòrsa seo de chòdachadh de dh'fhiosrachadh teacsa a chleachdadh ann an deasachadh teacsa Microsoft, mar Notepad agus Word Office. Ach, nuair a tha thu a 'sgrìobhadh, sa chùis seo, bidh e do-dhèanta cuid de na gnìomhan a chleachdadh. Mar eisimpleir, chan urrainn dhut a bhith a 'cluich trom-dhealbh, oir chan eil an còdachadh ASCII ach a' ciallachadh ciall an fhiosrachaidh, a 'gabhail a-steach coltas agus cruth coitcheann.
Co-òrdanachadh
Tha ISO air gabhail ri ìrean ISO 8859. Tha am buidheann seo a 'mìneachadh chòdan ochd-bit airson diofar bhuidhnean cànain. Gu sònraichte, is e Extended ASCII a tha ann an ISO 8859-1, a tha na chlàr airson na Stàitean Aonaichte agus taobh siar na Roinn Eòrpa. Agus is e clàr 8 a tha air a chleachdadh airson Cyrillic, a 'gabhail a-steach Ruiseanach, ISO 8859-5.
Airson grunn adhbharan eachdraidheil, cha deach an ìre ISO 8859-5 a chleachdadh glè fhada.
Airson cànan na Ruis aig an àm seo, tha còdachadh air a chleachdadh gu fìor:
- CP866 (Code Page 866), no DOS, a tha gu math tric GOST innleachd-chòd eile. Chaidh a chleachdadh gu gnìomhach gu meadhan nan 90an den linn mu dheireadh. Aig an àm seo, cha mhòr nach eil e air a chleachdadh.
- KOI-8. Chaidh an còdachadh a chruthachadh ann an 1970-80an, agus an-dràsta 'se an ìre airson teachdaireachdan puist ann an RuNet. Tha e air a chleachdadh gu farsaing san OS den teaghlach Unix, Linux nam measg. Is e KOI-8R a chanar ris an dreach "Ruiseanach" de KOI-8. A thuilleadh air an sin, tha dreachan ann airson cànanan coire eile, mar eisimpleir, Ucràinis.
- Còd Duilleag 1251 (CP 1251, Windows - 1251). Chaidh a leasachadh le Microsoft Corporation gus taic cànain Ruiseanach a thoirt seachad ann an àrainneachd Windows.
B 'e prìomh bhuannachd a' chiad CP866 gnàthach caomhnadh charactaran sràideagrafaidh anns na h-aon shuidheachaidhean ann an Extended ASCII. Leig seo le prògraman teacsa gun atharrachadh, toradh cèin, mar an Norton Commander ainmeil. Aig an àm seo, tha CP866 air a chleachdadh airson prògraman a chaidh a leasachadh fo Windows a tha ag obair ann am modh teacsa làn-sgrìn no ann an uinneagan teacsa, a 'gabhail a-steach Manaidsear FAR.
Tha teacsaichean coimpiutaireachd sgrìobhte ann an còdachadh CP866 gu math tearc o chionn ghoirid, ach tha e air a chleachdadh airson ainmean fhaidhlichean Ruiseanach ann an Vindous.
"Unicode"
Aig an àm seo, is e an còdachadh as fharsainge a tha seo. Tha còdan unicode air an roinn ann an roinnean. Tha a 'chiad fhear (bho U + 0000 gu U + 007F) a' toirt a-steach caractaran an t-seata ASCII le còdan. An uairsin lean na raointean de shoidhnichean grunn sgriobtaichean nàiseanta, a bharrachd air comharran puingeachaidh agus samhlaidhean teicnigeach. A thuilleadh air an sin, tha cuid de na còdan Unicode air a ghleidheadh ma tha feum air samhlaidhean ùra a ghabhail a-steach san àm ri teachd.
A-nis tha fios agad gu bheil còdachadh ASCII ann, gu bheil gach caractar air a riochdachadh mar mheasgachadh de 8 neamhan is feadhainn. Do neo-eòlaichean, dh'fhaoidte gum bi am fiosrachadh seo riatanach agus gun ùidh, ach nach eil thu airson faighinn a-mach dè a tha a 'tachairt "anns a' ghleus" agad fhèin?
Similar articles
Trending Now