日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > > 充電吧
[導讀]?? 為啥需要Unicode?????? 我們知道計算機其實挺笨的,它只認識0101這樣的字符串,當然了我們看這樣的01串時肯定會比較頭暈的,所以很多時候為了描述簡單都用十進制,十六進制,八進制表示.

?? 為啥需要Unicode

?

????? 我們知道計算機其實挺笨的,它只認識0101這樣的字符串,當然了我們看這樣的01串時肯定會比較頭暈的,所以很多時候為了描述簡單都用十進制,十六進制,八進制表示.實際上都是等價的,沒啥太多不一樣.其他啥文字圖片之類的其他東東計算機不認識.那為了在計算機上表示這些信息就必須轉(zhuǎn)換成一些數(shù)字.你肯定不能想怎么轉(zhuǎn)換就怎么轉(zhuǎn),必須得有定些規(guī)則.于是剛開始的時候就有ASCII字符集(American Standard Code for Information Interchange, "美國信息交換標準碼),它使用7 bits來表示一個字符,總共表示128個字符,我們一般都是用字節(jié)(byte,即8個01串)來作為基本單位.那么怎么當用一個字節(jié)來表示字符時第一個bit總是0,剩下的七個字節(jié)就來表示實際內(nèi)容.后來IBM公司在此基礎(chǔ)上進行了擴展,用8bit來表示一個字符,總共可以表示256個字符.也就是當?shù)谝粋€bit是0時仍表示之前那些常用的字符.當為1時就表示其他補充的字符.

??????? 英文字母再加一些其他標點字符之類的也不會超過256個.一個字節(jié)表示主足夠了.但其他一些文字不止這么多 ,像漢字就上萬個.于是又出現(xiàn)了其他各種字符集.這樣不同的字符集交換數(shù)據(jù)時就有問題了.可能你用某個數(shù)字表示字符A,但另外的字符集又是用另外一個數(shù)字表示A.這樣交互起來就麻煩了.于是就出現(xiàn)了Unicode和ISO這樣的組織來統(tǒng)一制定一個標準,任何一個字符只對應(yīng)一個確定的數(shù)字.ISO取的名字叫UCS(Universal Character Set),Unicode取的名字就叫unicode了.

????? 總結(jié)起來為啥需要Unicodey就是為了適應(yīng)全球化的發(fā)展,便于不同語言之間的兼容交互,而ASCII不再能勝任此任務(wù)了.

?

Unicode詳細介紹

?

1.容易產(chǎn)生后歧義的兩字節(jié)

??????? unicode的第一個版本是用兩個字節(jié)(16bit)來表示所有字符

??????? .實際上這么說容易讓人產(chǎn)生歧義,我們總覺得兩個字節(jié)就代表保存在計算機中時是兩個字節(jié).于是任何字符如果用unicode表示的話保存下來都占兩個字節(jié).其實這種說法是錯誤的.

???? 其實Unicode涉及到兩個步驟,首先是定義一個規(guī)范,給所有的字符指定一個唯一對應(yīng)的數(shù)字,這完全是數(shù)學問題,可以跟計算機沒半毛錢關(guān)系.第二步才是怎么把字符對應(yīng)的數(shù)字保存在計算機中,這才涉及到實際在計算機中占多少字節(jié)空間.

???? 所以我們也可以這樣理解,Unicode是用0至65535之間的數(shù)字來表示所有字符.其中0至127這128個數(shù)字表示的字符仍然跟ASCII完全一樣.65536是2的16次方.這是第一步.第二步就是怎么把0至65535這些數(shù)字轉(zhuǎn)化成01串保存到計算機中.這肯定就有不同的保存方式了.于是出現(xiàn)了UTF(unicode transformation format),有UTF-8,UTF-16.

?

2.UTF-8 與UTF-16的區(qū)別

??? UTF-16比較好理解,就是任何字符對應(yīng)的數(shù)字都用兩個字節(jié)來保存.我們通常對Unicode的誤解就是把Unicode與UTF-16等同了.但是很顯然如果都是英文字母這做有點浪費.明明用一個字節(jié)能表示一個字符為啥整兩個啊.

?? 于是又有個UTF-8,這里的8非常容易誤導人,8不是指一個字節(jié),難道一個字節(jié)表示一個字符?實際上不是.當用UTF-8時表示一個字符是可變的,有可能是用一個字節(jié)表示一個字符,也可能是兩個,三個.當然最多不能超過3個字節(jié)了.反正是根據(jù)字符對應(yīng)的數(shù)字大小來確定.

?? 于是UTF-8和UTF-16的優(yōu)劣很容易就看出來了.如果全部英文或英文與其他文字混合,但英文占絕大部分,用UTF-8就比UTF-16節(jié)省了很多空間.而如果全部是中文這樣類似的字符或者混合字符中中文占絕大多數(shù).UTF-16就占優(yōu)勢了,可以節(jié)省很多空間.另外還有個容錯問題,等會再講


? 看的有點暈了吧,舉個例子.假如中文字"漢"對應(yīng)的unicode是6C49(這是用十六進制表示,用十進制表示是27721為啥不用十進制表示呢?很明顯用十六進制表示要短點.其實都是等價的沒啥不一樣.就跟你說60分鐘和1小時一樣.).你可能會問當用程序打開一個文件時我們怎么知道那是用的UTF-8還是UTF-16啊.自然會有點啥標志,在文件的開頭幾個字節(jié)就是標志.

EF BB BF 表示UTF-8

FE FF 表示UTF-16.

?

用UTF-16表示"漢"

假如用UTF-16表示的話就是01101100?? 01001001(共16 bit,兩個字節(jié)).程序解析的時候知道是UTF-16就把兩個字節(jié)當成一個單元來解析.這個很簡單.

用UTF-8表示"漢"

用UTF-8就有復雜點.因為此時程序是把一個字節(jié)一個字節(jié)的來讀取,然后再根據(jù)字節(jié)中開頭的bit標志來識別是該把1個還是兩個或三個字節(jié)做為一個單元來處理.

0xxxxxxx,如果是這樣的01串,也就是以0開頭后面是啥就不用管了XX代表任意bit.就表示把一個字節(jié)做為一個單元.就跟ASCII完全一樣.

110xxxxx 10xxxxxx.如果是這樣的格式,則把兩個字節(jié)當一個單元

1110xxxx 10xxxxxx 10xxxxxx 如果是這種格式則是三個字節(jié)當一個單元.

這是約定的規(guī)則.你用UTF-8來表示時必須遵守這樣的規(guī)則.我們知道UTF-16不需要用啥字符來做標志,所以兩字節(jié)也就是2的16次能表示65536個字符.

而UTF-8由于里面有額外的標志信息,所有一個字節(jié)只能表示2的7次方128個字符,兩個字節(jié)只能表示2的11次方2048個字符.而三個字節(jié)能表示2的16次方,65536個字符.

由于"漢"的編碼27721大于2048了所有兩個字節(jié)還不夠,只能用三個字節(jié)來表示.

所有要用1110xxxx 10xxxxxx 10xxxxxx這種格式.把27721對應(yīng)的二進制從左到右填充XXX符號(實際上不一定從左到右,也可以從右到左,這是涉及到另外一個問題.等會說.

剛說到填充方式可以不一樣,于是就出現(xiàn)了Big-Endian,Little-Endian的術(shù)語.Big-Endian就是從左到右,Little-Endian是從右到左.

由上面我們可以看出UTF-8需要判斷每個字節(jié)中的開頭標志信息,所以如果一當某個字節(jié)在傳送過程中出錯了,就會導致后面的字節(jié)也會解析出錯.而UTF-16不會判斷開頭標志,即使錯也只會錯一個字符,所以容錯能力強.

?

Unicode版本2

??? 前面說的都是unicode的第一個版本.但65536顯然不算太多的數(shù)字,用它來表示常用的字符是沒一點問題.足夠了,但如果加上很多特殊的就也不夠了.于是從1996年開始又來了第二個版本.用四個字節(jié)表示所有字符.這樣就出現(xiàn)了UTF-8,UTF16,UTF-32.原理和之前肯定是完全一樣的,UTF-32就是把所有的字符都用32bit也就是4個字節(jié)來表示.然后UTF-8,UTF-16就視情況而定了.UTF-8可以選擇1至8個字節(jié)中的任一個來表示.而UTF-16只能是選兩字節(jié)或四字節(jié)..由于unicode版本2的原理完全是一樣的,就不多說了.

前面說了要知道具體是哪種編碼方式,需要判斷文本開頭的標志,下面是所有編碼對應(yīng)的開頭標志

EF BB BF    UTF-8
FE FF     UTF-16/UCS-2, little endian
FF FE     UTF-16/UCS-2, big endian
FF FE 00 00  UTF-32/UCS-4, little endian.
00 00 FE FF  UTF-32/UCS-4, big-endian.

其中的UCS就是前面說的ISO制定的標準,和Unicode是完全一樣的,只不過名字不一樣.ucs-2對應(yīng)utf-16,ucs-4對應(yīng)UTF-32.UTF-8是沒有對應(yīng)的UCS


本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉