精選分類 書庫 完本 排行 原創專區
欣可小說 > 純愛耽美 > 重生之乘風而起 > 第743章 新方案

重生之乘風而起 第743章 新方案

作者:二子從周 分類:純愛耽美 更新時間:2026-03-16 11:51:16

  第743章 新方案

  “按照任昉《述異記》陸居曰熊,水居曰能的說法,還可以讓我們聯想到另外一個傳說。”

  “傳說大禹治水,娶塗山氏,在工地豎起一麵鼓,讓塗山氏聽到鼓響,就送飯前來。”

  “之後大禹就化作一頭大熊開山,結果有一日工作太投入,飛揚的石頭打到了鼓上,大禹卻冇有注意到。”

  “塗山氏聽到鼓聲送飯過來,發現夫君居然是一頭大熊,受驚過度,化作了石像。”

  “大禹悲痛萬分,對石像說你化作石像可以,把兒子給我留下啊。”

  “說完石像中腹突然打開,一個小孩從石像裏掉了出來,這就是‘啟’這個名字的由來。”

  這一連串的故事和知識,讓對麵計算機係的大佬們都聽得津津有味,周至這才說道:“這傳說是不是也說明,大禹也繼承了鯀的能力,能夠變化成熊或熊(尼)?”

  “而大禹是不是因為感受到父親的淒慘命運,最終決定打破禪讓製度,將天下傳給了自己的兒子?”

  “是不是還能算作一個側證,證明大禹治水的傳說,是發生在陶石骨器並用的部落聯盟時代?”

  “所以大家看,熊(尼),(骨係)這兩個生僻字如果真的消失了,是不是就會造成上述華夏文明部分資訊資料的缺失?是不是會在將來產生一些無法解答的疑案?會不會造成我們子孫的困惑?”

  “以前是因為條件所限,國人受教育程度不高,快速普及文字,掃除文盲是重中之重,所以簡化字的推行勢在必然。GB2312也發揮了巨大的作用。”

  “可如果現在條件明明已經允許了,如果我們已經有機會將所有的文字都采集下來,記錄下來,可我們還是無動於衷,讓這些文字就這樣消失在曆史的長河裏,而不將之留給子孫,會不會是一種將來的遺憾?”

  “如果我們的子孫,因為我們的原因,今後不再知道熊(尼),(骨係)這兩個字以及這兩個字上說承載的曆史文化資訊的話,那我們該不該算是……民族的罪人?!”

  “資訊技術最早出來之前,曾經有西方人認為,漢字必將因為計算機技術的誕生而消亡。”

  “經過我們的努力之後,有了GB2312漢字編碼,向那些人證明瞭他們之前就是純粹的胡說八道。”

  “而我認為,正是因為資訊技術的發展,解決了漢字書寫記憶困難的問題,漢字的推廣應用,甚至完全可能產生革新性的變化。”

  “GB2312,證明瞭我們能行,GB 13000,證明瞭我們能夠做得更好,那麽我們為什麽不趁熱打鐵,乾脆就一次性給它做到極致?”

  “做到極致是什麽意思?”李紅江再不敢輕視眼前這小孩了,他是真不知道漢字中承載的這些東西,或者說壓根冇有重視。

  這也是如今中國學界普遍的一種想象,瘋狂追趕階段,哪裏還敢追求完美?現階段夠用,解決當前問題,就已經是絕大多數理工科學者的最高目標了。

  “做到極致的意思,就是新的字庫編碼,要做到曆史全相容,當前全收集,未來可拓展。”周至倒是一點不怵:“曆史全相容的意思,就是新的字庫,可以完全相容GB2312和GB13000編碼。已經用這兩種編碼錄入的文字資訊,用新的編碼同樣能夠完整地讀出來。”

  “當前全收集,則指當前我們已知的漢字元號,包括大陸簡化字,寶島、港澳、新島的繁體字,還有島國,朝韓所用的一些漢字元號,全部采納到新編碼體係中來。”

  “未來可拓展的意思,就是要給字庫留夠充足的冗餘編碼空間,給將來采集更多的文字元號做好準備。”周至侃侃而談:“剛剛旦增大師已經說了,我國是多民族的國家,很多民族都有自己的文字,這些文字,同樣是我們華夏一族大家庭的瑰寶。”

  “因此我們要留足這個字庫的拓展空間,以備將來時機成熟後,將這些少數民族的文字也收納進來。”

  “這就是我的設想,關於華夏標準大字庫的設想。”

  “呃……周至同學。”李紅江倒也是光棍:“我給你道個歉,也給辜老和旦增大師道個歉,之前自己的確冇有意識到這個問題的重要性。”

  “但是我之前已經說了,GB 13000是根據ISO/IEC 1064來設計的,通用多八位編碼字元集的碼位就隻有兩萬多個,就好像一個養殖場,雞籠子就這麽多,實在是裝不下你們說的這麽多雞啊?”

  “所以說這個多八位編碼字元集是有問題的呀,不適閤中國的需要呀,那我們為什麽還要湊合著用呢?”周至反問道。

  “要是不用這個,那又用哪個呢?”李紅江倒是不覺得周至是在無理取鬨,能夠提出問題來不是本事兒,關鍵是問題提出來之後,伱還得能夠解決問題纔算。

  “為什麽不用UNICODE呢?”

  “UNICODE?”李紅江想了一下:“UNICODE八字還冇一撇吧?國際標準都還冇有出來,我們哪來的參照?”

  Unicode的漢語翻譯,叫做統一碼,也叫萬國碼、單一碼,是由統一碼聯盟開發的一項計算機科學領域裏的業界標準,主要就包括字元集和編碼方案。

  統一碼是為瞭解決傳統的字元編碼方案的侷限而產生的,它為每種語言中的每個字元,設定了統一並且唯一的二進製編碼,以滿足跨語言、跨平台進行文字轉換、處理的要求。

  統一碼設計之初的目的,就是為了打造一個能夠容納世界上所有文字和符號的字元編碼方案。

  其設計思路,就是用數字0-0x10FFFF來對映所有字元,最多可以容納1114112個字元,或者說有1114112個碼位。

  後世大家所熟悉的UTF-8、UTF-16、UTF-32,其實都是將數字轉換到程式數據的編碼方案。

  當然這些碼位也不是隨便亂用的,而是規定了區間,比如上一世給漢字使用的區間,就是3400-4DBF,4E00-9FFF,20000-3FFFF三段,稱作:中日韓越統一表意文字區間。

  這就有一百多萬個碼位,裝下所有漢字綽綽有餘。

  因為不存在上限,UTF理論上還可以繼續擴展。

  當然從上一世的經驗來看,也完全冇有這個必要,足夠用了。

  (本章完)

目錄
設置
設置
閱讀主題
字體風格
雅黑 宋體 楷書 卡通
字體風格
適中 偏大 超大
儲存設置
恢複默認
手機
手機閱讀
掃碼獲取鏈接,使用瀏覽器打開
書架同步,隨時隨地,手機閱讀
收藏
聽書
聽書
發聲
男聲 女生 逍遙 軟萌
語速
適中 超快
音量
適中
開始播放
推薦
反饋
章節報錯
當前章節
報錯內容
提交
加入收藏 < 上一章 章節列表 下一章 > 錯誤舉報