精選分類 書庫 完本 排行 原創專區
欣可小說 > 純愛耽美 > 重生之乘風而起 > 第747章 計算機語言

重生之乘風而起 第747章 計算機語言

作者:二子從周 分類:純愛耽美 更新時間:2026-03-16 11:51:16

  第747章 計算機語言

  “或許還是需要進行人工乾預,但是工作強度已經大大降低,我們可以通過拍照,掃描等方式,將生僻字的圖片掃入計算機,讓程式去分析它,最後得到標準點陣字,編碼之後加入到字庫當中,對字庫進行擴充。”

  “要實現這個功能需要有幾個前提,第一就是字庫當中要有足夠的樣本,這個我們已經已經完成,因為我們現在已經有了四萬個標準點陣字的字稿。”

  “還是拿《康熙字典》來舉例,我們先將《康熙字典》上每一個單字的掃描圖掃入文字識別係統,然後提取其字體參數特征,再將這些參數賦給已有的標準點陣字,讓係統計算出根據這些參數產生的‘係統字’。”

  “再拿這些生成的‘係統字’,與‘掃描字’進行校驗,通過四萬個標準字生成的‘係統字’,去驗證參數的代表性,最後將參數調整到最佳。”

  “得到參數體係之後,我們就能夠將它套在掃描進來的生字上,最終得到《康熙字典》全部近六萬個單字的標準點陣字,字庫就從四萬擴充到六萬了。”

  “這個思路倒是新穎,然而卻也是可行的。”麥明川點頭:“不過還是有問題,就是存儲和運算。”

  “我也拿《康熙字典》來舉例,近六萬個單字,就是近六萬張圖片,我們就拿一張圖片五兆來計算,這就是300G的空間,這也太可怕了。”

  “那王院長覺得,這個係統多大的圖片存儲容量,可以被接受呢?”

  “一個G,”麥明川脫口而出,想了想覺得實在是有點欺負人:“最多最多,兩個G。”

  1G是1024M,兩百張5M的圖片,兩G就是400張。

  “也就是說,如果按照這個標準,這個係統能夠一次同時完成四百個字的掃描分析和成字入庫的工作?”

  “那還得分序列並行。”李紅江已經上套,開始思索程式的工作方式了:“涉及到時間成本,學校也不可能將有限的計算資源全拿來做這事兒。”

  “那我們可不可以像上級求助呢?”周至問道:“我們先把基礎工作做好,然後申請國家級的運算資源來完成它,有冇有機會呢?”

  “國家資源那更緊張,全國無數單位排隊呢。”麥明川苦笑著搖頭。

  辜老說道:“那乾脆這樣,我們將工作再做細一點,肘子說的這個文字識別反向推算點陣字的程式咱們先緩一緩,第一步先集中精力把標準定出來。”

  “與此同時,我們這邊,再把現在的四萬字稿擴到七萬。”

  “小李那邊,抓緊先開發出讀字稿的程式,咱們先把七萬字稿的數字化工作完成。”

  “之後再拿著這七萬漢字的數字化成就,去跟那個統一碼聯盟談判,並且要留夠下一步繼續拓展的空間,力爭讓我們的大字庫成為全球統一標準。”

  “有了這個大字庫,咱們再製定出幾個子集,滿足國內國際不同應用場景的需求。到此我們的第一步工作是不是就算完成了?”

  “至於肘子說的文字識別,那也相當重要。”辜振鐸補充道:“這個可是我們下一步搞典籍數字化的神器啊!”

  辜老不由得歎了一口氣:“這不是資源有限,怕排不上嘛?”

  “那也不一定。”周至說道:“咱們大可以將這些思路都給一股腦兒報上去,咱漫天要價,在等著部委落地還錢,取乎其上,得乎其中嘛!”

  大佬們都鬨笑起來,這肘子是懂部委的,要人家不拿捏你,百分之百滿足你的要求,幾乎都是不可能的,能夠滿足你五成那都是開恩了。

  因此不妨將餅子劃大一點,最後哪怕給砍掉一半,落個小餅子也差不多夠吃。

  今天隻是一個務虛會,算是統合一下思路,研究一下文理跨學科合作的可能性,現在能夠得到一個較為統一的意見,就已經算是超出會議預期了。

  這裏邊主要功勞,還是周至已經完成的前期工作。

  李紅江就握著周至的手,熱切地道:“要不再多修一個資訊工程學位吧?我看肘子伱雖然是文科生,但資訊技術的基礎這麽好,多修個學位一點問題都冇有的。”

  “精力實在是太有限了。”周至隻能婉拒李紅江的好意:“不過那個文字識別係統我是非常有興趣的,李教授要是有興趣,我也可以參與研究。”

  “你對編程熟悉不?BASIC或者PASCAL。”到現在李開江絕不相信周至會是外行。

  “我更熟悉C語言。”周至回憶起當年被代碼支配的恐懼。

  “C?”李紅江感覺自己好像撿到寶了:“那UNIX呢?”

  “UNIX也還行。”周至問道:“學校這是有新引進的小型機了?可以運行ANSI C的那種?”

  對於多數人來說,兩人的對話好比天書。

  計算機語言最基本當然就是直接對晶片操作的指令集,例如最早的打孔紙帶,直接就是零和一的組合。

  這種語言對計算機來說最直接,但是對人來說最不友好。

  於是人們就發明瞭一套基於晶片的“基本指令集”,這就是匯編語言。

  匯編語言同樣還是針對晶片,但是至少可以讓專業人士讀懂這程式是要讓機器乾什麽的了。

  但是匯編語言有個問題,那就是無法移植,因為它是針對某一類晶片開發的,換到另一類晶片上,另一類晶片就看不懂。

  於是人類又想出一種辦法,設計出編譯庫概念和更高一級的程式,這就是麵向過程的編程語言,C語言就是其中的佼佼者。

  C語言很難,原因就在於它具備匯編語言簡潔高效的特征,因此工作迅速,代碼緊湊,可讀性比匯編語言好,最關鍵是容易調試,修改和移植。

  程式員隻負責寫代碼,代碼寫好之後對其進行編譯,就能夠轉化為能讓計算機讀懂的二進製代碼,稱為“應用程式”。

  針對不同的晶片類型,編譯庫中有不同的編譯方式,可以將C語言編寫的程式編譯成能夠在不同係統上運行的程式。

  這就解決了程式的移植問題,讓同一個程式,既可以在DOS係統裏運用,也可以在蘋果係統裏運用,還可以在UNIX係統裏運用,不用分別編寫三套。

  (本章完)

目錄
設置
設置
閱讀主題
字體風格
雅黑 宋體 楷書 卡通
字體風格
適中 偏大 超大
儲存設置
恢複默認
手機
手機閱讀
掃碼獲取鏈接,使用瀏覽器打開
書架同步,隨時隨地,手機閱讀
收藏
聽書
聽書
發聲
男聲 女生 逍遙 軟萌
語速
適中 超快
音量
適中
開始播放
推薦
反饋
章節報錯
當前章節
報錯內容
提交
加入收藏 < 上一章 章節列表 下一章 > 錯誤舉報