Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537
在數(shù)字信息的海洋中,文字是連接過去與未來的橋梁。然而,當(dāng)這些文字被囚禁在圖像和PDF的牢籠中時,它們便失去了自由流動的力量。在這個世界里,有一個名為Umi的OCR軟件,它如同一位解放者,將文字從束縛中解救出來,賦予它們新的生命。
初春的午后,陽光透過半開的窗簾,灑在了李明的辦公桌上。他的目光落在了電腦屏幕上,那里顯示著一份密密麻麻的英文報(bào)告。作為一名數(shù)據(jù)分析師,他每天都要處理大量的文檔,從中提取關(guān)鍵信息。但是,今天的工作似乎比往常更加繁重,因?yàn)檫@份報(bào)告是掃描版的PDF,文字被牢牢地鎖定在圖像之中。
李明嘆了口氣,他知道這意味著他需要手動輸入這些文字,或者尋找一種方法將它們轉(zhuǎn)換成可編輯的文本。他記得曾經(jīng)聽說過OCR技術(shù),但市面上的軟件要么價格昂貴,要么需要依賴網(wǎng)絡(luò)連接。作為一名對技術(shù)充滿好奇心的人,他決定自己動手,尋找一個解決方案。
他打開了瀏覽器,輸入了“離線OCR軟件”幾個字,屏幕上立刻跳出了無數(shù)個搜索結(jié)果。就在這時,一個名為“Umi-OCR”的軟件吸引了他的注意。根據(jù)網(wǎng)頁上的描述,這是一款免費(fèi)、開源且支持批量操作的離線OCR軟件,它支持Windows和Linux系統(tǒng),并且內(nèi)置了多國語言庫。
李明的心跳微微加速,他感到一種探險(xiǎn)者發(fā)現(xiàn)新大陸般的興奮。他點(diǎn)擊了下載鏈接,一個小巧的.7z壓縮包很快就下載完成了。他雙擊文件,解壓到了桌面上的一個新建文件夾中。
軟件的界面簡潔而直觀,沒有過多的裝飾,給人一種專業(yè)而高效的感覺。李明注意到界面的右上角有一個齒輪圖標(biāo),他點(diǎn)擊了它,進(jìn)入了全局設(shè)置。在這里,他可以調(diào)整軟件的各種參數(shù),包括語言、主題、字體大小,甚至是OCR插件的選擇。
他選擇了中文作為界面語言,軟件立刻響應(yīng)了他的選擇,所有的菜單和提示都變成了熟悉的中文。李明滿意地點(diǎn)了點(diǎn)頭,然后切換到了“截圖OCR”標(biāo)簽頁。他閱讀了使用說明,了解到他可以通過快捷鍵喚起截圖功能,然后軟件會自動識別圖中的文字。
他決定先做一個小測試。李明打開了一個新的截圖工具,截取了報(bào)告的第一頁,然后將圖片復(fù)制并粘貼到了Umi-OCR中。軟件立刻響應(yīng),開始處理圖片。幾秒鐘后,屏幕上顯示出了識別結(jié)果,文字被整齊地排列在了窗口的右側(cè)。
李明仔細(xì)對比了原文和識別結(jié)果,發(fā)現(xiàn)準(zhǔn)確率相當(dāng)高,只有極少數(shù)的地方需要手動修正。他的心情變得激動起來,這正是他所需要的工具。他開始想象,有了Umi-OCR,他的工作效率將大大提高,再也不需要為處理掃描文檔而煩惱。
他繼續(xù)探索軟件的其他功能。在“批量OCR”標(biāo)簽頁中,他看到了支持多種圖片格式的選項(xiàng),以及文本后處理的功能,這可以讓識別后的文本更加適合閱讀和使用。他還發(fā)現(xiàn)了“忽略區(qū)域”的功能,這在處理含有水印或頁眉頁腳的文檔時非常有用。
在“文檔識別”標(biāo)簽頁中,李明發(fā)現(xiàn)Umi-OCR不僅能處理圖片,還能識別PDF和其他電子文檔中的文字。他嘗試著打開了報(bào)告的PDF版本,軟件很快就完成了識別,并且提供了雙層可搜索的PDF輸出選項(xiàng)。
最后,他在“二維碼”標(biāo)簽頁中發(fā)現(xiàn)了掃碼和生成碼的功能。雖然這與他的工作不直接相關(guān),但李明覺得這是一個很有趣的額外功能。
當(dāng)李明關(guān)閉Umi-OCR的時候,窗外的夕陽已經(jīng)開始西下。他感到一種深深的滿足感,因?yàn)樗溃瑥慕裉扉_始,他的工作方式將徹底改變。Umi-OCR不僅是一個軟件,更是一個解放者,它解放了被囚禁在圖像中的文字,也解放了李明的生產(chǎn)力。
上文使用AI潤色軟件介紹,看官酌情輕噴,以下是軟件的正式介紹
軟件來源于開源;文末有下載地址
簡介:
OCR , free and offline. 開源、免費(fèi)的離線OCR軟件。支持截屏/批量導(dǎo)入圖片,PDF文檔識別,排除水印/頁眉頁腳,掃描/生成二維碼。內(nèi)置多國語言庫。
適用環(huán)境:
適用于 x64 、Linux x64
使用方法/教程:
軟件發(fā)布包下載為 .7z 壓縮包或 .7z.exe 自解壓包。自解壓包可在沒有安裝壓縮軟件的電腦上,解壓文件。
本軟件無需安裝。解壓后,點(diǎn)擊 Umi-OCR.exe 即可啟動程序。
界面語言
Umi-OCR 支持的界面多國語言。在第一次打開軟件時,將會按照你的電腦的系統(tǒng)設(shè)置,自動切換語言。
如果需要手動切換語言,請參考下圖,全局設(shè)置→語言/ 。
標(biāo)簽頁
Umi-OCR v2 由一系列靈活好用的標(biāo)簽頁組成。您可按照自己的喜好,打開需要的標(biāo)簽頁。
標(biāo)簽欄左上角可以切換窗口置頂。右上角能夠鎖定標(biāo)簽頁,以防止日常使用中誤觸關(guān)閉標(biāo)簽頁。
截圖OCR
截圖OCR:打開這一頁后,就可以用快捷鍵喚起截圖,識別圖中的文字。
文本后處理
關(guān)于 OCR文本后處理 - 排版解析方案:可以整理OCR結(jié)果的排版和順序,使文本更適合閱讀和使用。預(yù)設(shè)方案:
上述方案,均能自動處理橫排和豎排(從右到左)的排版。(豎排文字還需要OCR引擎本身支持)
批量OCR
批量OCR:這一頁用于批量導(dǎo)入本地圖片進(jìn)行識別。
忽略區(qū)域
關(guān)于 OCR文本后處理 - 忽略區(qū)域:批量OCR中的一種特殊功能,適用于排除圖片中的不想要的文字。
文檔識別
文檔識別:
二維碼
掃碼:
Aztec,Codabar,Code128,Code39,Code93,DataBar,,,EAN13,EAN8,ITF,,,,,PDF417,QRCode,UPCA,UPCE
生成碼:
全局設(shè)置
全局設(shè)置:在這里可以調(diào)整軟件的全局參數(shù)。常用功能如下:
調(diào)用接口:構(gòu)建項(xiàng)目第零步:(可選)fork本項(xiàng)目第一步:下載代碼
請參考 更新日志 開頭的說明。
后續(xù)步驟:
請?zhí)D(zhuǎn)下述倉庫,完成對應(yīng)平臺的開發(fā)/運(yùn)行環(huán)境部署。
下載發(fā)行版
以下發(fā)布鏈接均長期維護(hù),提供穩(wěn)定版本的下載。
?Scoop (點(diǎn)擊展開)
Scoop 是一款Windows下的命令行安裝程序,可方便地管理多個應(yīng)用。您可以先安裝 Scoop ,再使用以下指令安裝 Umi-OCR :
scoop bucket add extras
scoop install extras/umi-ocr
scoop install extras/umi-ocr-paddle
*請認(rèn)真填寫需求信息,我們會在24小時內(nèi)與您取得聯(lián)系。