Mac 上下載了一個文件,它作為 RAR 存檔到達,無法打開它以訪問在里面的內容。小編將帶大家了解什么是 RAR 文件以及如何在 Mac 上打開和提取 RAR 文件的所有信息。
什么是 RAR 文件?
RAR 文件類似于 ZIP 文件。兩者都是“歸檔”文件格式,用于將許多單獨的文件壓縮成一個文件。這樣,您只需下載一個文件(或將一個文件附加到電子郵件中),接收者只需下載一個文件,而不是許多單獨的文件。
RAR 代表R oshal AR chive ,以創建該格式的俄羅斯軟件工程師 Eugene Roshal 的名字命名。RAR 格式的創建是為了解決 ZIP 格式中的一些缺陷,并帶來了幾個好處:較小的文件大小、將 RAR 拆分為多個塊的能力以及錯誤恢復。
也就是說,自 ZIP 和 RAR 時代以來,我們已經走了很長一段路,現在我們有了更好的方法來壓縮、加密和傳輸文件。7-Zip 格式是一種流行的選擇,但它與標準相去甚遠。因此,了解如何處理 RAR 文件仍然很重要。
如何在 Mac 上打開和提取 RAR 文件?
RAR 格式是專有的,因此 Mac 系統沒有內置實用程序來處理它也就不足為奇了。但是,該解決方案就像安裝可以在 Mac 上打開 RAR 文件的免費第三方工具一樣簡單。
以下是您可以選擇的三個 RAR 提取選項。
1.用 Keka 打開 RAR 文件
Keka 是一種壓縮和提取工具,可作為獨立安裝使用。安裝后,您所要做的就是雙擊 RAR 文件以將其解壓縮,或者按住 Control 鍵單擊一個文件并選擇Open。
至少對某些用戶而言,使用 Keka 的不利之處在于,如果不先解壓縮 RAR 文件,就無法瀏覽它的內容。您可能永遠不需要此功能,在這種情況下,這是完成工作的絕佳工具。但是,如果您喜歡能夠查看檔案內容并只提取您需要的文件,那么 Keka 不是適合您的應用程序。
請注意,Keka 可以創建自己的壓縮檔案,但它不支持 RAR 格式。您只能使用 ZIP、7-Zip、TAR、GZIP 和 BZIP2 格式。
2.使用 Unarchiver 解壓 RAR 文件
Unarchiver 是您在 Mac 上打開 RAR 所需的唯一應用程序。它比原生 macOS 實用程序強大數倍,并支持無限多的存檔格式。該工具仍有許多可自定義的選項,可以按照您想要的方式提取檔案。
它的一個方便的功能是它支持存檔文件名的非拉丁字符。這樣,您可以提取名稱中包含外來字符的 RAR 文件。
Unarchiver 還支持許多其他存檔格式,包括 ZIP、7Z、GZIP、CAB 等。
3.使用 Unarchiver 和“自動操作”解壓 RAR 文件
如果您定期提取 RAR 文件,上述工具可能會感覺效率低下。幸運的是,您可以使用“自動操作”來自動執行 RAR 提取任務。
Unarchiver 將與自動操作協同工作,創建一個文件夾操作,自動解壓縮 RAR 檔案中的所有文件。
在“自動操作”中創建此操作后,您需要做的就是將 RAR 存檔放在指定的文件夾中以提取它們。創建動作的方法如下:
1.在桌面上創建一個新文件夾并將其命名為Unrar。
2.打開Unarchiver,單擊“解壓”選項卡,然后從“解壓歸檔到”下拉菜單中選擇“歸檔的相同文件夾”。
3.啟用“移動歸檔到廢紙簍”,以便您的檔案在解壓縮后被刪除。
4.啟動“自動操作”,單擊文件 > 新建。
選擇“文件夾操作”,然后單擊“選取”。
5.單擊頂部的下拉菜單,選擇“其他”,然后選擇您的Unrar文件夾。
6.將“查找查找項目”操作拖到右側的工作流程中。
7.在新添加的操作中,從“搜索”下拉列表中選擇您的Unrar文件夾,然后從以下下拉列表中選擇“任何”。接下來,選擇文件擴展名,然后選擇“包含”,然后在框中輸入rar。
8.將“打開查找器項目”操作拖到右側窗格中。
9.從打開方式下拉菜單中選擇Unarchiver。
10.按Cmd + S,輸入工作流的名稱,然后單擊Save。然后關閉 Automator。
11.將您要解壓縮的任何 RAR 檔案復制到桌面上的Unrar文件夾中。您的存檔將立即被提取,所有文件都放在同一個Unrar文件夾中。
遇到 RAR 文件時,不必擔心。這些適用于 Mac 的簡單 RAR 提取方法將快速處理您遇到的任何問題。
https://www.macz.com/mac/327.html?id=NzY4OTYwJl8mMjcuMTg3LjIyNy4yNDQ%3D
天給大家分享一個超厲害的Vue Uniapp可視化拖拽編程項目dragUI。
drag-ui 基于 vuedraggable.js+vue+uniapp 的可視化拖放布局編程。能自動生成項目,自動生成代碼,支持導入第三方組件。
效果圖
dragUI演示視頻
一個簡單創建 hello world 界面的介紹視頻,幫助大家更快了解項目。
<script src="https://lf3-cdn-tos.bytescm.com/obj/cdn-static-resource/tt_player/tt.player.js?v=20160723"></script>
# 克隆項目
git clone https://github.com/wozhishilaonanhai/dragUI.git
# 進入dragUI目錄
cd dragUI
# 安裝依賴包
npm install
# 用HBuilderX打開項目
運行 > 運行到瀏覽器 > Chrome
項目目錄注釋
作者已經將該插件上傳到了插件市場,大家可以下載使用。
https://ext.dcloud.net.cn/plugin?id=1035
store中 componentsInfo 存貯組件的基本信息。
componentsInfo: { // 組件的基本信息
// id 0- 999 (約定)會根據id來判斷是哪個list
list: [
{
name:'按鈕',
id: 0,
componentName: 'Ibutton',
iStyle:{},
iClass: [],
propsValue: [
{
label:'值',
key:'text',
value:'按鈕',
toDataOrHtml: 'html',
type: 'String'
},
{
label:'類型',
key:'type',
value:'default',
toDataOrHtml: 'html',
type:'select',
select: [
{label: '紅色',value: 'warn'},
{label: '藍色',value: 'primary'},
{label: '白色',value: 'default'}
]
},
...
]
},
...
]
}
項目中用到了 element-ui 組件庫及第三方UI庫 colorUI。
創建新項目
切換頁面模式/組件模式
布局預覽效果
查看uniapp頁面代碼
最后附上demo及項目地址
# demo地址
https://wozhishilaonanhai.github.io/dragUI/unpackage/dist/build/h5/index.html
# 倉庫地址
https://github.com/wozhishilaonanhai/dragUI
ok,這次就分享到這里。如果小伙伴們感興趣的話可以去看下哈。
所周知,python最強大的地方在于,python社區匯總擁有豐富的第三方庫,開源的特性,使得有越來越多的技術開發者來完善。
python的完美性。
未來人工智能,大數據方向,區塊鏈的識別和進階都將以python為中心來展開。
咳咳咳! 好像有點打廣告的嫌疑了。
當前互聯網信息共享時代,最重要的是什么?是數據。最有價值的是什么?是數據。最能直觀體現技術水平的是什么?還是數據。
所以,今天我們要分享的是:如何來獲取各個文件格式的文本信息。
普通文件的格式 一般分為: txt普通文本信息,doc word文檔,html網頁內容,excel表格數據,以及特殊的mht文件。
一、Python處理html網頁信息
html類型的文本數據,內容是由前端代碼書寫的標簽+文本數據的格式,可以直接在chrome瀏覽器打開,清楚 的展示出文本的格式。
python 獲取html文件的內容和獲取txt文件的方法相同,直接打開文件讀取就可以了。
讀取代碼如下:
with open(html_path, "r", encoding="utf-8") as f: file=f.read()
file 是html文件的文本內容。是一個網頁標簽的格式內容。
二、Python處理excel表格信息
python擁有直接操作excel表格的第三方庫xlwt,xlrd。調用對應的方法就可以讀寫excel表格數據。
讀取excel操作代碼如下:
filepath="C:\\Users\Administrator\Desktop\新建文件夾\笨笨 前程6份 武漢.xls" sheet_name="UserList" rb=xlrd.open_workbook(filepath) sheet=rb.sheet_by_name(sheet_name) # clox_list=[0, 9, 14, 15, 17] for row in range(1, sheet.nrows): w=WriteToExcel() # for clox in clox_list: name=sheet.cell(row, 0).value phone=sheet.cell(row, 15).value address=sheet.cell(row, 9).value major=sheet.cell(row, 14).value age=sheet.cell(row, 8).value
其中row是表格數據對應的行數, cell獲取具體行數,列數的具體數據。
三、Python讀取doc文檔數據
python讀取doc文檔是最麻煩的。處理邏輯復雜。處理的方式也有很多種。
python 沒有直接處理doc文檔的第三方庫,但是有一個處理docx的第三方庫。可以通過將doc文件轉換為docx文件,再調用第三方python庫pydocx來讀取doc文檔的內容。
這里需要注意的是,不要直接修改doc的后綴來修改成docx文件。直接通過修改后綴獲取的docx文件,pydocx無法讀取內容。
我們可以使用另外一個庫來修改doc為docx。
具體代碼如下:
def doSaveAas(self, doc_path): """ 將doc文檔轉換為docx文檔 :rtype: object """ docx_path=doc_path.replace("doc", "docx") word=wc.Dispatch('Word.Application') doc=word.Documents.Open(doc_path) # 目標路徑下的文件 doc.SaveAs(docx_path, 12, False, "", True, "", False, False, False, False) # 轉化后路徑下的文件 doc.Close() word.Quit()
代碼所需的包接口:
import os import zipfile from win32com import client as wc import xlrd from bs4 import BeautifulSoup from pydocx import PyDocX from lxml import html from xpath_content import XpathContent from write_to_excel import WriteToExcel
python處理docx文檔的方法有很多種,具體使用情況,根據個人需求來決定。
No.1 解壓docx文件
docx文件的原理,本質上就是一個壓縮的zip文件,通過解壓以后,就可以獲取原來文件的各個內容。
docx解壓后的文件結構如下:
docx文件的文本內容存儲結構如下:
文本內容存儲于word/document.xml文件中。
第一種方法,我們就可以先將docx還原成zip壓縮文件,再解壓zip文件,讀取word/document.xml文件的內容就ok了。
具體操作代碼如下:
def get_content(self): """ 獲取docx文檔的文本內容 :rtype: object """ os.chdir(r"C:\Users\Administrator\Desktop\新建文件夾") # 改變目錄到文件的目錄 # os.rename("51 2014.09.12 1份Savannah.docx", "51 2014.09.12 1份Savannah.ZIP") # 重命名為zip文件 f=zipfile.ZipFile('51 2014.09.12 1份Savannah.ZIP', 'r') # 進行解壓 xml=f.read("word/document.xml") wordObj=BeautifulSoup(xml.decode("utf-8")) # print(wordObj) texts=wordObj.findAll("w:t") content=[] for text in texts: content.append(text.text) content_str="".join(content) return content_str
最后獲取到的就是docx文檔的所有文本數據了。
No.2 將docx文檔轉換成python能夠處理的文本格式
第一種方法,是依據docx文檔的原理來獲取數據,流程有點繁瑣,有沒有能直接讀取docx文檔內容的方法呢?答案,肯定是沒有的,別想了,洗洗回家睡吧。
直接讀取docx文檔的方法沒有,有沒有能夠將docx文檔轉換成python能夠輕松處理的文本格式呢?
這個可以有,前面說了,python擁有大量豐富的第三方庫(先夸一波我大python),歷經千辛萬苦終于找到了,一個能轉換docx文檔格式的第三方庫,pydocx,pydocx庫中有個方法pydocx.to_html()就可以直接將docx文檔轉換為html文件,怎么樣?意不意外,驚喜不驚喜!
第二種方法,轉換文本格式的代碼如下:
def docx_to_html(self, docx_path): """ docx文檔轉換成html響應 :rtype: object """ # docx_path="C:\\Users\Administrator\Desktop\新建文件夾\\51 2014.09.12 1份Savannah.docx" response=PyDocX.to_html(docx_path)
獲取到的response是html文件內容。
四、Python處理mht文件
mht文件是一種只能在IE瀏覽器上展示的文本格式,在chrome瀏覽器中打開是一堆的亂碼。
No.1 偽造IE請求mht文件內容
最基礎的讀取mht文本的方法就是偽造IE瀏覽器請求。
調用requests庫,發送get請求網頁鏈接,構造IE的請求頭信息。
理論上來說,這種方法是可行的。但是呢,不建議用,原因大家都懂得。
No.2 轉換文件格式
好了說正經的方法,猜測mht文件能否修改成其他文件格式來直接讀取呢?
docx,不行;html,不行;excel,更不用說了。
真相只有一個!!!
直接修改后綴得到的docx,無法讀取。
so,我們想到的方法是什么呢。沒錯,就是修改成doc文檔。
方法是匪夷所思的,但也是靈感一現。
mht可以直接通過修改后綴轉換成doc文檔,doc文檔讀取文本內容的方法具體參考上面讀取doc文檔的方法。
如何獲取html文本的內容?
html文本的內容是網頁結構標簽數據,取出文本的方式是:re正則,或者xpath。
后續,小伙伴有需要的話,會再開一章詳細了解re,xapth的使用規則。
來源網絡,侵權聯系刪除
*請認真填寫需求信息,我們會在24小時內與您取得聯系。