Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537
分享成果,隨喜正能量】不要對(duì)失去過(guò)于糾結(jié),這不僅有利于讓你放下曾經(jīng)的美好事物,也有利于讓你在面對(duì)現(xiàn)在所擁有的一切,能夠更加安心、更加踏實(shí)。。
《VBA之Word應(yīng)用》,是我推出第八套教程,教程是專門講解VBA在Word中的應(yīng)用,圍繞“面向?qū)ο缶幊獭敝v解,首先讓大家認(rèn)識(shí)Word中VBA的對(duì)象,以及對(duì)象的屬性、方法,然后通過(guò)實(shí)例讓大家感受到Word VBA 的妙處。本套教程共三冊(cè)十六章,今日內(nèi)容第六章 “Word中的Range對(duì)象(下)”第3節(jié):Range范圍的調(diào)整及EXCEL單元格及圖表插入
大家好,我們這講繼續(xù)Range對(duì)象方法的講解,在上一講中我們講解了Range對(duì)象的InsertParagraph方法、InsertParagraphAfter方法、InsertParagraphBefore方法,這節(jié)我們將講解SetRange 方法、PasteAndFormat方法、PasteSpecial 方法。
這種方法設(shè)置現(xiàn)有范圍的起始字符和結(jié)束字符的位置。
語(yǔ)法:expression. SetRange(Start, End)
其中expression 是必需的,是一個(gè)代表Range對(duì)象的變量
參數(shù):
1)Start 必需 Long 范圍的起始字符位置。
2)End 必需 Long 范圍的結(jié)束字符位置。
該方法粘貼選定的表格單元格,并為其設(shè)置指定的格式。
語(yǔ)法:expression.PasteAndFormat(Type)
其中expression 是必需的,是一個(gè)代表Range對(duì)象的變量
參數(shù):Type 必需 WdRecoveryType 粘貼所選的表格單元格時(shí)使用的格式類型。
WdRecoveryType 枚舉值:
wdChart 14 將 Microsoft Office Excel 圖表粘貼為嵌入的 OLE 對(duì)象
wdChartLinked 15 粘貼 Excel 圖表并將其鏈接到原始 Excel 電子表格
wdChartPicture 13 將 Excel 圖表粘貼為圖片
wdFormatOriginalFormatting 16 保留所粘貼材料的原始格式
wdFormatPlainText 22 粘貼為無(wú)格式的純文本文字
wdFormatSurroundingFormattingWithEmphasis 20 使所粘貼文本的格式與周圍文本的格式匹配
wdListCombineWithExistingList 24 將粘貼的列表與鄰近的列表合并.
wdListContinueNumbering 7 使粘貼的列表根據(jù)文檔中的列表繼續(xù)編號(hào)。
wdListDontMerge 25 不支持.
wdListRestartNumbering 8 對(duì)粘貼的列表重新進(jìn)行編號(hào)
wdPasteDefault 0 不支持.
wdSingleCellTable 6 將單個(gè)單元格表格粘貼為獨(dú)立的表格。.
wdSingleCellText 5 將單個(gè)單元格粘貼為文本.
wdTableAppendTable 10 通過(guò)在所選行之間插入粘貼的行,將粘貼的單元格合并到現(xiàn)有的表格中
wdTableInsertAsRows 11 將粘貼的表格作為行插入到目標(biāo)表格的兩行中間.
wdTableOriginalFormatting 12 粘貼一個(gè)追加的表格,而不合并表格樣式.
wdTableOverwriteCells 23 粘貼表格單元格并覆蓋現(xiàn)有的表格單元格.
wdUseDestinationStylesRecovery 19 使用目標(biāo)文檔中使用的樣式.
該方法插入剪貼板中的內(nèi)容
語(yǔ)法:expression.PasteSpecial (IconIndex, Link, Placement, DisplayAsIcon, DataType, IconFileName, IconLabel)
其中expression 是必需的,是一個(gè)代表Range對(duì)象的變量
參數(shù):
1) IconIndex 可選 Variant 如果 DisplayAsIcon 為 True,則該自變量是一個(gè)數(shù)字,對(duì)應(yīng)于要在 IconFilename 指定的程序文件中使用的圖標(biāo)。 圖標(biāo)顯示在“更改圖標(biāo)”對(duì)話框中:0(零)對(duì)應(yīng)于第一個(gè)圖標(biāo),1 對(duì)應(yīng)于第二個(gè)圖標(biāo),依此類推。 如果此參數(shù)被省略,使用的是第一個(gè)(默認(rèn))圖標(biāo)。
2)Link 可選 Variant 如果為 True,則創(chuàng)建指向“剪貼板”內(nèi)容源文件的鏈接。 默認(rèn)值為 False。
3)Placement 可選 Variant 可以為下列 WdOLEPlacement 常量之一:wdFloatOverText 或 wdInLine。 默認(rèn)值為 wdInLine。
4)DisplayAsIcon 可選 Variant 如果為 True,則將鏈接顯示為圖標(biāo)。 默認(rèn)值為 False 。
5)DataType 可選 Variant 剪貼板內(nèi)容在插入文檔后采用的格式。 可以為任意 WdPasteDataType 常量。
6)IconFileName 可選 Variant 如果 DisplayAsIcon 為 True,則此參數(shù)是存儲(chǔ)要顯示的圖標(biāo)的文件的路徑和文件名。
7)IconLabel 可選 Variant 如果 DisplayAsIcon 為 True,則此參數(shù)是顯示在圖標(biāo)下方的文本。
WdPasteDataType 枚舉:
wdPasteBitmap 4 位圖.
wdPasteDeviceIndependentBitmap 5 與設(shè)備無(wú)關(guān)的位圖.
wdPasteEnhancedMetafile 9 增強(qiáng)型圖元文件
wdPasteHTML 10 HTML.
wdPasteHyperlink 7 超鏈接.
wdPasteMetafilePicture 3 圖元文件圖片.
wdPasteOLEObject 0 OLE 對(duì)象.
wdPasteRTF 1 RTF 格式
wdPasteShape 8 形狀
wdPasteText 2 文本
下面我們通過(guò)一個(gè)實(shí)例來(lái)講解一下本節(jié)的知識(shí)點(diǎn),這個(gè)實(shí)例中我們先定義一個(gè)Range,為當(dāng)前文檔的第二段,然后利用SetRange來(lái)擴(kuò)展這個(gè)范圍。
之后我們?cè)谖臋n的最后插入一個(gè)空的段落,將光標(biāo)移到這個(gè)空段落之處。
緊接著,我們要打開(kāi)一個(gè)Excel文件,從這個(gè)文件中,我們把B2單元格復(fù)制到剪貼板,并將剪貼板的內(nèi)容以對(duì)象的格式粘貼到光標(biāo)處。
之后,我們?cè)俅卧谖臋n的最后插入一個(gè)空的段落,將光標(biāo)移到這個(gè)空段落之處。并將Excel文件中的圖表復(fù)制到剪貼板中,并將剪貼板中的內(nèi)容粘貼到光標(biāo)處。
最后關(guān)閉Excel文件。
我們先看一下代碼:
Sub mynzB()
[代碼見(jiàn)教程]
End Sub
代碼截圖:
代碼解讀:
1)Set myRange=ActiveDocument.Paragraphs(2).Range
MsgBox myRange.Text
以上代碼設(shè)置 myRange 并提示給用戶myRange 內(nèi)容。
2)myRange.SetRange Start:=myRange.Start, _
End:=ActiveDocument.Paragraphs(3).Range.End
MsgBox myRange.Text
以上代碼調(diào)整 myRange的范圍并提示給用戶myRange 內(nèi)容。
3) ActiveDocument.Content.InsertParagraphAfter
myRange.SetRange Start:=ActiveDocument.Paragraphs(ActiveDocument.Paragraphs.Count).Range.Start, _
End:=ActiveDocument.Paragraphs(ActiveDocument.Paragraphs.Count).Range.End - 1
myRange.Select
以上代碼在活動(dòng)文檔的末尾插入一個(gè)段落,并將光標(biāo)位置調(diào)整到最后。
4)Set myEXL=CreateObject("excel.application")
myfile="EXCEL工作簿.XLSX"
myEXL.workbooks.Open ActiveDocument.Path & "\" & myfile
myEXL.Visible=True
設(shè)置要打開(kāi)的文件,并打開(kāi)這個(gè)文件。
5)myEXL.Sheets("Sheet1").Range("B2").Copy
Selection.Collapse Direction:=wdCollapseStart
Selection.Range.PasteSpecial DataType:=wdPasteOLEObject
'將單元格B2以單元格的形式粘貼wdPasteOLEObject是單元格的格式,如果是文本的格式可以用wdPasteText。
6) ActiveDocument.Content.InsertParagraphAfter
myRange.SetRange Start:=ActiveDocument.Paragraphs(ActiveDocument.Paragraphs.Count).Range.Start, _
End:=ActiveDocument.Paragraphs(ActiveDocument.Paragraphs.Count).Range.End
myRange.Select
以上代碼再次在活動(dòng)文檔的末尾插入一個(gè)段落,并重置光標(biāo)位置
7) myEXL.Sheets("Sheet1").ChartObjects(1).Copy
Selection.PasteAndFormat Type:=wdChartPicture
以上代碼復(fù)制圖表并粘貼,粘貼的是圖片的格式
8)myEXL.workbooks.Close
Set myEXL=Nothing
以上關(guān)閉Excel文件。
最后我們看代碼的運(yùn)行:
Excel工作表的界面如下:
代碼運(yùn)行的提示框:
我們?cè)诋?dāng)前文檔中可以看一下圖表的格式,會(huì)發(fā)現(xiàn)這個(gè)圖表是圖片格式的。
今日內(nèi)容回向:
1 Word中Range對(duì)象的SetRange 方法、PasteAndFormat方法、PasteSpecial 方法的意義是什么?
2 如何利用VBA插入單元格及圖表?
本講內(nèi)容參考程序文件:Doc 006文檔.docm
我20多年的VBA實(shí)踐經(jīng)驗(yàn),全部濃縮在下面的各個(gè)教程中:
【分享成果,隨喜正能量】得與失,是一種選擇,也是一種放棄,沒(méi)有一種選擇十全十美,沒(méi)有一次決定萬(wàn)無(wú)一失。讓自己豁達(dá)起來(lái)對(duì)于已經(jīng)失去的東西,你或許也應(yīng)該慶幸,它們不會(huì)再打擾你的內(nèi)心。
所周知,python最強(qiáng)大的地方在于,python社區(qū)匯總擁有豐富的第三方庫(kù),開(kāi)源的特性,使得有越來(lái)越多的技術(shù)開(kāi)發(fā)者來(lái)完善。
python的完美性。
未來(lái)人工智能,大數(shù)據(jù)方向,區(qū)塊鏈的識(shí)別和進(jìn)階都將以python為中心來(lái)展開(kāi)。
咳咳咳! 好像有點(diǎn)打廣告的嫌疑了。
當(dāng)前互聯(lián)網(wǎng)信息共享時(shí)代,最重要的是什么?是數(shù)據(jù)。最有價(jià)值的是什么?是數(shù)據(jù)。最能直觀體現(xiàn)技術(shù)水平的是什么?還是數(shù)據(jù)。
所以,今天我們要分享的是:如何來(lái)獲取各個(gè)文件格式的文本信息。
普通文件的格式 一般分為: txt普通文本信息,doc word文檔,html網(wǎng)頁(yè)內(nèi)容,excel表格數(shù)據(jù),以及特殊的mht文件。
一、Python處理html網(wǎng)頁(yè)信息
html類型的文本數(shù)據(jù),內(nèi)容是由前端代碼書(shū)寫的標(biāo)簽+文本數(shù)據(jù)的格式,可以直接在chrome瀏覽器打開(kāi),清楚 的展示出文本的格式。
python 獲取html文件的內(nèi)容和獲取txt文件的方法相同,直接打開(kāi)文件讀取就可以了。
讀取代碼如下:
with open(html_path, "r", encoding="utf-8") as f: file=f.read()
file 是html文件的文本內(nèi)容。是一個(gè)網(wǎng)頁(yè)標(biāo)簽的格式內(nèi)容。
二、Python處理excel表格信息
python擁有直接操作excel表格的第三方庫(kù)xlwt,xlrd。調(diào)用對(duì)應(yīng)的方法就可以讀寫excel表格數(shù)據(jù)。
讀取excel操作代碼如下:
filepath="C:\\Users\Administrator\Desktop\新建文件夾\笨笨 前程6份 武漢.xls" sheet_name="UserList" rb=xlrd.open_workbook(filepath) sheet=rb.sheet_by_name(sheet_name) # clox_list=[0, 9, 14, 15, 17] for row in range(1, sheet.nrows): w=WriteToExcel() # for clox in clox_list: name=sheet.cell(row, 0).value phone=sheet.cell(row, 15).value address=sheet.cell(row, 9).value major=sheet.cell(row, 14).value age=sheet.cell(row, 8).value
其中row是表格數(shù)據(jù)對(duì)應(yīng)的行數(shù), cell獲取具體行數(shù),列數(shù)的具體數(shù)據(jù)。
三、Python讀取doc文檔數(shù)據(jù)
python讀取doc文檔是最麻煩的。處理邏輯復(fù)雜。處理的方式也有很多種。
python 沒(méi)有直接處理doc文檔的第三方庫(kù),但是有一個(gè)處理docx的第三方庫(kù)。可以通過(guò)將doc文件轉(zhuǎn)換為docx文件,再調(diào)用第三方python庫(kù)pydocx來(lái)讀取doc文檔的內(nèi)容。
這里需要注意的是,不要直接修改doc的后綴來(lái)修改成docx文件。直接通過(guò)修改后綴獲取的docx文件,pydocx無(wú)法讀取內(nèi)容。
我們可以使用另外一個(gè)庫(kù)來(lái)修改doc為docx。
具體代碼如下:
def doSaveAas(self, doc_path): """ 將doc文檔轉(zhuǎn)換為docx文檔 :rtype: object """ docx_path=doc_path.replace("doc", "docx") word=wc.Dispatch('Word.Application') doc=word.Documents.Open(doc_path) # 目標(biāo)路徑下的文件 doc.SaveAs(docx_path, 12, False, "", True, "", False, False, False, False) # 轉(zhuǎn)化后路徑下的文件 doc.Close() word.Quit()
代碼所需的包接口:
import os import zipfile from win32com import client as wc import xlrd from bs4 import BeautifulSoup from pydocx import PyDocX from lxml import html from xpath_content import XpathContent from write_to_excel import WriteToExcel
python處理docx文檔的方法有很多種,具體使用情況,根據(jù)個(gè)人需求來(lái)決定。
No.1 解壓docx文件
docx文件的原理,本質(zhì)上就是一個(gè)壓縮的zip文件,通過(guò)解壓以后,就可以獲取原來(lái)文件的各個(gè)內(nèi)容。
docx解壓后的文件結(jié)構(gòu)如下:
docx文件的文本內(nèi)容存儲(chǔ)結(jié)構(gòu)如下:
文本內(nèi)容存儲(chǔ)于word/document.xml文件中。
第一種方法,我們就可以先將docx還原成zip壓縮文件,再解壓zip文件,讀取word/document.xml文件的內(nèi)容就ok了。
具體操作代碼如下:
def get_content(self): """ 獲取docx文檔的文本內(nèi)容 :rtype: object """ os.chdir(r"C:\Users\Administrator\Desktop\新建文件夾") # 改變目錄到文件的目錄 # os.rename("51 2014.09.12 1份Savannah.docx", "51 2014.09.12 1份Savannah.ZIP") # 重命名為zip文件 f=zipfile.ZipFile('51 2014.09.12 1份Savannah.ZIP', 'r') # 進(jìn)行解壓 xml=f.read("word/document.xml") wordObj=BeautifulSoup(xml.decode("utf-8")) # print(wordObj) texts=wordObj.findAll("w:t") content=[] for text in texts: content.append(text.text) content_str="".join(content) return content_str
最后獲取到的就是docx文檔的所有文本數(shù)據(jù)了。
No.2 將docx文檔轉(zhuǎn)換成python能夠處理的文本格式
第一種方法,是依據(jù)docx文檔的原理來(lái)獲取數(shù)據(jù),流程有點(diǎn)繁瑣,有沒(méi)有能直接讀取docx文檔內(nèi)容的方法呢?答案,肯定是沒(méi)有的,別想了,洗洗回家睡吧。
直接讀取docx文檔的方法沒(méi)有,有沒(méi)有能夠?qū)ocx文檔轉(zhuǎn)換成python能夠輕松處理的文本格式呢?
這個(gè)可以有,前面說(shuō)了,python擁有大量豐富的第三方庫(kù)(先夸一波我大python),歷經(jīng)千辛萬(wàn)苦終于找到了,一個(gè)能轉(zhuǎn)換docx文檔格式的第三方庫(kù),pydocx,pydocx庫(kù)中有個(gè)方法pydocx.to_html()就可以直接將docx文檔轉(zhuǎn)換為html文件,怎么樣?意不意外,驚喜不驚喜!
第二種方法,轉(zhuǎn)換文本格式的代碼如下:
def docx_to_html(self, docx_path): """ docx文檔轉(zhuǎn)換成html響應(yīng) :rtype: object """ # docx_path="C:\\Users\Administrator\Desktop\新建文件夾\\51 2014.09.12 1份Savannah.docx" response=PyDocX.to_html(docx_path)
獲取到的response是html文件內(nèi)容。
四、Python處理mht文件
mht文件是一種只能在IE瀏覽器上展示的文本格式,在chrome瀏覽器中打開(kāi)是一堆的亂碼。
No.1 偽造IE請(qǐng)求mht文件內(nèi)容
最基礎(chǔ)的讀取mht文本的方法就是偽造IE瀏覽器請(qǐng)求。
調(diào)用requests庫(kù),發(fā)送get請(qǐng)求網(wǎng)頁(yè)鏈接,構(gòu)造IE的請(qǐng)求頭信息。
理論上來(lái)說(shuō),這種方法是可行的。但是呢,不建議用,原因大家都懂得。
No.2 轉(zhuǎn)換文件格式
好了說(shuō)正經(jīng)的方法,猜測(cè)mht文件能否修改成其他文件格式來(lái)直接讀取呢?
docx,不行;html,不行;excel,更不用說(shuō)了。
真相只有一個(gè)!!!
直接修改后綴得到的docx,無(wú)法讀取。
so,我們想到的方法是什么呢。沒(méi)錯(cuò),就是修改成doc文檔。
方法是匪夷所思的,但也是靈感一現(xiàn)。
mht可以直接通過(guò)修改后綴轉(zhuǎn)換成doc文檔,doc文檔讀取文本內(nèi)容的方法具體參考上面讀取doc文檔的方法。
如何獲取html文本的內(nèi)容?
html文本的內(nèi)容是網(wǎng)頁(yè)結(jié)構(gòu)標(biāo)簽數(shù)據(jù),取出文本的方式是:re正則,或者xpath。
后續(xù),小伙伴有需要的話,會(huì)再開(kāi)一章詳細(xì)了解re,xapth的使用規(guī)則。
來(lái)源網(wǎng)絡(luò),侵權(quán)聯(lián)系刪除
HTTP range 請(qǐng)求允許我們從服務(wù)器上只發(fā)送HTTP消息的一部分到客戶端。這樣的部分請(qǐng)求對(duì)于大型媒體、具有中斷和恢復(fù)下載進(jìn)度的下載文件請(qǐng)求很有幫助。
在進(jìn)行HTTP range 請(qǐng)求之前,先檢查服務(wù)器是否支持部分請(qǐng)求
如果請(qǐng)求一個(gè)資源時(shí), HTTP響應(yīng)中出現(xiàn)如下所示的 'Accept-Ranges', 且其值不是none, 那么服務(wù)器支持范圍請(qǐng)求。
curl -I http://i.imgur.com/z4d4kWk.jpg
HTTP/1.1 200 OK
...
Accept-Ranges: bytes
Content-Length: 146515
在如上響應(yīng)中,Accept-Ranges: bytes 代表可以使用字節(jié)作為單位來(lái)定義請(qǐng)求范圍。這里的 Response Headers中的 Content-Length: 146515 則代表該資源的完整大小。
如果站點(diǎn)響應(yīng)中未返回 Accept-Ranges 響應(yīng)頭,或者其值為none,那么這意味著server不支持HTTP range請(qǐng)求。
我們可以對(duì)一個(gè)資源發(fā)起單個(gè)范圍請(qǐng)求:
curl http://i.imgur.com/z4d4kWk.jpg -i -H "Range: bytes=0-1023"
發(fā)出的請(qǐng)求如下:
GET /z4d4kWk.jpg HTTP/1.1 Host: i.imgur.com Range: bytes=0-1023
正常情況下 server 返回 206 部分內(nèi)容響應(yīng):
HTTP/1.1 206 Partial Content Content-Range: bytes 0-1023/146515 Content-Length: 1024 ... (binary content)
這次并非檢查server是否支持range請(qǐng)求,故Content-Length表示的是現(xiàn)在請(qǐng)求的范圍大小,而Content-Range則表示的是這部分消息在完整資源中的位置。
curl http://www.example.com -i -H "Range: bytes=0-50, 100-150"
用逗號(hào)隔開(kāi)多個(gè)范圍,即可同時(shí)請(qǐng)求多部分資源。
響應(yīng)如下:
HTTP/1.1 206 Partial Content Content-Type: multipart/byteranges; boundary=3d6b6a416f9b5 Content-Length: 282 --3d6b6a416f9b5 Content-Type: text/html Content-Range: bytes 0-50/1270
該響應(yīng)有:
每個(gè)部分包含自己的Content-Type 和 Content-Range
當(dāng)繼續(xù)請(qǐng)求更多資源時(shí),你需要確保被存儲(chǔ)的資源在上一幀收到后沒(méi)有被改變。
If-Range HTTP請(qǐng)求創(chuàng)建了一個(gè)帶條件的range HTTP請(qǐng)求,如果條件得到滿足,range請(qǐng)求將會(huì)被發(fā)出,server 發(fā)回帶有適當(dāng)正文的206 partial content 應(yīng)答,如果條件不滿足則返回完整資源,并顯示200 OK狀態(tài)。這個(gè)頭可以與Last-Modified 驗(yàn)證程序,或者與 ETag 一起使用。
If-Range: Wed, 21 Oct 2015 07:28:00 GMT
在處理HTTP Range 請(qǐng)求時(shí),有三個(gè)相關(guān)的狀態(tài):
Transfer-Encoding 請(qǐng)求頭允許分塊編碼,這在服務(wù)器給客戶端發(fā)送大量的數(shù)據(jù),且響應(yīng)總大小直到請(qǐng)求結(jié)束才能確定時(shí)很有用,如果服務(wù)器直接發(fā)送數(shù)據(jù)給客戶端而不緩存響應(yīng),或者確定具體響應(yīng)大小的話,會(huì)產(chǎn)生延遲。HTTP Range 請(qǐng)求和分塊是兼容的,一起用或者不一起用均可。
*請(qǐng)認(rèn)真填寫需求信息,我們會(huì)在24小時(shí)內(nèi)與您取得聯(lián)系。