幾天,我手里的一個(gè)項(xiàng)目需要將富文本的所有 html 標(biāo)簽全部刪除,得到純文本后再存儲(chǔ)到數(shù)據(jù)庫(kù)中。在一系列得搜索操作之后,我找到了實(shí)現(xiàn)這個(gè)目的的幾種方法,在這里我分享給大家,當(dāng)你遇到同樣的情況興許也能用的上。
這個(gè)方法是從文本中去除 html 標(biāo)簽最簡(jiǎn)單的方法。它使用字符串的方法 .replace(待替換的字符串,替換后的字符串) 將 HTML 標(biāo)簽替換成空值。 /g 是表示替換字符串所有匹配的值,即字符串中所有符合條件的字符都將被替換。
這個(gè)方法的缺點(diǎn)是有些 HTML 標(biāo)簽不能被剔除,不過它依然很好用。
這種方法是完成該問題的最有效的方法。創(chuàng)建一個(gè)臨時(shí) DOM 并給他賦值,然后我們使用 DOM 對(duì)象方法提取文本。
html-to-text 這個(gè)包的功能很全了,轉(zhuǎn)換也有許多的選項(xiàng)比如:wordwrap, tags, whitespaceCharacters , formatters 等等。
安裝:
npm install html-to-text
使用:
最后感謝閱讀,如果此文對(duì)您有幫助,請(qǐng)點(diǎn)贊或添加關(guān)注。
們經(jīng)常會(huì)在網(wǎng)上查找資料,而大多文檔下載都需要付費(fèi),有哪些方法能免費(fèi)將網(wǎng)頁(yè)轉(zhuǎn)換成Word文檔呢?下面一起來看一看吧。
1、直接復(fù)制
最簡(jiǎn)單的方法就是直接將網(wǎng)頁(yè)中所需段落或文字選中后,然后右擊并選擇“復(fù)制”,再新建一個(gè)Word文檔粘貼進(jìn)去就可以了。
2、另存為
有一些資料網(wǎng)站做了限制,文字無法選擇,或者選擇之后也復(fù)制不了,那么我們可以先將其以網(wǎng)頁(yè)進(jìn)行保存。在網(wǎng)頁(yè)任意處右擊并選擇“網(wǎng)頁(yè)另存為”;
接著將網(wǎng)頁(yè)以HTML文件形式保存到電腦桌面后,雙擊打開這個(gè)網(wǎng)頁(yè),就可以隨意進(jìn)行復(fù)制并且粘貼到Word中了,只是這個(gè)網(wǎng)頁(yè)加載會(huì)比較慢,不太建議使用。
3、截圖轉(zhuǎn)文字
如果有些網(wǎng)頁(yè)資料限制多,以上兩種方式都無法操作,那我們可以將需要的頁(yè)面內(nèi)容進(jìn)行截圖保存,使用一些聊天工具的截圖工具或電腦自帶的屏幕截取都可以。
然后再使用轉(zhuǎn)換工具將圖片識(shí)別成文字就可以啦。我們可以使用speedpdf在線轉(zhuǎn)換工具的圖片轉(zhuǎn)Word功能,不僅能識(shí)別文字,如果有圖片,也能以原有格式轉(zhuǎn)換成Word。
首先搜索Speedpdf進(jìn)入在線轉(zhuǎn)換后,選擇列表中轉(zhuǎn)換格式中的“JPG to Word ”;然后將所有保存的圖片批量全部上傳進(jìn)行轉(zhuǎn)換,這樣就能將內(nèi)容轉(zhuǎn)到同一個(gè)Word文檔中。
轉(zhuǎn)換完成之后直接下載就可以打開Word文檔了,是不是很方便,而且轉(zhuǎn)換也是免費(fèi)的哦,強(qiáng)烈推薦這種處理方式呢。
果你有MicrosoftWord文檔,并且希望將其放到Web上,則需要將該文檔轉(zhuǎn)換為HTML,以便在網(wǎng)頁(yè)上顯示該文檔。有幾種不同的方法可以做到這一點(diǎn)。你選擇的方式將取決于你最終想要的效果。如果你想要一些高級(jí)訓(xùn)練,你可以參加學(xué)習(xí)HTML 5培訓(xùn)課程這將教會(huì)你更多的知識(shí)。
將Word轉(zhuǎn)換為HTML的簡(jiǎn)單方法
將 Word 文檔轉(zhuǎn)換為 HTML 的最簡(jiǎn)單方法是使用 Microsoft Word 來完成。 在 Microsoft Word 中打開你的文檔,然后轉(zhuǎn)到頁(yè)面頂部并選擇“文件”,然后選擇“另存為”。 當(dāng)另存為窗口打開時(shí),在文件名插槽中輸入你想要的文件名稱。 接下來,單擊另存為類型,將顯示一個(gè)下拉菜單。 選擇網(wǎng)頁(yè)并點(diǎn)擊保存。
使用在線轉(zhuǎn)換器
如果有很多文本格式并且使用 Microsoft Word 并沒有按照你想要的方式保存它,你可能需要使用免費(fèi)的在線 Word 到 HTML 轉(zhuǎn)換器。 這些在線轉(zhuǎn)換器會(huì)將你的 Word 文檔轉(zhuǎn)換為 HTML 代碼。 然后你可以將代碼粘貼到空白網(wǎng)頁(yè)上并上傳。
使用 HTML 軟件轉(zhuǎn)換 Word 文檔
使用許多 HTML 編寫軟件,你可以選擇在 HTML 編寫軟件中轉(zhuǎn)換你的 Microsoft Word 文檔。 Dreamweaver 是最流行的 HTML 編寫軟件,它有一項(xiàng)功能可以幫你完成這項(xiàng)工作。想要學(xué)習(xí)HTML5相關(guān)技術(shù),HTML5培訓(xùn)學(xué)習(xí)是一個(gè)很快的捷徑,專業(yè)導(dǎo)師線下面授教學(xué),4-5個(gè)月的學(xué)習(xí)周期,課程系統(tǒng)又全面,緊跟企業(yè)需求,輕松就業(yè)。
要使用 Dreamweaver 將 Word 文檔轉(zhuǎn)換為 HTML,請(qǐng)打開一個(gè)新網(wǎng)頁(yè)。 轉(zhuǎn)到文件>導(dǎo)入>Word文檔,將出現(xiàn)一個(gè)帶有一些選項(xiàng)的彈出框。 選擇哪些選項(xiàng)并選擇確定。 然后你的文檔將出現(xiàn)在網(wǎng)頁(yè)上。
如何使用記事本轉(zhuǎn)換文檔
如果你知道一點(diǎn) HTML,你可以自己轉(zhuǎn)換你的 Microsoft Word 文檔。 首先復(fù)制你的 Word Doc,然后打開記事本并將其粘貼到記事本上。 這將從你的 Word 文檔中刪除所有格式。 現(xiàn)在你只有文本,你可以構(gòu)建你的 HTML。
使用 Google Docs 轉(zhuǎn)換為 HTML
現(xiàn)在稱為 Google Drive 的 GoogleDocs 也將為你執(zhí)行此操作。 這是許多記者將他們的 word 文檔轉(zhuǎn)換為 HTML 以在網(wǎng)絡(luò)上發(fā)布的方式。
首先,單擊紅色的“創(chuàng)建”按鈕并選擇“文檔”。 復(fù)制你的 Microsoft Word 文檔,然后將其粘貼到你的新 GoogleDocs 頁(yè)面上。 接下來,單擊文件,然后選擇“下載為”。 會(huì)彈出一些選項(xiàng),你選擇“網(wǎng)頁(yè)”。 它會(huì)立即將你的文件下載為 zip 文件。
有很多方法可以將你的 Microsoft Word 文檔轉(zhuǎn)換為適用于 Web 的 HTML。 你可以使用免費(fèi)的在線工具來完成,脫離文檔并自己制作 HTML,如果你想了解更多HTML 5相關(guān)知識(shí),可以報(bào)名參加HTML 5培訓(xùn)課程并學(xué)習(xí)如何將HTML 5編程技能提升到更高的水平,增強(qiáng)自身競(jìng)爭(zhēng)力,讓自己在職場(chǎng)中更有優(yōu)勢(shì)。
了解更多
*請(qǐng)認(rèn)真填寫需求信息,我們會(huì)在24小時(shí)內(nèi)與您取得聯(lián)系。