javaScript刪除標簽的兩種方法

一種：按照class類型刪除

1、取出要刪除的標簽，這里對應tagName變量

2、可能有多個，所以需要遍歷所有取到的標簽

3、如果標簽中的className和需要刪除的變量名稱相同，刪除該標簽

4、這里需要用到標簽的父標簽進行刪除

第二種：按照Id值刪除

1、利用方法getElementById得到標簽

2、不會有多個相同Id的標簽，所以直接刪除就行

3、需要判斷存在不存在，只有存在情況下才可以刪除，不然會報錯

4、同樣利用標簽的父標簽進行刪除

Js代碼如下：

//按照class名稱刪除

function removeTags(tagName, tagClass) {//tagName：標簽；tagClass：類名

var tagElements=document.getElementsByTagName(tagName);

for (var m=0; m < tagElements.length; m++) {

if (tagElements[m].className==tagClass) {

tagElements[m].parentNode.removeChild(tagElements[m]);//去除元素

}

//按照id值刪除

function removeTag(tagId){

var tagElement=document.getElementById(tagId);

if(tagElement){

tagElement.parentNode.removeChild(tagElement);

}

</script>

HTML文本中移除所有HTML標記并提取純文本是我們經常需要使用的文本內容處理方式，比如搜索引擎、網站爬蟲或者本地文檔檢索系統需要提取網頁或HTML文檔的實際內容進行索引。通過去除HTML標簽，可以專注于實際的文字信息，提高搜索結果的相關性和準確性。在新聞聚合應用或社交媒體平臺上展示網頁鏈接的摘要時，通常會提取并顯示純文本內容以提供簡潔的預覽。對于視覺障礙人士使用的輔助技術如屏幕閱讀器，它們無法解析復雜的HTML結構，因此需要提取純文本以便朗讀給用戶。所以今天給大家分享一個使用正則表達式移除所有的Html標記的方法，供有需要的朋友們參考：

第一個核心代碼是：正則表達式"<.*?>"

// 示例用法：

string inputHtml="<html><body><h1>Hello, World!</h1>This is a <b>test</b>.</body></html>";

string plainText=RemoveHtmlTags(inputHtml);

Console.WriteLine(plainText); // 輸出: "Hello, World!This is a test."

public static string RemoveHtmlTags(string html)

{

// 正則表達式用于匹配HTML標簽

Regex regex=new Regex("<.*?>", RegexOptions.Singleline | RegexOptions.Compiled);

// 使用正則表達式的Replace方法移除所有匹配的HTML標簽

string result=regex.Replace(html, String.Empty);

return result;

}

這個正則表達式<.*?>是非貪婪匹配任何以 < 開始、以 > 結束的字符串，它會盡可能少地匹配字符以找到每個HTML標簽。

請注意，雖然此方法對于簡單場景可能有效，但對復雜的HTML文檔（特別是含有嵌套標簽、注釋、CDATA等內容）可能不夠健壯，因為它無法處理所有可能的HTML結構。

第二個核心代碼是：正則表達式"<[^>]*>"

public static string ExtractPlainTextFromHtml(string html)

{

// 使用正則表達式匹配所有的HTML標簽

// 注意：這個簡單的正則表達式適用于大多數基礎HTML結構，但可能無法處理復雜嵌套或特殊格式的HTML

Regex regex=new Regex("<[^>]*>", RegexOptions.Singleline | RegexOptions.Compiled);

// 使用Replace方法去除所有匹配到的HTML標簽，并返回純文本內容

string plainText=regex.Replace(html, String.Empty);

return plainText.Trim(); // 為了得到更整潔的結果，可以對結果進行trim操作以去除多余的空白字符

}

在這段代碼中，我們定義了一個名為ExtractPlainTextFromHtml的方法，該方法利用正則表達式 <[^>]*> 來查找并替換所有HTML標簽。這里的正則表達式表示任何以 < 開始、以 > 結束的非空字符串（即HTML標簽），Singleline 選項使.能匹配換行符，以便跨多行搜索標簽，而 Compiled 選項則是為了優化正則表達式的性能。

第二個核心代碼是：正則表達式"<[^>]*>"

public static string RemoveHtmlTags(string html)

{

// 正則表達式，匹配所有HTML標簽

string pattern="<[^>]+>";

// 使用Regex.Replace方法移除所有匹配的HTML標簽

return Regex.Replace(html, pattern, String.Empty);

}

請注意，此方法僅移除HTML標記，不會解析或處理嵌入在HTML中的JavaScript代碼或其他非標記內容。此外，此方法也無法處理不規范或不符合預期格式的HTML標記。如果需要更復雜的HTML解析或清理，您可能需要使用專門的HTML解析庫，如AngleSharp或HtmlAgilityPack等。

盡管上述方法對于許多簡單場景已經足夠有效，但在面對復雜的HTML文檔時，由于HTML本身的嵌套和特殊結構，簡單的正則表達式可能無法完美地解析并移除所有標簽。在這種情況下，推薦使用專門為處理HTML設計的庫，如HtmlAgilityPack，它可以準確地解析HTML并提供豐富的API用于提取純文本內容。

們通常用富文本框編輯內容存在數據庫中，在做列表顯示數據的時候不想顯示原來的樣式，用自定義函數格式化html標簽即可。

自定義函數

alter function [dbo].[dropHtmlTag](@cont varchar(max))

returns varchar(max)

begin

--去掉style標簽

declare @stylecount int;

set @stylecount=charindex('<style>',@cont);

while @stylecount>0

begin

select @cont=replace(@cont, SUBSTRING(@cont,CHARINDEX('<style>',@cont),CHARINDEX('</style>',@cont)-CHARINDEX('<style>',@cont)+8),'');

set @stylecount=charindex('<style>',@cont);

end

在線咨詢

上一篇：「React組件封裝」「實例」文件選擇按鈕組件封裝
下一篇：2016年“中國好網民”HTML5作品主題征集活動啟

您的項目需求

*請認真填寫需求信息，我們會在24小時內與您取得聯系。

整合營銷服務商

javaScript刪除標簽的兩種方法

您的項目需求