Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 在线观看亚洲精品专区,欧美freesex黑人又粗又,国产粉嫩粉嫩的18在线播放91

          整合營銷服務(wù)商

          電腦端+手機(jī)端+微信端=數(shù)據(jù)同步管理

          免費(fèi)咨詢熱線:

          關(guān)于爬蟲,HTML知識需要了解一下!

          關(guān)于爬蟲,HTML知識需要了解一下!

          蟲涉及的技術(shù)包括但不限于熟練一門編程語言(這里以 Python 為例) HTML 知識、HTTP 協(xié)議的基本知識、正則表達(dá)式、數(shù)據(jù)庫知識,常用抓包工具的使用、爬蟲框架的使用、涉及到大規(guī)模爬蟲,還需要了解分布式的概念、消息隊(duì)列、常用的數(shù)據(jù)結(jié)構(gòu)和算法、緩存,甚至還包括機(jī)器學(xué)習(xí)的應(yīng)用,大規(guī)模的系統(tǒng)背后都是靠很多技術(shù)來支撐的。(

          網(wǎng)頁知識(html,js,css,xpath等),雖然不難,但一定需要了解。 你得知道這些網(wǎng)頁是如何構(gòu)成的,然后才能去分解他們。

          一、什么是HTML

          HTML全稱Hyper Text Mark-up Language(超文本標(biāo)記語言),它不是一種編程語言,而是一種標(biāo)記語言 (markup language)。標(biāo)記語言是一套標(biāo)記標(biāo)簽 (markup tag),HTML 使用標(biāo)記標(biāo)簽來描述網(wǎng)頁。

          HTML是編寫網(wǎng)頁的語言,瀏覽器懂這門語言,爬蟲本質(zhì)上是模擬瀏覽器抓取數(shù)據(jù)。因此懂些HTML知識對入門爬蟲很有幫助~

          作為一門語言,它有自己的語法規(guī)則,用來表示比“文本”更豐富的意義,比如圖片,表格,鏈接等。瀏覽器(IE,FireFox等)軟件知道HTML語言的語法,可以用來查看HTML文檔。目前互聯(lián)網(wǎng)上的絕大部分網(wǎng)頁都是使用HTML編寫的。

          二、HTML長什么樣?

          HTML的語法:文本+標(biāo)簽

          即給文本加上表明文本含義的標(biāo)簽(Tag),讓用戶(人或程序)能對文本得到更好的理解。

          關(guān)于標(biāo)簽:

          • HTML 標(biāo)簽是由尖括號包圍的關(guān)鍵詞,比如 <html>
          • HTML 標(biāo)簽通常是成對出現(xiàn)的,比如 <b> 和 </b>
          • 標(biāo)簽對中的第一個(gè)標(biāo)簽是開始標(biāo)簽,第二個(gè)標(biāo)簽是結(jié)束標(biāo)簽
          • 開始和結(jié)束標(biāo)簽也被稱為開放標(biāo)簽和閉合標(biāo)簽

          示例

          效果

          <html>
           <head>
           <title>歡迎來到簡書-皮壹俠</title>
           </head>
           <body>
           歡迎訪問<a >皮壹俠的簡書主頁</a>!
           </body>
          </html>
          

          如果想嘗試,可以下載Notepad++來動手試一試

          所有的HTML文檔都應(yīng)該有一個(gè)<html>標(biāo)簽

          <html>標(biāo)簽可以包含兩個(gè)部分:<head>和<body>

          • <head>標(biāo)簽用于包含整個(gè)文檔的一般信息
          • 文檔的標(biāo)題(<title>標(biāo)簽用于包含標(biāo)題)
          • 對整個(gè)文檔的描述
          • 文檔的關(guān)鍵字
          • ...
          • <body>標(biāo)簽存放文檔的具體內(nèi)容

          上面代碼中,<a>標(biāo)簽用于表示鏈接,在瀏覽器查看HTML文檔時(shí),點(diǎn)擊<a>標(biāo)簽括起來的內(nèi)容時(shí),通常會跳轉(zhuǎn)到另一個(gè)頁面。這個(gè)要跳轉(zhuǎn)到的頁面的地址由<a>標(biāo)簽的href屬性指定

          如上<a >,href屬性的值就是https://www.jianshu.com/u/5a41eb2ceec6

          三、HTML可以包含哪些內(nèi)容?

          通過不同的標(biāo)簽,HTML文檔可以包含不同的內(nèi)容,比如文本,鏈接,圖片,列表,表格,表單,框架等。

          文本

          • HTML對文本的支持是最豐富的,你可以設(shè)置不同級別的標(biāo)題,分段和換行,可以指定文本的語義和外觀,可以說明文本是引用自其它的地方,等等等等。

          鏈接

          • 鏈接用來指出內(nèi)容與另一個(gè)頁面或當(dāng)前頁面某個(gè)地方有關(guān)。

          圖片

          • 圖片用于使頁面更加美觀,或提供更多的信息。

          列表

          • 列表用于說明一系列條目是彼此相關(guān)的。

          表格

          • 表格是按行與列將數(shù)據(jù)組織在一起的形式。也有不少人使用表格進(jìn)行頁面布局。

          表單

          • 表單通常由文本輸入框,按鈕,多選框,單選框,下拉列表等組成,使HTML頁面更有交互性。

          框架

          • 框架使頁面里能包含其它的頁面。

          四、HTML文檔格式

          HTML 文檔=網(wǎng)頁

          • HTML 文檔描述網(wǎng)頁
          • HTML 文檔包含 HTML 標(biāo)簽和純文本
          • HTML 文檔也被稱為網(wǎng)頁

          Web 瀏覽器的作用是讀取 HTML 文檔,并以網(wǎng)頁的形式顯示出它們。瀏覽器不會顯示 HTML 標(biāo)簽,而是使用標(biāo)簽來解釋頁面的內(nèi)容在HTML文本中,用尖括號括起來的部分稱為標(biāo)簽。

          如果想在正文里使用尖括號(或者大與號小與號,總之是同一個(gè)東西),必須使用字符轉(zhuǎn)義,也就是說轉(zhuǎn)換字符的原有意義。<應(yīng)該使用<代替,>則使用>,至于&符號本身,則應(yīng)該使用&替代。Python學(xué)習(xí)關(guān)注,每天免費(fèi)直播課程學(xué)習(xí)群:839383 765 分享業(yè)內(nèi)最新python學(xué)習(xí)資源!

          示例

          標(biāo)簽本質(zhì)上是對它所包含的內(nèi)容的說明,可能會有屬性,來給出更多的信息。比如<img>(圖片)標(biāo)簽有src屬性(用于指明圖片的地址),width和height屬性(用于說明圖片的寬度和高度)。

          HTML里能使用哪些標(biāo)簽,這些標(biāo)簽分別可以擁有哪些屬性,都是有規(guī)定的,后續(xù)如深入學(xué)習(xí)HTML其實(shí)就是學(xué)習(xí)這些標(biāo)簽。

          HTML文檔結(jié)構(gòu)

          標(biāo)簽通常有開始部分和結(jié)束部分(也被稱為開始標(biāo)簽和結(jié)束標(biāo)簽),它們一起限定了這個(gè)標(biāo)簽所包含的內(nèi)容。

          屬性只能在開始標(biāo)簽中指定,屬性值可以用單引號或雙引號括起來。結(jié)束標(biāo)簽都以/加上標(biāo)簽名來表示。有時(shí)候,有些標(biāo)簽并不包含其它內(nèi)容(只包括自己的屬性,甚至連屬性都沒有),這種情況下,可以寫成類似這樣:<img src="logo.gif" />。(注意最后的一個(gè)空格和一個(gè)反斜杠),它說明這個(gè)標(biāo)簽已經(jīng)結(jié)束,不需要單獨(dú)的結(jié)束標(biāo)簽了。

          對比下:

          <img src="logo.gif" />

          <a >百度</a>

          注:HTML文檔里所有的空白符(空格,Tab,換行,回車)會被瀏覽器忽略,唯一的例外是空格,對空格的處理方式是所有連續(xù)的空格被當(dāng)成一個(gè)空格,不管有一個(gè),還是兩個(gè),還是100個(gè)。之所以有這樣的規(guī)則是因?yàn)楹雎钥瞻追茏屖褂肏TML的作者以他覺得最方便的格式來排列內(nèi)容,比如可以在每個(gè)標(biāo)簽開始后增加縮進(jìn),標(biāo)簽結(jié)束后減少縮進(jìn)。由于英語文本中空格用得很普遍(用于分隔單詞),所以對空格做了這樣的特殊處理。如果要顯示連續(xù)的空格(比如為了縮進(jìn)),應(yīng)該用 來代表空格。

          結(jié)構(gòu)解析1

          結(jié)構(gòu)解析2

          五、常用標(biāo)簽介紹

          (一)文本

          文本

          (二)圖片

          圖片

          (三)鏈接

          鏈接

          (四)分段與換行

          分段與換行

          (五)表格

          表格

          (六)列表

          列表

          (七)框架

          好了,以上就是我的分享,每天都會更新,記得關(guān)注我們哦!

          ark Text是一款國人開發(fā)的 Markdown 開源編輯器,基于 Electron 構(gòu)建,支持多平臺包括 Mac OS、Windows 和 Linux 平臺。Mark Text還內(nèi)置斗圖功能,通過快捷鍵 Cmd+/ 直接打開斗圖搜索面板。斗圖功能默認(rèn)是關(guān)閉的,需要從user preference 菜單中,打開 preference.md, 然后設(shè)置 aidou 為 true。保存然后重啟編輯器即可使用。

          主要特性

          • Mark Text 所輸及所見,摒棄了眾多 Markdown 編輯器左邊寫作右邊預(yù)覽的寫作方式,巧妙的將編輯和預(yù)覽融為一體。
          • snabbdom 作為 Mark Text 的渲染引擎,保證了極速渲染編輯頁面,帶來流暢的書寫體驗(yàn)。
          • 支持 CommonMark Spec 和 GitHub Flavored Markdown Spec 語法格式,生成的 Markdown 可以復(fù)制到任何支持 Markdown 格式的社區(qū)、網(wǎng)站。
          • 段落及行內(nèi)樣式快捷鍵提升您的編輯效率。
          • 輸出 HTML 和 PDF 格式文件,方便在瀏覽器中預(yù)覽。
          • 黑、白兩款主題,自由切換。
          • 多種編輯模式:源代碼模式打字機(jī)模式專注模式

          常在razor文件中,如果這樣寫:

          <div>
          @content
          </div>
          @code
          {
          string content="<h1>hello world</h1>";
          }

          你將得到的是:

          但是你的本意是要讓它正常的渲染html,要怎么來實(shí)現(xiàn)呢?

          <div>
          @((MarkupString)(@content)
          </div>
          @code
          {
          string content="<h1>hello world</h1>";
          }

          @((MarkupString)(@content) 這樣就告訴blazor,要用html格式進(jìn)行渲染。

          這樣就正常了。


          主站蜘蛛池模板: 国产激情精品一区二区三区| 日韩免费一区二区三区在线| 精品无码国产一区二区三区AV| 精品无码国产一区二区三区51安| 中文乱码精品一区二区三区| 色综合视频一区二区三区44| 亚洲一区电影在线观看| 成人免费区一区二区三区| 无码精品人妻一区二区三区免费| 在线观看亚洲一区二区| 消息称老熟妇乱视频一区二区| 一区二区精品久久| 视频一区在线播放| 制服美女视频一区| 国产免费播放一区二区| 丰满人妻一区二区三区视频53| 波多野结衣电影区一区二区三区| 免费看AV毛片一区二区三区| 亚洲丰满熟女一区二区哦| 久久精品免费一区二区喷潮| 午夜福利无码一区二区 | 国内偷窥一区二区三区视频| 一区二区三区四区在线播放 | 日韩精品区一区二区三VR| 久久综合精品不卡一区二区| 国产裸体歌舞一区二区| 无码一区二区三区在线观看| 久久精品动漫一区二区三区| 色狠狠一区二区三区香蕉| 人妻少妇精品视频一区二区三区| 日韩精品中文字幕无码一区| 精品香蕉一区二区三区| 国产精品日韩欧美一区二区三区| 性盈盈影院免费视频观看在线一区 | 国产一区二区福利| 亚洲AV无码一区二区二三区软件| 91福利一区二区| 日韩a无吗一区二区三区| 一区二区不卡久久精品| 国产乱码一区二区三区爽爽爽| 久久亚洲日韩精品一区二区三区|