整合營銷服務商

          電腦端+手機端+微信端=數據同步管理

          免費咨詢熱線:

          JavaScript 如何讀取本地文件

          于安全和隱私的原因,web 應用程序不能直接訪問用戶設備上的文件。如果需要讀取一個或多個本地文件,可以通過使用input file和FileReader來實現。在這篇文章中,我們將通過一些例子來看看它是如何工作的。

          文件操作的流程

          獲取文件

          由于瀏覽器中的 JS 無法從用戶的設備訪問本地文件,我們需要為用戶提供一種方法來選擇一個或多個文件供我們使用。這可以通過文件選擇器<input type='fule' />來完成。

          <input type="file" id="fileInput">

          如果想允選擇多個文件,可以添加multiple屬性:

          <input type="file" id="fileInput" multiple>

          我們可以通過change事件來監聽文件的選擇,也可以添加另一個 UI 元素讓用戶顯式地開始對所選文件的處理。

          input file 具有一個files屬性,該屬性是File對象的列表(可能有多個選擇的文件)。

          File對象如下所示:

          讀取文件

          讀取文件,主要使用的是[FileReader][1]類。

          「該對象擁有的屬性:」

          「FileReader.error」 :只讀,一個DOMException,表示在讀取文件時發生的錯誤 。

          「FileReader.readyState」:只讀 表示 FileReader 狀態的數字。取值如下:

          常量名值描述EMPTY0還沒有加載任何數據LOADING1數據正在被加載DONE2已完成全部的讀取請求

          「FileReader.result」:只讀,文件的內容。該屬性僅在讀取操作完成后才有效,數據的格式取決于使用哪個方法來啟動讀取操作。

          「該對象擁有的方法:」

          readAsText(file, encoding):以純文本形式讀取文件,讀取到的文本保存在result屬性中。第二個參數代表編碼格式。

          readAsDataUrl(file):讀取文件并且將文件以數據URI的形式保存在result屬性中。

          readAsBinaryString(file):讀取文件并且把文件以字符串保存在result屬性中。

          readAsArrayBuffer(file):讀取文件并且將一個包含文件內容的ArrayBuffer保存咋result屬性中。

          FileReader.abort():中止讀取操作。在返回時,readyState屬性為DONE。

          「文件讀取的過程是異步操作,在這個過程中提供了三個事件:progress、error、load事件。」

          progress:每隔50ms左右,會觸發一次progress事件。

          error:在無法讀取到文件信息的條件下觸發。

          load:在成功加載后就會觸發。

          在下面的示例中,我們將使用readAsText和readAsDataURL方法來顯示文本和圖像文件的內容。

          例一:讀取文本文件

          為了將文件內容顯示為文本,change需要重寫一下:

          首先,我們要確保有一個可以讀取的文件。如果用戶取消或以其他方式關閉文件選擇對話框而不選擇文件,我們就沒有什么要讀取和退出函數。

          然后我們繼續創建一個FileReader。reader的工作是異步的,以避免阻塞主線程和 UI 更新,這在讀取大文件(如視頻)時非常重要。

          reader發出一個'load'事件(例如,類似于Image對象),告訴我們的文件已經讀取完畢。

          reader將文件內容保存在其result屬性中。此屬性中的數據取決于我們使用的讀取文件的方法。在我們的示例中,我們使用readAsText方法讀取文件,因此result將是一個文本字符串。

          例二:顯示本地選擇的圖片

          如果我們想要顯示圖像,將文件讀取為字符串并不是很有用。FileReader有一個readAsDataURL方法,可以將文件讀入一個編碼的字符串,該字符串可以用作<img>元素的源。本例的代碼與前面的代碼基本相同,區別是我們使用readAsDataURL讀取文件并將結果顯示為圖像:

          總結

          1)由于安全和隱私的原因,JavaScript 不能直接訪問本地文件。

          2)可以通過 input 類型為 file 來選擇文件,并對文件進行處理。

          3) file input 具有帶有所選文件的files屬性。

          4) 我們可以使用FileReader來訪問所選文件的內容。


          作者: Martin Splitt 譯者:前端小智 來源:dev

          原文:https://dev.to/g33konaut/reading-local-files-with-javascript-25hn

          解析HTML文檔,可以使用一些編程語言中的HTML解析庫或工具。以下是一些常用的方法:

          1. 使用Python中的BeautifulSoup庫:BeautifulSoup是一個功能強大的HTML解析庫,可以幫助你從HTML文檔中提取數據。你可以使用pip安裝BeautifulSoup,然后使用它的解析器來解析HTML文檔。
          from bs4 import BeautifulSoup
          
          # 讀取HTML文檔
          with open('example.html', 'r') as file:
              html = file.read()
          
          # 創建BeautifulSoup對象
          soup = BeautifulSoup(html, 'html.parser')
          
          # 使用BeautifulSoup對象提取數據
          # 例如,提取所有的鏈接
          links = soup.find_all('a')
          for link in links:
              print(link.get('href'))
          
          1. 使用JavaScript中的DOM解析器:如果你在瀏覽器環境中,可以使用JavaScript的DOM解析器來解析HTML文檔。你可以使用document對象來訪問和操作HTML元素。
          // 讀取HTML文檔
          var html = document.documentElement.innerHTML;
          
          // 使用DOM解析器提取數據
          // 例如,提取所有的鏈接
          var links = document.getElementsByTagName('a');
          for (var i = 0; i < links.length; i++) {
              console.log(links[i].getAttribute('href'));
          }
          
          1. 使用其他編程語言的HTML解析庫:除了Python和JavaScript,還有許多其他編程語言也有自己的HTML解析庫,例如Java中的Jsoup、Ruby中的Nokogiri等。你可以根據自己的編程語言選擇適合的HTML解析庫來解析HTML文檔。

          無論你選擇哪種方法,解析HTML文檔的關鍵是了解HTML的結構和標簽,并使用相應的解析器或工具來提取所需的數據。

          當你解析HTML文檔時,你可能會遇到以下一些常見的任務和技術:

          1. 選擇器:使用選擇器可以方便地定位和提取HTML文檔中的特定元素。例如,你可以使用CSS選擇器來選擇具有特定類名或ID的元素,或者使用XPath來選擇具有特定屬性或層次結構的元素。
          2. 提取數據:一旦你定位到了要提取的元素,你可以使用相應的方法或屬性來獲取元素的文本內容、屬性值或其他相關信息。例如,你可以使用getText()方法來獲取元素的文本內容,使用getAttribute()方法來獲取元素的屬性值。
          3. 遍歷文檔:HTML文檔通常是一個樹狀結構,你可以使用遍歷方法來訪問和操作文檔中的不同元素。例如,你可以使用遞歸或循環來遍歷文檔的子元素、父元素或兄弟元素。
          4. 處理嵌套結構:HTML文檔中的元素可能會有嵌套的結構,你需要處理這些嵌套關系來正確地提取數據。例如,你可以使用遞歸方法來處理嵌套的列表、表格或嵌套的div元素。
          5. 處理特殊情況:在解析HTML文檔時,可能會遇到一些特殊情況,例如處理動態生成的內容、處理特殊字符或處理錯誤的HTML結構。你需要根據具體情況選擇合適的方法來處理這些特殊情況。

          總的來說,解析HTML文檔需要一定的HTML知識和編程技巧。你需要了解HTML的結構和標簽,選擇合適的解析器或工具,使用選擇器來定位元素,提取所需的數據,并處理特殊情況。通過不斷練習和實踐,你將能夠更熟練地解析HTML文檔并提取所需的數據。

          一天,老板不滿地說:“喂,你這C#爬蟲怎么連標題都沒給我抓回來?我需要的是一份完整的報告,包括所有網頁的標題,趕緊給我重新抓一遍!”那一刻,我仿佛看到了老板眼中閃爍的怒火,感受到了他對我工作的失望。

          我仿佛看到了老板眼中閃爍的怒火,就像是火山即將爆發前的預兆。我心里咯噔一下,知道這次可能玩大了。

          我趕緊賠著笑臉說:“老板,真不好意思,這次是我的失誤。我馬上就去給您抓回那些‘逃跑’的標題!”

          其實我心里暗笑,因為那些標題我早就抓回來了,只是故意沒展示出來。這可是職場生存法則啊,不能一次交出所有秘密,得留點懸念,讓老板對你始終保持期待和好奇。你覺得這樣做對嗎?歡迎討論,哈哈!

          代碼其實很簡單:

          // 使用XPath查詢獲取title標簽
          HtmlNode titleNode = doc.DocumentNode.SelectSingleNode("//title");
          //這行代碼是使用C#的HtmlAgilityPack庫來從HTML文檔中提取<title>標簽的內容。
          //目的是從doc表示的HTML文檔中選擇第一個<title>標簽,并將這個標簽的節點對象賦值給titleNode變量。
          如果要獲取<title>標簽中的文本內容,這樣寫:
          string titleText = titleNode?.InnerText;
          這里,?.是一個null條件運算符,如果titleNode為null(也就是說沒有找到<title>標簽),
          則titleText會被賦值為null,否則,它會被賦值為<title>標簽中的文本內容。

          這個代碼是怎么使用的呢?下面我解釋下實現過程:

                  static string? ParseTitleData(string htmlContent)
                  {
                      if (string.IsNullOrEmpty(htmlContent))
                      {
                          return null;
                      }
                      HtmlDocument doc = new HtmlDocument();
                      doc.LoadHtml(htmlContent);
                      // 使用XPath查詢獲取title標簽
                      HtmlNode titleNode = doc.DocumentNode.SelectSingleNode("//title");
                      if (titleNode != null)
                      {
                          // 獲取title節點的文本內容
                          string titleText = titleNode.InnerText.Trim();
                          return "頁面標題: " + titleText;
                      }
                      else
                      {
                          // 如果沒有找到title標簽,返回null
                          return null;
                      }
                  }
          //這段代碼定義了一個名為 ParseTitleData 的靜態方法,
          //它接受一個 htmlContent 字符串作為輸入,并試圖從中解析出網頁的標題。
          //該方法使用 HtmlAgilityPack 庫來解析 HTML 內容。

          是不是很簡單?這個方法的目的是從給定的 HTML 內容中提取網頁的標題。如果成功找到標題,它會返回一個包含 "頁面標題: " 和實際標題的字符串。如果 HTML 內容為空、null 或不包含 <title> 標簽,它會返回 null。

          看效果:


          完整代碼是包括如何異步獲取網頁內容的。如果有朋友需要的話,請關注我并留言,今天就寫到這吧,太晚了,休息啦!


          主站蜘蛛池模板: 国产91精品一区二区麻豆网站| 国内精品一区二区三区东京| 伊人无码精品久久一区二区| 亚洲AV无码一区二区三区在线观看| 久久久久人妻一区精品性色av| 日本一区二区三区精品国产| 蜜臀AV一区二区| 成人区人妻精品一区二区不卡网站 | 亚洲色精品三区二区一区| 精品久久久久一区二区三区| 亚无码乱人伦一区二区| 一区二区精品在线| 三上悠亚一区二区观看| 黑人一区二区三区中文字幕| 国产午夜精品一区二区三区极品| 亚洲熟妇av一区| 无码人妻精品一区二区三区久久| 中文字幕精品亚洲无线码一区应用| 日本精品一区二区久久久| 国产视频一区二区| 国产微拍精品一区二区| 亚洲国产成人久久一区二区三区| 精品视频无码一区二区三区| 亚洲AV日韩AV天堂一区二区三区 | 日本免费一区二区三区四区五六区| 国产一区二区视频在线播放| 一区二区三区伦理高清| 国产不卡视频一区二区三区| 一区二区免费国产在线观看| 免费无码AV一区二区| 免费国产在线精品一区| 精品乱人伦一区二区| 亚洲高清偷拍一区二区三区| 一区二区三区四区在线播放| 成人精品视频一区二区三区| 亚洲熟女少妇一区二区| 国产高清视频一区三区| 日韩AV无码久久一区二区| 日韩精品一区二区三区中文精品| 国产福利91精品一区二区三区| 亚洲AV成人一区二区三区观看 |