整合營銷服務商

          電腦端+手機端+微信端=數據同步管理

          免費咨詢熱線:

          JavaScript將HTML頁面生成PDF并下載

          近碰到個需求,需要把當前頁面生成 pdf,并下載。弄了幾天,自己整理整理,記錄下來,我覺得應該會有人需要 :)

          項目源碼地址:https://github.com/linwalker/render-html-to-pdf


          簡介

          我們可以直接在瀏覽器端使用html2canvas,對整個或局部頁面進行“截圖”。但這并不是真的截圖,而是通過遍歷頁面DOM結構,收集所有元素信息及相應樣式,渲染出canvas image。

          由于html2canvas只能將它能處理的生成canvas image,因此渲染出來的結果并不是100%與原來一致。但它不需要服務器參與,整個圖片都由客戶端瀏覽器生成,使用很方便。

          使用

          使用的API也很簡潔,下面代碼可以將某個元素渲染成canvas:

          html2canvas(element, {
           onrendered: function(canvas) {
           // canvas is the final rendered <canvas> element
           }
          });
          

          通過onrendered方法,可以將生成的canvas進行回調,比如插入到頁面中:

          html2canvas(element, {
           onrendered: function(canvas) {
           document.body.appendChild(canvas);
           }
          });
          

          做個小例子(demo1)代碼如下:

          這個例子將頁面body中的元素渲染成canvas,并插入到body中。

          jsPDF

          jsPDF庫可以用于瀏覽器端生成PDF。

          文字生成PDF

          使用方法如下:

          // 默認a4大小,豎直方向,mm單位的PDF
          var doc = new jsPDF();
          // 添加文本‘Download PDF’
          doc.text('Download PDF!', 10, 10);
          doc.save('a4.pdf');
          

          文字與圖片生成PDF

          // 三個參數,第一個方向,第二個尺寸,第三個尺寸格式
          var doc = new jsPDF('landscape','pt',[205, 155])
          // 將圖片轉化為dataUrl
          var imageData = ‘data:image/png;base64,iVBORw0KGgo...’;
          //設置字體大小
          doc.setFontSize(20);
          //10,20這兩參數控制文字距離左邊,與上邊的距離
          doc.text('Stone', 10, 20);
          // 0, 40, 控制文字距離左邊,與上邊的距離
          doc.addImage(imageData, 'PNG', 0, 40, 205, 115);
          doc.save('a4.pdf')
          

          生成pdf需要把轉化的元素添加到jsPDF實例中,也有添加html的功能,但某些元素無法生成在pdf中,因此可以使用html2canvas + jsPDF的方式將頁面轉成pdf。通過html2canvas將遍歷頁面元素,并渲染生成canvas,然后將canvas圖片格式添加到jsPDF實例,生成pdf。

          html2canvas + jsPDF

          單頁

          將demo1的例子修改下:

          如果頁面內容根據a4比例轉化后高度超過a4紙高度呢,生成的pdf會怎么樣?會分頁嗎?

          你可以試試,驗證一下自己的想法。

          jsPDF提供了一個很有用的API, addPage(),我們可以通過 pdf.addPage(),來添加一頁pdf,然后通過 pdf.addImage(...),將圖片賦予這頁pdf來顯示。

          那么我們如何確定哪里分頁?

          這個問題好回答,我們可以設置一個 pageHeight,超過這個高度的內容放入下一頁pdf。

          來捋一下思路,將html頁面內容生成canvas圖片,通過 addImage將第一頁圖片添加到pdf中,超過一頁內容,通過 addPage()添加pdf頁數,然后再通過 addImage將下一頁圖片添加到pdf中。

          嗯~,很好!巴特,難道沒有發(fā)現問題嗎?

          這個方法實現的前提是 — — 我們能根據 pageHeight先將整頁內容生成的canvas圖片分割成對應的小圖片,然后一個蘿卜一個坑,一頁一頁 addImage進去。

          What? 想一想我們的canvas是腫么來的,不用拉上去,直接看下面:

          html2canvas(document.body, {
           onrendered:function(canvas) {
           //it is here we handle the canvas
           }
          })
          

          這里的 body就是要生成canvas的元素對象,一個元素生成一個canvas;那么我們需要一頁一頁的canvas,也就是說。。。

          你覺得可能嗎? 我覺得不太現實,按這思路要獲取頁面上不同位置的DOM元素,然后通過 htnl2canvas(element,option)來處理,先不說能不能剛好在每個 pageHeight的位置剛好找到一個DOM元素,就算找到了,這樣做累不累。

          累的話 :)可以看看下面這種方法。

          多頁

          我提供的思路是我們只生成一個canvas,對就一個,轉化元素就是你要轉成pdf內容的母元素,在這篇demo里就是 body了;其他不變,也是超過一頁內容就 addPage,然后 addImage,只不過這里添加的是同一個canvas。

          當然這樣做只會出現多頁重復的pdf,那到底怎么實現正確分頁顯示。其實主要利用了jsPDF的兩點:

          • 超過jsPDF實例格式尺寸的內容不顯示( varpdf=newjsPDF('','pt','a4');demo中就是a4紙的尺寸)
          • addImage有兩個參數可以控制圖片在pdf中的位置

          雖然每一頁pdf上顯示的圖片是相同的,但我們通過調整圖片的位置,產生了分頁的錯覺。以第二頁為例,將豎直方向上的偏移設置為 -841.89即一張a4紙的高度,又因為超過a4紙高度范圍的圖片不顯示,所以第二頁顯示了圖片豎直方向上[841.89,1682.78]范圍內的內容,這就得到了分頁的效果,以此類推。

          還是看代碼吧:

          兩邊留邊距

          修改imgWidth,并且在addImage時x方向參數設置你要的邊距,具體代碼如下:

          作者:linwalkerhttps://segmentfault.com/a/1190000009211079

          數字化時代,HTML網頁文件已成為我們獲取和分享信息的主要方式。但有時,為了保留網頁的格式和內容,我們可能需要將其轉換為PDF文檔。此時,首助編輯高手軟件將是您的得力助手。下面,就讓我們一起了解如何使用首助編輯高手將HTML網頁文件轉為PDF文檔。

          第一步,打開軟件,在眾多功能板塊中,選擇“PDF編輯工具”中的“批量轉換格式”功能

          第二步,在轉換模式對應的下拉列表中,將選項切換為“HTML轉PDF”

          第三步,通過“添加文件”或者“添加文件夾中的文件”將HTML網頁文件導入,支持導入多個

          第四步,設置新文件保存位置,可以將新文件保存在原文件相同位置,也可以指定位置

          第五步,確定選擇好一系列相關的選項之后,單擊右下角的“開始轉換”按鈕

          第六步,提示轉換成功后,打開文件夾查看,所有HTNL網頁文件都被轉為PDF文檔,最后也可以打開原文件進行對比,原文件均為HTML,說明轉換成功

          總之,軟件以其簡潔的操作界面、強大的功能和高效的轉換速度,成為了將HTML網頁文件轉為PDF文檔的理想選擇。無論您是學生、上班族還是專業(yè)人士,都能滿足您的需求,讓您的文檔處理變得更加輕松和高效。趕快下載并體驗首助編輯高手吧!

          嘍,今天是一篇HTML to PDF速食指南。

          Java 轉換 HTML 到PDF有許多類庫,今天我們介紹一下第三方免費的類庫OpenPDF。

          1. OpenPDF

          OpenPDF是免費的Java類庫 ,遵從LGPL 和 MPL協(xié)議,所以基本上能夠可以隨意使用。OpenPDF是基于iTEXT的,目前來說也是維護的比較好的Java操作PDF的開源軟件。

          話不多說,且看所需要的依賴,

          <dependency>    
              <groupId>org.jsoup</groupId>    
              <artifactId>jsoup</artifactId>   
              <version>1.13.1</version> 
          </dependency>
          <dependency>
              <groupId>com.openhtmltopdf</groupId>
              <artifactId>openhtmltopdf-core</artifactId>
              <version>1.0.6</version>
          </dependency>
          <dependency>
              <groupId>com.openhtmltopdf</groupId>
              <artifactId>openhtmltopdf-pdfbox</artifactId>
              <version>1.0.6</version>
          </dependency>
          

          jsoup可以將html文件轉換成輸入流等,也可以遍歷html的DOM節(jié)點,提取元素及樣式等。

          2. 示例

          本篇示例將以下html文件轉換成pdf

          <html>
          <head>
              <style>
                  .center_div {
                      border: 1px solid #404e94;
                      margin-left: auto;
                      margin-right: auto;
                      background-color: #f6d0ed;
                      text-align: left;
                      padding: 8px;
                  }
                  table {
                      width: 100%;
                      border: 1px solid black;
                  }
                  th, td {
                      border: 1px solid black;
                  }
                  body,html,input{font-family:"msyh";}
              </style>
          </head>
          <body>
          <div class="center_div">
              <h1>Hello java North!</h1>
              <div>
                  <p>convert html to pdf.</p>
              </div>
              <div>
                  <table>
                      <thead>
                          <th>ROLE</th>
                          <th>NAME</th>
                          <th>TITLE</th>
                      </thead>
                      <tbody>
                          <tr>
                              <td>MARKSMAN</td>
                              <td>ASHE</td>
                              <td>THE FROST ARCHER</td>
                          </tr>
                          <tr>
                              <td>MAGES</td>
                              <td>ANNIE</td>
                              <td>THE DARK CHILD</td>
                          </tr>
                          <tr>
                              <td>射手</td>
                              <td>凱塔琳</td>
                              <td>皮城女警</td>
                          </tr>
                      </tbody>
                  </table>
              </div>
          </div>
          </body>
          </html>
          

          以上html用瀏覽器打開如下,亂碼是因為中文字體不識別,下面轉換的時候會加載對應的字體來進行轉換。

          使用Java轉換HTML到PDF代碼如下:

          public class HtmlToPDFOpenSource {
              public static void main(String[] args) throws IOException {
                  HtmlToPDFOpenSource htmlToPDFOpenSource = new HtmlToPDFOpenSource();
                  htmlToPDFOpenSource.generatePdfByOpenhtmltopdf();
              }
          
              private  void generatePdfByOpenhtmltopdf() throws IOException {
                  File inputHtml = new File("E:\\javaNorth\\java-study-note\\javaOpenSource\\src\\main\\resources\\test.html");
          
                  //加載html文件
                  Document document = Jsoup.parse(inputHtml, "UTF-8");
                  document.outputSettings().syntax(Document.OutputSettings.Syntax.html);
                  
                  //引入資源目錄,可以單獨引入css,圖片文件等
                  String baseUri = FileSystems.getDefault()
                      .getPath("javaOpenSource\\src\\main\\resources")
                      .toUri().toString();
                 
                  try (OutputStream os = new FileOutputStream("javaOpenSource\\src\\main\\resources\\testOpenLeagueoflegends1.pdf")) {
                      PdfRendererBuilder builder = new PdfRendererBuilder();
                      builder.withUri("javaOpenSource\\src\\main\\resources\\testOpenLeagueoflegends1.pdf");
                      builder.toStream(os);
                      builder.withW3cDocument(new W3CDom().fromJsoup(document), baseUri);
                      
                      //引入指定字體,注意字體名需要和css樣式中指定的字體名相同
                      builder.useFont(new File("javaOpenSource\\src\\main\\resources\\fonts\\msyh.ttf"),"msyh",1,BaseRendererBuilder.FontStyle.NORMAL, true);
                      builder.run();
                  }
              }
          }
          

          使用Java代碼轉換成PDF如下(示例中使用了微軟雅黑中文字體):

          上述html文件中增加如下外部樣式

          <link href="style.css" rel="stylesheet">
          

          并在resources目錄下添加style.css文件,重新生成PDF文件如下。

          3. 總結

          本片介紹了使用OpenPDF將html文件轉換成PDF文件。同時也使用了自定義字體,外部樣式。但是以下幾點需要格外注意。

          • Java代碼中加載的字體名稱要和HTML引用的CSS樣式中的字體名相同 ({font-family:"msyh";})。
          • HTML文件標簽節(jié)點必須閉合(<xxx></xxx>).否則解析會失敗。

          全部示例在此:https://github.com/javatechnorth/java-study-note/tree/master/javaOpenSource/src/main/java/pdf

          文章來源:Java技術指北


          主站蜘蛛池模板: 亚洲国产成人久久综合一区| 久久久久一区二区三区| 成人一区二区免费视频| 国产精品夜色一区二区三区 | 日韩精品无码中文字幕一区二区 | 红桃AV一区二区三区在线无码AV| 精品无码人妻一区二区三区18| 亚洲成在人天堂一区二区| 天天爽夜夜爽人人爽一区二区| 精品一区精品二区制服| 久久青草精品一区二区三区| 制服中文字幕一区二区 | 亚洲国产欧美一区二区三区| 日韩免费观看一区| 久久久91精品国产一区二区三区| 国产精品被窝福利一区| 国产高清在线精品一区小说| 国产精品无码一区二区三区在| 人妻夜夜爽天天爽一区| 人妻在线无码一区二区三区| 亚洲av日韩综合一区久热| 韩国理伦片一区二区三区在线播放| 高清一区二区三区免费视频| 国产一区二区女内射| 久久国产精品一区免费下载 | 无码日本电影一区二区网站| 亚洲福利一区二区精品秒拍| 99久久综合狠狠综合久久一区| 精品一区二区三区在线成人| 国产韩国精品一区二区三区久久| 精品无码一区二区三区在线 | 欧美激情一区二区三区成人| 亚洲色精品三区二区一区| 精品久久久久久中文字幕一区| 国产成人高清亚洲一区久久| 亚洲午夜精品第一区二区8050| 农村人乱弄一区二区 | 色窝窝免费一区二区三区| 国产精品亚洲专区一区| 久久亚洲中文字幕精品一区| 亚洲视频在线一区|