摘要:在.NET 开发中,常常需要对 PDF 文档进行各种操作。以下是一些常见的方法和技术要点。
在.NET 开发中,常常需要对 PDF 文档进行各种操作。以下是一些常见的方法和技术要点。
一、读取 PDF 内容
可以使用第三方库如 iTextSharp 来读取 PDF 文档的内容。通过该库,可以获取 PDF 中的文本、图像等信息。
例如:
using iTextSharp.text.pdf;
using iTextSharp.text.pdf.parser;
PdfReader reader = new PdfReader("your_pdf_File.pdf");
string text = PdfTextExtractor.GetTextFromPage(reader, 1);
二、创建 PDF 文档
同样借助 iTextSharp 库,可以创建新的 PDF 文档。
using iTextSharp.text;
Document document = new Document;
PdfWriter writer = PdfWriter.GetInstance(document, new FileStream("new_pdf_file.pdf", FileMode.Create));
document.Open;
document.Add(new Paragraph("Hello, PDF!"));
document.Close;
三、合并 PDF 文件
可以遍历多个 PDF 文件,将其内容依次添加到一个新的 PDF 文档中实现合并。
Document outputDocument = new Document;
Pdfcopy copy = new PdfCopy(outputDocument, new FileStream("merged_pdf.pdf", FileMode.Create));
outputDocument.Open;
PdfReader reader1 = new PdfReader("pdf1.pdf");
int pages1 = reader1.NumberOfPages;
for (int i = 1; i
{
copy.AddPage(copy.GetImportedPage(reader1, i));
}
PdfReader reader2 = new PdfReader("pdf2.pdf");
int pages2 = reader2.NumberOfPages;
for (int i = 1; i
{
copy.AddPage(copy.GetImportedPage(reader2, i));
}
outputDocument.Close;
通过以上方法,可以在.NET 项目中方便地对 PDF 文档进行各种操作,满足不同的业务需求。
来源:opendotnet