C# 字串包含(開發人員如何使用)

發佈 2024年12月15日

在當今的開發世界中,處理PDF是需要處理文件、表單或報告的應用程式的一項常見要求。 無論您是在建立電子商務平台、文件管理系統,還是僅需處理發票,從 PDF 中提取和搜尋文字都可能是至關重要的。 本文將指導您如何使用C# string.Contains()IronPDF在您的 .NET 專案中搜尋並提取 PDF 文件中的文本。


在進行搜尋時,您可能需要根據特定的字串子字串要求來執行字串比較。 在這種情況下,C# 提供了像 string.Contains 這樣的選項。(),這是最簡單的比較形式之一。

如果您需要指定是否忽略大小寫,您可以使用 StringComparison 列舉。 這可以讓您選擇所需的字串比較類型,例如序數比較或不區分大小寫比較。

如果您想在字串中處理特定位置,例如第一個字元位置或最後一個字元位置,您可以始終使用 Substring 來隔離字串的某些部分以進行進一步處理。


如果您正在處理大型文件,則最好優化文本提取的起始位置,以僅提取相關部分而不是整個文件。 這在您嘗試避免記憶體和處理時間過載時特別有用。



如果您還沒有的話,請嘗試使用IronPDF免費試用今天就來探索其功能,看看它如何簡化您的 PDF 處理任務。 無論您是在構建文檔管理系統、處理發票,還是僅需要從 PDF 中提取數據,IronPDF 都是完成這項工作的理想工具。


IronPDF 是一個強大的函式庫,旨在幫助在 .NET 生態系統中處理 PDF 的開發人員。 它使您能夠輕鬆建立、讀取、編輯和操作 PDF 文件,無需依賴外部工具或複雜的配置。

IronPDF 概述

IronPDF為C#應用程式提供了廣泛的PDF操作功能。 一些主要功能包括:

  • 文本提取:從 PDF 中提取純文本或結構化數據。
  • PDF 編輯:通過新增、刪除或編輯文字、圖片和頁面來修改現有的 PDF。
  • PDF 轉換:將 HTML 或 ASPX 頁面轉換為 PDF,或反之亦然。
  • 表單處理:提取或填入互動式 PDF 表單中的欄位。

    IronPDF 被設計成簡單易用,但也足夠靈活以處理涉及 PDF 的複雜情境。 它能與 .NET Core 和 .NET Framework 無縫協作,成為任何基於 .NET 的專案的完美選擇。

安裝 IronPDF

使用IronPDF,通過 Visual Studio 中的 NuGet 套件管理器安裝:

在深入搜尋 PDF 之前,我們先了解如何使用 IronPDF 從 PDF 中提取文本。

使用 IronPDF 的基本 PDF 文本提取

IronPDF 提供一個簡單的 API 從 PDF 文件中提取文本。 這讓您可以輕鬆搜尋PDF中的特定內容。


using IronPdf;
using System;
public class Program
    public static void Main(string[] args)
        PdfDocument pdf = PdfDocument.FromFile("invoice.pdf");
        string str = pdf.ExtractAllText();
在此範例中,ExtractAllText() 方法從 PDF 文件中提取所有文本。 然後可以處理此文本以搜尋特定的關鍵字或短語。

使用 string.Contains() 進行文字搜尋

一旦從 PDF 中提取出文字,您就可以使用 C# 內建的 string.Contains()搜尋特定字詞的方法。

string.Contains()** 方法返回一個布林值,用於指示指定的字串是否存在於字串中。 這對於基本文本搜索非常有用。

以下是您可以如何使用 string.Contains()在提取的文本中搜索關鍵詞:

bool isFound = text.Contains("search term", StringComparison.OrdinalIgnoreCase);
實用範例:如何檢查 C# 字串是否包含 PDF 文件中的關鍵字

讓我們用一個實際的例子來進一步分析。 假設您想查找特定的發票號碼是否存在於PDF發票文件中。


using IronPdf;
public class Program
    public static void Main(string[] args)
        string searchTerm = "INV-12345";
        PdfDocument pdf = PdfDocument.FromFile("exampleInvoice.pdf");
        string text = pdf.ExtractAllText();
        bool isFound = text.Contains(searchTerm, StringComparison.OrdinalIgnoreCase);
        if (isFound)
            Console.WriteLine($"Invoice number: {searchTerm} found in the document");
            Console.WriteLine($"Invoice number {searchTerm} not found in the document");
輸入 PDF

C# 字串包含(開發人員運作方式):圖 1


C# 字串包含(其工作原理供開發人員參考):圖 2


  • 我們載入 PDF 檔案並提取其文字。
  • 然後,我們使用 string.Contains()在提取的文本中搜尋發票號碼 INV-12345。
  • 由於 StringComparison.OrdinalIgnoreCase,搜索不區分大小寫。


雖然 string.Contains()適用於簡單的子字串搜尋,您可能希望執行更複雜的搜尋,例如尋找模式或一系列關鍵字。 為此,您可以使用正則表達式。


using IronPdf;
using System.Text.RegularExpressions;
public class Program
    public static void Main(string[] args)
        // Define a regex pattern for a typical invoice number format (e.g., INV-12345)
        string pattern = @"INV-\d{5}";
        PdfDocument pdf = PdfDocument.FromFile("exampleInvoice.pdf");
        string text = pdf.ExtractAllText();
        // Perform the regex search
        Match match = Regex.Match(text, pattern);
此代碼將搜尋任何符合模式 INV-XXXXX 的發票號碼,其中 XXXXX 為一系列數字。

在 .NET 中使用 PDF 的最佳實踐

在處理 PDF 文件時,特別是大型或複雜的文件,有幾個最佳實踐需要注意:


  • 處理大型 PDF:如果您正在處理大型 PDF,將文本提取為較小的部分是一個好主意。(按頁面)降低記憶體使用量並改善性能。
  • 處理特殊編碼:注意 PDF 中的編碼和特殊字符。 IronPDF 通常能很好地處理這個問題,但複雜的佈局或字體可能需要額外的處理。

將 IronPDF 整合到 .NET 專案中

IronPDF 輕鬆整合到 .NET 專案中。 在通過 NuGet 下載並安裝 IronPDF 庫後,只需將其匯入到您的 C# 程式碼庫中,如上面的範例所示。

IronPDF 的靈活性使您能夠構建複雜的文檔處理工作流程,例如:

  • 尋找並提取表單中的數據。
  • 將 HTML 轉換為 PDF 並提取內容。
  • 根據使用者輸入或數據庫中的數據生成報告。


IronPDF使處理 PDF 變得簡單高效,特別是在需要提取和搜尋 PDF 中的文字時。 通過結合 C# 的 string.Contains()使用 IronPDF 的文字提取功能,您可以在 .NET 應用程式中快速搜索和處理 PDF 文件。

如果您尚未嘗試過,請立即試用 IronPDF 的免費試用版,以探索其功能,看看它如何簡化您的 PDF 處理任務。 無論您是在構建文檔管理系統、處理發票,還是僅需要從 PDF 中提取數據,IronPDF 都是完成這項工作的理想工具。

要開始使用 IronPDF,下載免費試用親身體驗其強大的 PDF 操作功能。 參觀IronPDF 的網站立即開始。

