Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
Bei der Arbeit mit Daten in C# müssen Entwickler häufig Textdarstellungen von Zahlen in Ganzzahlen umwandeln. Diese Aufgabe, bekannt als "Parsen von Ganzzahlen", ist entscheidend für verschiedene Anwendungen, von der Verarbeitung von Benutzereingaben bis hin zum Extrahieren von Daten aus Dateien wie PDFs. Während C# leistungsstarke Methoden fürGanzzahlen analysieren, kann der Prozess komplexer werden, wenn mit unstrukturierten oder semistrukturierten Daten gearbeitet wird, wie sie in PDFs zu finden sind.
Dies ist der Ort, an demIronPDF, eine robuste PDF-Bibliothek für .NET-Entwickler, kommt ins Spiel. Mit IronPDF können Sie Text aus PDFs extrahieren und die Parsing-Fähigkeiten von C# nutzen, um diesen Text in verwendbare numerische Daten umzuwandeln. Egal, ob Sie Rechnungen, Berichte oder Formulare analysieren – die Kombination von C# Parsing-Tools mit IronPDF vereinfacht die Verarbeitung von PDF-Daten und ermöglicht es Ihnen, Zahlen im String-Format in Ganzzahlen umzuwandeln.
In diesem Artikel werden wir untersuchen, wie ParseInt in C# verwendet wird, um Zeichenfolgenrepräsentationen von Zahlen in Ganzzahlen zu konvertieren, und wie IronPDF den Prozess der Extraktion und Analyse numerischer Daten aus PDFs vereinfachen kann.
In C# eine Zeichenfolgenwert konvertieren(wie "123")in einen Integer wird üblicherweise mit int.Parse durchgeführt()oder Convert.ToInt32(). Diese Methoden helfen Entwicklern, Textdaten in nutzbare numerische Werte für Berechnungen und Validierungen umzuwandeln.
Convert.ToInt32(Zeichenfolge s): Konvertiert einen String in einen Integer und behandelt null-Eingaben anders.
Hier ist ein Beispiel für die Umwandlung von Zeichenfolgen mit int.Parse():
string numberString = "123";
int num = int.Parse(numberString);
Console.WriteLine(num); // Output: 123
string numberString = "123";
int num = int.Parse(numberString);
Console.WriteLine(num); // Output: 123
Dim numberString As String = "123"
Dim num As Integer = Integer.Parse(numberString)
Console.WriteLine(num) ' Output: 123
Alternativ mit der Convert-Klasse:
string numericString = "123";
int i = Convert.ToInt32(numericString);
Console.WriteLine(result); // Outputs: 123
string numericString = "123";
int i = Convert.ToInt32(numericString);
Console.WriteLine(result); // Outputs: 123
Dim numericString As String = "123"
Dim i As Integer = Convert.ToInt32(numericString)
Console.WriteLine(result) ' Outputs: 123
Die Convert-Klasse ermöglicht es Ihnen, Zeichenfolgen und andere Datentypen sicher zu konvertieren. Es ist besonders nützlich, wenn die Zeichenfolgenvariable möglicherweise einen null- oder ungültigen Wert darstellt, wie Convert.ToInt32.()gibt einen Standardwert zurück(0 in diesem Fall)anstatt eine Ausnahme auszulösen.
Ein Problem, mit dem Entwickler häufig konfrontiert sind, wenn sie Zeichenfolgen in Ganzzahlen umwandeln, ist der Umgang mit ungültigen oder nicht numerischen Eingaben. Wenn die Zeichenfolgenrepräsentation der Zahl nicht im korrekten Format vorliegt, können Methoden wie int.Parse verwendet werden.()wird eine Ausnahme auslösen. Jedoch, Convert.ToInt32()verfügt über einen integrierten Fallback-Mechanismus für ungültige Zeichenfolgen.
Hier ist ein Beispiel, das zeigt, wie Standardwerte beim Parsen gehandhabt werden:
string invalidString = "abc";
int result = Convert.ToInt32(invalidString); // Returns 0 (default value) instead of throwing an error.
Console.WriteLine(result); // Outputs: 0
string invalidString = "abc";
int result = Convert.ToInt32(invalidString); // Returns 0 (default value) instead of throwing an error.
Console.WriteLine(result); // Outputs: 0
Dim invalidString As String = "abc"
Dim result As Integer = Convert.ToInt32(invalidString) ' Returns 0 (default value) instead of throwing an error.
Console.WriteLine(result) ' Outputs: 0
Wenn Sie Zeichenfolgen mit mehr Kontrolle konvertieren möchten, können Sieint.TryParse(), das einen booleschen Wert zurückgibt, der angibt, ob die Umwandlung erfolgreich war oder nicht:
string invalidInput = "abc";
if (int.TryParse(invalidInput, out int result))
{
Console.WriteLine(result);
}
else
{
Console.WriteLine("Parsing failed.");
}
string invalidInput = "abc";
if (int.TryParse(invalidInput, out int result))
{
Console.WriteLine(result);
}
else
{
Console.WriteLine("Parsing failed.");
}
Dim invalidInput As String = "abc"
Dim result As Integer
If Integer.TryParse(invalidInput, result) Then
Console.WriteLine(result)
Else
Console.WriteLine("Parsing failed.")
End If
In diesem Fall, TryParse()verwendet einen Out-Parameter, um den konvertierten Integer zu speichern, was der Methode ermöglicht, einen Wert zurückzugeben, ohne eine Ausnahme auszulösen. Falls die Konvertierung fehlschlägt, wird die else-Anweisung ausgeführt, anstatt einfach Ihr Programm abstürzen zu lassen. Andernfalls zeigt das Programm das Ergebnis der erfolgreich geparsten Zahl aus der Eingabezeichenfolge an. Die Verwendung von int.TryParse kann in Fällen hilfreich sein, in denen eine Umwandlung fehlschlagen könnte und Sie einen Absturz des Programms vermeiden möchten.
Beim Arbeiten mit PDFs können Sie auf Tabellen oder unstrukturierte Texte stoßen, die numerische Daten in Zeichenfolgen enthalten. Um diese Daten zu extrahieren und zu verarbeiten, ist die Umwandlung von Zeichenfolgen in Ganzzahlen entscheidend. IronPDF macht diesen Prozess unkompliziert und bietet sowohl die Flexibilität als auch die Leistungsfähigkeit, PDF-Inhalte zu lesen und Operationen wie das Konvertieren von Zeichenfolgen in numerische Werte durchzuführen.
Hier sind einige der Hauptfunktionen, die IronPDF bietet:
Um mit der Verwendung vonIronPDF, müssen Sie es zuerst installieren. Wenn es bereits installiert ist, können Sie zum nächsten Abschnitt übergehen, andernfalls decken die folgenden Schritte ab, wie die IronPDF-Bibliothek installiert wird.
AnIronPDF installierenVerwenden Sie die NuGet-Paket-Manager-Konsole, öffnen Sie Visual Studio und navigieren Sie zur Paket-Manager-Konsole. Führen Sie dann den folgenden Befehl aus:
Install-Package IronPdf
Install-Package IronPdf
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronPdf
Öffnen Sie Visual Studio, gehen Sie zu "Tools -> NuGet-Paket-Manager -> NuGet-Pakete für die Lösung verwalten" und suchen Sie nach IronPDF. Von hier aus müssen Sie nur Ihr Projekt auswählen und auf „Installieren“ klicken, dann wird IronPDF zu Ihrem Projekt hinzugefügt.
Sobald Sie IronPDF installiert haben, müssen Sie nur noch die korrekte Using-Anweisung am Anfang Ihres Codes hinzufügen, um IronPDF verwenden zu können:
using IronPdf;
using IronPdf;
Imports IronPdf
IronPDF bietet einekostenloser Testmit vollem Zugriff auf seine Funktionen. Besuchen Sie dieIronPDF-Websiteum die Testversion herunterzuladen und mit der Integration erweiterter PDF-Verwaltung in Ihre .NET-Projekte zu beginnen.
Der folgende C#-Code zeigt, wie man mit IronPDF Text aus einer PDF-Datei extrahiert und anschließend reguläre Ausdrücke verwendet, um alle numerischen Werte im extrahierten Text zu finden und zu analysieren. Der Code verarbeitet sowohl ganze Zahlen als auch Dezimalzahlen und entfernt nicht-numerische Zeichen wie Währungssymbole.
using IronPdf;
using System.Text.RegularExpressions;
public class Program
{
public static void Main(string[] args)
{
// Load a PDF file
PdfDocument pdf = PdfDocument.FromFile("example.pdf");
// Extract all text from the PDF
string text = pdf.ExtractAllText();
// Print the extracted text (for reference)
Console.WriteLine("Extracted Text: ");
Console.WriteLine(text);
// Parse and print all numbers found in the extracted text
Console.WriteLine("\nParsed Numbers:");
// Use regular expression to find all number patterns, including integers and decimals
var numberMatches = Regex.Matches(text, @"\d+(\.\d+)?");
// Iterate through all matched numbers and print them
foreach (Match match in numberMatches)
{
// Print each matched number
Console.WriteLine($"{match.Value}");
}
}
}
using IronPdf;
using System.Text.RegularExpressions;
public class Program
{
public static void Main(string[] args)
{
// Load a PDF file
PdfDocument pdf = PdfDocument.FromFile("example.pdf");
// Extract all text from the PDF
string text = pdf.ExtractAllText();
// Print the extracted text (for reference)
Console.WriteLine("Extracted Text: ");
Console.WriteLine(text);
// Parse and print all numbers found in the extracted text
Console.WriteLine("\nParsed Numbers:");
// Use regular expression to find all number patterns, including integers and decimals
var numberMatches = Regex.Matches(text, @"\d+(\.\d+)?");
// Iterate through all matched numbers and print them
foreach (Match match in numberMatches)
{
// Print each matched number
Console.WriteLine($"{match.Value}");
}
}
}
Imports Microsoft.VisualBasic
Imports IronPdf
Imports System.Text.RegularExpressions
Public Class Program
Public Shared Sub Main(ByVal args() As String)
' Load a PDF file
Dim pdf As PdfDocument = PdfDocument.FromFile("example.pdf")
' Extract all text from the PDF
Dim text As String = pdf.ExtractAllText()
' Print the extracted text (for reference)
Console.WriteLine("Extracted Text: ")
Console.WriteLine(text)
' Parse and print all numbers found in the extracted text
Console.WriteLine(vbLf & "Parsed Numbers:")
' Use regular expression to find all number patterns, including integers and decimals
Dim numberMatches = Regex.Matches(text, "\d+(\.\d+)?")
' Iterate through all matched numbers and print them
For Each match As Match In numberMatches
' Print each matched number
Console.WriteLine($"{match.Value}")
Next match
End Sub
End Class
Text aus PDF extrahieren:
Der Code beginnt mit dem Laden einer PDF-Datei mit IronPDF. Dann extrahiert es den gesamten Text aus dem PDF.
Verwenden Sie reguläre Ausdrücke, um Zahlen zu finden:
Der Code verwendet einen regulären Ausdruck(ein Muster, um Text abzugleichen)um den extrahierten Text zu durchsuchen und alle Zahlen zu finden. Der reguläre Ausdruck sucht sowohl nach ganzen Zahlen(z.B., 12345)und Dezimalzahlen(z. B. 50,75).
Zahlen analysieren und drucken:
Sobald die Zahlen gefunden sind, gibt das Programm jede einzelne auf der Konsole aus. Dies umfasst ganze Zahlen und Dezimalzahlen.
Warum Reguläre Ausdrücke:
Reguläre Ausdrücke werden verwendet, weil sie leistungsstarke Werkzeuge sind, um Muster in Texten, wie Zahlen, zu finden. Sie können Zahlen mit Symbolen verarbeiten.(wie Währungssymbole $), um den Prozess flexibler zu gestalten.
Das Extrahieren sauberer Daten aus komplexen PDF-Strukturen führt häufig zu Zeichenfolgen, die möglicherweise eine weitere Verarbeitung erfordern, wie zum Beispiel das Umwandeln von Zeichenfolgen in ganze Zahlen. Hier sind einige häufige Herausforderungen und wie IronPDF helfen kann:
PDFs enthalten häufig Zahlen, die als Text formatiert sind.(z. B. „1.234,56“ oder „12.345 USD“). Um diese korrekt zu verarbeiten, müssen Sie sicherstellen, dass die Zeichenfolgen-Darstellung der Zahl im richtigen Format zum Parsen vorliegt. IronPDF ermöglicht es Ihnen, Text sauber zu extrahieren, und Sie können Zeichenfolgenbearbeitungsmethoden verwenden.(z.B., Ersetzen())vor der Umwandlung die Formatierung anzupassen.
Beispiel:
string formattedNumber = "1,234.56"; // String value with commas
string cleanNumber = formattedNumber.Replace(",", ""); // Remove commas
int result = Convert.ToInt32(Convert.ToDouble(cleanNumber)); // Convert to integer
Console.WriteLine(result); // Outputs: 1234
string formattedNumber = "1,234.56"; // String value with commas
string cleanNumber = formattedNumber.Replace(",", ""); // Remove commas
int result = Convert.ToInt32(Convert.ToDouble(cleanNumber)); // Convert to integer
Console.WriteLine(result); // Outputs: 1234
Dim formattedNumber As String = "1,234.56" ' String value with commas
Dim cleanNumber As String = formattedNumber.Replace(",", "") ' Remove commas
Dim result As Integer = Convert.ToInt32(Convert.ToDouble(cleanNumber)) ' Convert to integer
Console.WriteLine(result) ' Outputs: 1234
In einem komplexen PDF können numerische Werte in verschiedenen Formaten erscheinen oder an verschiedenen Stellen verstreut sein. Mit IronPDF können Sie den gesamten Text extrahieren und dann reguläre Ausdrücke verwenden, um Zeichenfolgen effizient in ganze Zahlen umzuwandeln.
Das Parsen von Ganzzahlen in C# ist eine grundlegende Fähigkeit für Entwickler, insbesondere beim Umgang mit Benutzereingaben oder der Datenextraktion aus verschiedenen Quellen. Während integrierte Methoden wie int.Parse()und Convert.ToInt32()sind nützlich, jedoch kann die Verarbeitung von unstrukturierten oder halbstrukturierten Daten - wie dem Text, der in PDFs zu finden ist - zusätzliche Herausforderungen darstellen. Hier kommt IronPDF ins Spiel und bietet eine leistungsstarke und unkomplizierte Lösung, um Text aus PDFs zu extrahieren und in .NET-Anwendungen damit zu arbeiten.
Durch die Verwendung vonIronPDF, erhalten Sie die Möglichkeit, problemlos Text aus komplexen PDFs, einschließlich gescannter Dokumente, zu extrahieren und diese Daten in verwendbare numerische Werte umzuwandeln. Mit Funktionen wie OCR für gescannte PDFs und leistungsstarken Textextraktionswerkzeugen ermöglicht IronPDF die Optimierung der Datenverarbeitung, selbst in anspruchsvollen Formaten.
Egal ob es sich um Rechnungen, Finanzberichte oder andere Dokumente handelt, die numerische Daten enthalten, die Kombination von C#'s ParseInt-Methoden mit IronPDF wird Ihnen helfen, effizienter und genauer zu arbeiten.
Verzichten Sie nicht darauf, komplexe PDFs Ihren Entwicklungsprozess verlangsamen zu lassen—beginnen Sie mit der Nutzung vonIronPDFist die perfekte Gelegenheit, um zu erkunden, wie IronPDF Ihren Workflow verbessern kann. Warum probieren Sie es nicht aus und sehen, wie es Ihr nächstes Projekt optimieren kann?
10 .NET API-Produkte für Ihre Bürodokumente