Diese Datei enthält Funktionen zur Durchführung von OCR auf Bildern.
Sie ermöglicht die Vorverarbeitung von Bildern und die Texterkennung mithilfe von Tesseract.js.
- Source:
Methods
(async, inner) performOCR(imageBuffer, filename)
Führt OCR auf einem Bild durch und extrahiert den enthaltenen Text mithilfe von Tesseract.js.
Parameters:
Name | Type | Description |
---|---|---|
imageBuffer |
Buffer | Der Bildpuffer, aus dem der Text extrahiert werden soll. |
filename |
string | Der Name der Datei (für Logging-Zwecke). |
- Source:
Throws:
-
Falls ein Fehler bei der OCR-Erkennung auftritt.
- Type
- Error
Returns:
Example
const result = await performOCR(imageBuffer, 'document.png');
if (result.success) {
console.log('Extrahierter Text:', result.text);
} else {
console.error('Fehler:', result.error);
}
(async, inner) preprocessImage(imageBuffer) → {Promise.<Buffer>}
Führt eine Vorverarbeitung des Bildes durch, um die Texterkennung zu verbessern.
Falls Jimp nicht verfügbar ist, wird das Originalbild ohne Verarbeitung zurückgegeben.
Parameters:
Name | Type | Description |
---|---|---|
imageBuffer |
Buffer | Der Bildpuffer, der verarbeitet werden soll. |
- Source:
Throws:
-
Falls ein Fehler während der Verarbeitung auftritt.
- Type
- Error
Returns:
Der vorverarbeitete Bildpuffer oder das Originalbild, falls Jimp nicht verfügbar ist.
- Type
- Promise.<Buffer>
Example
const processedImage = await preprocessImage(imageBuffer);