Module: modelOcr

Diese Datei enthält Funktionen zur Durchführung von OCR auf Bildern. Sie ermöglicht die Vorverarbeitung von Bildern und die Texterkennung mithilfe von Tesseract.js.
Author:
  • Ilyass Mithilfe von Tesseract.js und Github-Copilot.
Source:

Methods

(async, inner) performOCR(imageBuffer, filename)

Führt OCR auf einem Bild durch und extrahiert den enthaltenen Text mithilfe von Tesseract.js.
Parameters:
Name Type Description
imageBuffer Buffer Der Bildpuffer, aus dem der Text extrahiert werden soll.
filename string Der Name der Datei (für Logging-Zwecke).
Source:
Throws:
Falls ein Fehler bei der OCR-Erkennung auftritt.
Type
Error
Returns:
Example
const result = await performOCR(imageBuffer, 'document.png');
if (result.success) {
    console.log('Extrahierter Text:', result.text);
} else {
    console.error('Fehler:', result.error);
}

(async, inner) preprocessImage(imageBuffer) → {Promise.<Buffer>}

Führt eine Vorverarbeitung des Bildes durch, um die Texterkennung zu verbessern. Falls Jimp nicht verfügbar ist, wird das Originalbild ohne Verarbeitung zurückgegeben.
Parameters:
Name Type Description
imageBuffer Buffer Der Bildpuffer, der verarbeitet werden soll.
Source:
Throws:
Falls ein Fehler während der Verarbeitung auftritt.
Type
Error
Returns:
Der vorverarbeitete Bildpuffer oder das Originalbild, falls Jimp nicht verfügbar ist.
Type
Promise.<Buffer>
Example
const processedImage = await preprocessImage(imageBuffer);