qurator-spk · apacha · Aug 22, 2022 · Aug 30, 2022 · Aug 30, 2022 · Aug 30, 2022
diff --git a/README.md b/README.md
@@ -30,7 +30,7 @@ https://huggingface.co/SBB/sbb_binarization
 
 ```sh
 sbb_binarize \
-  -m <path to directory containing model files \
+  -m <path to directory containing model files> \
   <input image> \
   <output image>
 ```
@@ -40,7 +40,7 @@ Images containing a lot of border noise (black pixels) should be cropped beforeh
 ### Example
 
 ```sh
-sbb_binarize -m /path/to/model/ myimage.tif myimage-bin.tif
+sbb_binarize -m /path/to/models/ myimage.tif myimage-bin.tif
 ```
 
 To use the [OCR-D](https://ocr-d.de/) interface:

diff --git a/requirements.txt b/requirements.txt
@@ -3,3 +3,4 @@ setuptools >= 41
 opencv-python-headless
 ocrd >= 2.38.0
 tensorflow >= 2.4.0
+mpire
diff --git a/sbb_binarize/cli.py b/sbb_binarize/cli.py
@@ -3,12 +3,16 @@
 """
 
 from click import command, option, argument, version_option, types
+
 from .sbb_binarize import SbbBinarizer
 
+
 @command()
 @version_option()
 @option('--model-dir', '-m', type=types.Path(exists=True, file_okay=False), required=True, help='directory containing models for prediction')
 @argument('input_image')
 @argument('output_image')
 def main(model_dir, input_image, output_image):
-    SbbBinarizer(model_dir).run(image_path=input_image, save=output_image)
+    binarizer = SbbBinarizer()
+    binarizer.load_model(model_dir)
+    binarizer.binarize_image_file(image_path=input_image, save_path=output_image)
diff --git a/sbb_binarize/ocrd_cli.py b/sbb_binarize/ocrd_cli.py
@@ -69,7 +69,8 @@ def setup(self):
                     raise FileNotFoundError("Does not exist or is not a directory: %s" % model_path)
         # resolve relative path via OCR-D ResourceManager
         model_path = self.resolve_resource(str(model_path))
-        self.binarizer = SbbBinarizer(model_dir=model_path, logger=LOG)
+        self.binarizer = SbbBinarizer()
+        self.binarizer.load_model(model_path)
 
     def process(self):
         """
@@ -110,7 +111,7 @@ def process(self):
 
             if oplevel == 'page':
                 LOG.info("Binarizing on 'page' level in page '%s'", page_id)
-                bin_image = cv2pil(self.binarizer.run(image=pil2cv(page_image)))
+                bin_image = cv2pil(self.binarizer.binarize_image(pil2cv(page_image)))
                 # update METS (add the image file):
                 bin_image_path = self.workspace.save_image_file(bin_image,
                         file_id + '.IMG-BIN',
@@ -124,7 +125,7 @@ def process(self):
                     LOG.warning("Page '%s' contains no text/table regions", page_id)
                 for region in regions:
                     region_image, region_xywh = self.workspace.image_from_segment(region, page_image, page_xywh, feature_filter='binarized')
-                    region_image_bin = cv2pil(binarizer.run(image=pil2cv(region_image)))
+                    region_image_bin = cv2pil(self.binarizer.binarize_image(image=pil2cv(region_image)))
                     region_image_bin_path = self.workspace.save_image_file(
                             region_image_bin,
                             "%s_%s.IMG-BIN" % (file_id, region.id),
@@ -139,7 +140,7 @@ def process(self):
                     LOG.warning("Page '%s' contains no text lines", page_id)
                 for region_id, line in region_line_tuples:
                     line_image, line_xywh = self.workspace.image_from_segment(line, page_image, page_xywh, feature_filter='binarized')
-                    line_image_bin = cv2pil(binarizer.run(image=pil2cv(line_image)))
+                    line_image_bin = cv2pil(self.binarizer.binarize_image(image=pil2cv(line_image)))
                     line_image_bin_path = self.workspace.save_image_file(
                             line_image_bin,
                             "%s_%s_%s.IMG-BIN" % (file_id, region_id, line.id),