{"id":3725,"date":"2025-09-22T10:01:29","date_gmt":"2025-09-22T10:01:29","guid":{"rendered":"https:\/\/shijing.de\/?page_id=3725"},"modified":"2025-09-22T12:08:19","modified_gmt":"2025-09-22T12:08:19","slug":"digitalisierung-im-wandel-der-zeit","status":"publish","type":"page","link":"https:\/\/shijing.de\/?page_id=3725","title":{"rendered":"Digitalisierung (im Wandel der Zeit) 2005 &#8211; 2025"},"content":{"rendered":"\n<h2 class=\"wp-block-heading\">Der Ausgangspunkt f\u00fcr die Erstellung dieser Internetseite<\/h2>\n\n\n\n<p> Der Weg zu einer digitalen Version des Shijing war lang und voller Herausforderungen. Meine Mutter, Hildegard Fischer, beschreibt hier in ihren eigenen Worten den aufwendigen Prozess der Digitalisierung.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Im Jahr 2005 hatte ich das \u00fcber 100 Jahre alte, handschriftliche Buch mit dem Titel \u201eSchi-King \u2013 Shijing SINICE cum praeparatione interpretationis\u201c digitalisiert. Der Prozess war mit mehreren Herausforderungen verbunden.<\/p>\n\n\n\n<p>Zun\u00e4chst mussten die 623 unnummerierten und sehr d\u00fcnnen Seiten sorgf\u00e4ltig gescannt werden, ohne den fragilen Einband zu besch\u00e4digen. Anschlie\u00dfend erforderte die digitale Nachbearbeitung eine Bereinigung der Scans, da der Text der R\u00fcckseiten durchschien und Schatten vorhanden waren.<\/p>\n\n\n\n<p>Zudem mussten Zeichen korrigiert werden, die durch die Buchbindung teilweise verdeckt oder durch die W\u00f6lbung der Seiten verzerrt dargestellt wurden. Aufgrund unterschiedlicher Farbintensit\u00e4t der originalen Pinselzeichen wurden tausende Zeichen manuell nachgebessert. Hierf\u00fcr wurde ein Index aus gut lesbaren Zeichen erstellt, um unklare Stellen zu ersetzen.<\/p>\n\n\n\n<p>Die gesamte Bearbeitung erstreckte sich vom Fr\u00fchjahr bis in den Herbst des Jahres 2005.<br><em>&#8211; Hildegard Fischer<\/em><\/p>\n<\/blockquote>\n\n\n\n<figure class=\"wp-block-image size-full wp-duotone-unset-1\"><img loading=\"lazy\" decoding=\"async\" width=\"1002\" height=\"765\" src=\"https:\/\/shijing.de\/wp-content\/uploads\/2021\/10\/Seite-1-a.jpg\" alt=\"\" class=\"wp-image-3395\" title=\"\" srcset=\"https:\/\/shijing.de\/wp-content\/uploads\/2021\/10\/Seite-1-a.jpg 1002w, https:\/\/shijing.de\/wp-content\/uploads\/2021\/10\/Seite-1-a-300x229.jpg 300w, https:\/\/shijing.de\/wp-content\/uploads\/2021\/10\/Seite-1-a-768x586.jpg 768w, https:\/\/shijing.de\/wp-content\/uploads\/2021\/10\/Seite-1-a-50x38.jpg 50w\" sizes=\"auto, (max-width: 1002px) 100vw, 1002px\" \/><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<h1 class=\"wp-block-heading\">Der Weg ins Internet von 2005 bis 2025.<\/h1>\n\n\n\n<p>Aufbauend auf diese unerm\u00fcdlichen Arbeit ist das Werk nun online verf\u00fcgbar. Der Weg von den ersten Scans aus dem Jahr 2005 bis zur finalen digitalen Nachbearbeitung mit heutigen Mitteln wird hier beschrieben.<\/p>\n\n\n\n<p><strong class=\"\">Dabei wurde bewusst ausschlie\u00dflich auf freie Open-Source-Software (hier Arch Linux) gesetzt, um das Projekt unabh\u00e4ngig und f\u00fcr alle zug\u00e4nglich zu halten.<\/strong><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Konvertierung der &#8222;alten&#8220; Bildformate in ein aktuelles platzsparendes Format<\/h2>\n\n\n\n<p>Verwendete Software:  <strong>imagemagick<\/strong><\/p>\n\n\n\n<div class=\"wp-block-kevinbatdorf-code-block-pro cbp-has-line-numbers\" data-code-block-pro-font-family=\"Code-Pro-JetBrains-Mono\" style=\"font-size:clamp(14px, .875rem, 21px);font-family:Code-Pro-JetBrains-Mono,ui-monospace,SFMono-Regular,Menlo,Monaco,Consolas,monospace;--cbp-line-number-color:#24292e;--cbp-line-number-width:calc(1 * 0.6 * .875rem);line-height:clamp(20px, 1.25rem, 30px);--cbp-tab-width:2;tab-size:var(--cbp-tab-width, 2)\"><span style=\"display:flex;align-items:center;padding:10px 0px 10px 16px;margin-bottom:-2px;width:100%;text-align:left;background-color:#f2f2f2;color:#2f363c\">Bash<\/span><span role=\"button\" tabindex=\"0\" style=\"color:#24292e;display:none\" aria-label=\"Copy\" class=\"code-block-pro-copy-button\"><pre class=\"code-block-pro-copy-button-pre\" aria-hidden=\"true\"><textarea class=\"code-block-pro-copy-button-textarea\" tabindex=\"-1\" aria-hidden=\"true\" readonly>sudo pacman -S imagemagick<\/textarea><\/pre><svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" style=\"width:24px;height:24px\" fill=\"none\" viewBox=\"0 0 24 24\" stroke=\"currentColor\" stroke-width=\"2\"><path class=\"with-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2m-6 9l2 2 4-4\"><\/path><path class=\"without-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2\"><\/path><\/svg><\/span><pre class=\"shiki github-light\" style=\"background-color: #fff\" tabindex=\"0\"><code><span class=\"line\"><span style=\"color: #6F42C1\">sudo<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">pacman<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">-S<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">imagemagick<\/span><\/span><\/code><\/pre><\/div>\n\n\n\n<p>PSD nach JPG:<\/p>\n\n\n\n<div class=\"wp-block-kevinbatdorf-code-block-pro cbp-has-line-numbers\" data-code-block-pro-font-family=\"Code-Pro-JetBrains-Mono\" style=\"font-size:clamp(14px, .875rem, 21px);font-family:Code-Pro-JetBrains-Mono,ui-monospace,SFMono-Regular,Menlo,Monaco,Consolas,monospace;--cbp-line-number-color:#24292e;--cbp-line-number-width:calc(1 * 0.6 * .875rem);line-height:clamp(20px, 1.25rem, 30px);--cbp-tab-width:2;tab-size:var(--cbp-tab-width, 2)\"><span style=\"display:flex;align-items:center;padding:10px 0px 10px 16px;margin-bottom:-2px;width:100%;text-align:left;background-color:#f2f2f2;color:#2f363c\">Bash<\/span><span role=\"button\" tabindex=\"0\" style=\"color:#24292e;display:none\" aria-label=\"Copy\" class=\"code-block-pro-copy-button\"><pre class=\"code-block-pro-copy-button-pre\" aria-hidden=\"true\"><textarea class=\"code-block-pro-copy-button-textarea\" tabindex=\"-1\" aria-hidden=\"true\" readonly>find . -type f -iname \".psd\" -exec bash -c ' TARGET=\"${0%.}.jpg\"\nif &#91; ! -f \"$TARGET\" &#93;; then\necho \"Konvertiere: $0\"\nmagick \"$0\" -quality 90 \"$TARGET\"\nfi\n' {} \\;<\/textarea><\/pre><svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" style=\"width:24px;height:24px\" fill=\"none\" viewBox=\"0 0 24 24\" stroke=\"currentColor\" stroke-width=\"2\"><path class=\"with-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2m-6 9l2 2 4-4\"><\/path><path class=\"without-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2\"><\/path><\/svg><\/span><pre class=\"shiki github-light\" style=\"background-color: #fff\" tabindex=\"0\"><code><span class=\"line\"><span style=\"color: #6F42C1\">find<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">.<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">-type<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">f<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">-iname<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">&quot;.psd&quot;<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">-exec<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">bash<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">-c<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">&#39; TARGET=&quot;${0%.}.jpg&quot;<\/span><\/span>\n<span class=\"line\"><span style=\"color: #032F62\">if &#91; ! -f &quot;$TARGET&quot; &#93;; then<\/span><\/span>\n<span class=\"line\"><span style=\"color: #032F62\">echo &quot;Konvertiere: $0&quot;<\/span><\/span>\n<span class=\"line\"><span style=\"color: #032F62\">magick &quot;$0&quot; -quality 90 &quot;$TARGET&quot;<\/span><\/span>\n<span class=\"line\"><span style=\"color: #032F62\">fi<\/span><\/span>\n<span class=\"line\"><span style=\"color: #032F62\">&#39;<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">{}<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">\\;<\/span><\/span><\/code><\/pre><\/div>\n\n\n\n<p>BMP zu JPG:<\/p>\n\n\n\n<div class=\"wp-block-kevinbatdorf-code-block-pro cbp-has-line-numbers\" data-code-block-pro-font-family=\"Code-Pro-JetBrains-Mono\" style=\"font-size:clamp(14px, .875rem, 21px);font-family:Code-Pro-JetBrains-Mono,ui-monospace,SFMono-Regular,Menlo,Monaco,Consolas,monospace;--cbp-line-number-color:#24292e;--cbp-line-number-width:calc(1 * 0.6 * .875rem);line-height:clamp(20px, 1.25rem, 30px);--cbp-tab-width:2;tab-size:var(--cbp-tab-width, 2)\"><span style=\"display:flex;align-items:center;padding:10px 0px 10px 16px;margin-bottom:-2px;width:100%;text-align:left;background-color:#f2f2f2;color:#2f363c\">Bash<\/span><span role=\"button\" tabindex=\"0\" style=\"color:#24292e;display:none\" aria-label=\"Copy\" class=\"code-block-pro-copy-button\"><pre class=\"code-block-pro-copy-button-pre\" aria-hidden=\"true\"><textarea class=\"code-block-pro-copy-button-textarea\" tabindex=\"-1\" aria-hidden=\"true\" readonly>find . -type f -iname \"*.bmp\" -exec bash -c '\n    TARGET=\"${0%.*}.jpg\"\n    if &#91; ! -f \"$TARGET\" &#93;; then\n        echo \"Konvertiere: $0\"\n        magick \"$0\" -quality 85 \"$TARGET\"\n    fi\n' {} \\;<\/textarea><\/pre><svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" style=\"width:24px;height:24px\" fill=\"none\" viewBox=\"0 0 24 24\" stroke=\"currentColor\" stroke-width=\"2\"><path class=\"with-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2m-6 9l2 2 4-4\"><\/path><path class=\"without-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2\"><\/path><\/svg><\/span><pre class=\"shiki github-light\" style=\"background-color: #fff\" tabindex=\"0\"><code><span class=\"line\"><span style=\"color: #6F42C1\">find<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">.<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">-type<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">f<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">-iname<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">&quot;*.bmp&quot;<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">-exec<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">bash<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">-c<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">&#39;<\/span><\/span>\n<span class=\"line\"><span style=\"color: #032F62\">    TARGET=&quot;${0%.*}.jpg&quot;<\/span><\/span>\n<span class=\"line\"><span style=\"color: #032F62\">    if &#91; ! -f &quot;$TARGET&quot; &#93;; then<\/span><\/span>\n<span class=\"line\"><span style=\"color: #032F62\">        echo &quot;Konvertiere: $0&quot;<\/span><\/span>\n<span class=\"line\"><span style=\"color: #032F62\">        magick &quot;$0&quot; -quality 85 &quot;$TARGET&quot;<\/span><\/span>\n<span class=\"line\"><span style=\"color: #032F62\">    fi<\/span><\/span>\n<span class=\"line\"><span style=\"color: #032F62\">&#39;<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">{}<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">\\;<\/span><\/span><\/code><\/pre><\/div>\n\n\n\n<p>Alternativ zu JPG bietet sich auch PNG an, je nach Bildmaterial. <\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Zusammenfassung der einzelnen Bilddateien in eine PDF und OCR.<\/h2>\n\n\n\n<p>Installation von ocrmypdf und die Tesseract-Sprachpakete f\u00fcr Deutsch und \u2013 ganz wichtig \u2013 f\u00fcr Fraktur.<\/p>\n\n\n\n<div class=\"wp-block-kevinbatdorf-code-block-pro cbp-has-line-numbers\" data-code-block-pro-font-family=\"Code-Pro-JetBrains-Mono\" style=\"font-size:clamp(14px, .875rem, 21px);font-family:Code-Pro-JetBrains-Mono,ui-monospace,SFMono-Regular,Menlo,Monaco,Consolas,monospace;--cbp-line-number-color:#24292e;--cbp-line-number-width:calc(1 * 0.6 * .875rem);line-height:clamp(20px, 1.25rem, 30px);--cbp-tab-width:2;tab-size:var(--cbp-tab-width, 2)\"><span style=\"display:flex;align-items:center;padding:10px 0px 10px 16px;margin-bottom:-2px;width:100%;text-align:left;background-color:#f2f2f2;color:#2f363c\">Bash<\/span><span role=\"button\" tabindex=\"0\" style=\"color:#24292e;display:none\" aria-label=\"Copy\" class=\"code-block-pro-copy-button\"><pre class=\"code-block-pro-copy-button-pre\" aria-hidden=\"true\"><textarea class=\"code-block-pro-copy-button-textarea\" tabindex=\"-1\" aria-hidden=\"true\" readonly>sudo pacman -S ocrmypdf tesseract-data-deu tesseract-data-frk\n# sudo pacman -S yay (falls yay nicht schon installiert ist - https:\/\/aur.archlinux.org\/) \nyay \u2013S ocrmypdf  <\/textarea><\/pre><svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" style=\"width:24px;height:24px\" fill=\"none\" viewBox=\"0 0 24 24\" stroke=\"currentColor\" stroke-width=\"2\"><path class=\"with-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2m-6 9l2 2 4-4\"><\/path><path class=\"without-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2\"><\/path><\/svg><\/span><pre class=\"shiki github-light\" style=\"background-color: #fff\" tabindex=\"0\"><code><span class=\"line\"><span style=\"color: #6F42C1\">sudo<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">pacman<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">-S<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">ocrmypdf<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">tesseract-data-deu<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">tesseract-data-frk<\/span><\/span>\n<span class=\"line\"><span style=\"color: #6A737D\"># sudo pacman -S yay (falls yay nicht schon installiert ist - https:\/\/aur.archlinux.org\/) <\/span><\/span>\n<span class=\"line\"><span style=\"color: #6F42C1\">yay<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">\u2013S<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">ocrmypdf<\/span><span style=\"color: #24292E\">  <\/span><\/span><\/code><\/pre><\/div>\n\n\n\n<ul class=\"wp-block-list\">\n<li>ocrmypdf: Das Hauptprogramm zur Konvertierung (OCR).<\/li>\n\n\n\n<li>tesseract-data-deu: Das Sprachpaket f\u00fcr modernes Deutsch.<\/li>\n\n\n\n<li>tesseract-data-frk: Das spezielle Sprachpaket f\u00fcr Frakturschriften.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Vorbereitung der Bilddateien durch Zusammenf\u00fchrung in eine PDF-Datei<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Alle Bilddateien in einen eigenen Ordner, z.B. <code>~\/Buch-Scan\/<\/code>.<\/li>\n\n\n\n<li>Navigieren in den Ordner<\/li>\n<\/ul>\n\n\n\n<div class=\"wp-block-kevinbatdorf-code-block-pro cbp-has-line-numbers\" data-code-block-pro-font-family=\"Code-Pro-JetBrains-Mono\" style=\"font-size:clamp(14px, .875rem, 21px);font-family:Code-Pro-JetBrains-Mono,ui-monospace,SFMono-Regular,Menlo,Monaco,Consolas,monospace;--cbp-line-number-color:#24292e;--cbp-line-number-width:calc(1 * 0.6 * .875rem);line-height:clamp(20px, 1.25rem, 30px);--cbp-tab-width:2;tab-size:var(--cbp-tab-width, 2)\"><span style=\"display:flex;align-items:center;padding:10px 0px 10px 16px;margin-bottom:-2px;width:100%;text-align:left;background-color:#f2f2f2;color:#2f363c\">Bash<\/span><span role=\"button\" tabindex=\"0\" style=\"color:#24292e;display:none\" aria-label=\"Copy\" class=\"code-block-pro-copy-button\"><pre class=\"code-block-pro-copy-button-pre\" aria-hidden=\"true\"><textarea class=\"code-block-pro-copy-button-textarea\" tabindex=\"-1\" aria-hidden=\"true\" readonly>cd ~\/Buch-Scan\/<\/textarea><\/pre><svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" style=\"width:24px;height:24px\" fill=\"none\" viewBox=\"0 0 24 24\" stroke=\"currentColor\" stroke-width=\"2\"><path class=\"with-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2m-6 9l2 2 4-4\"><\/path><path class=\"without-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2\"><\/path><\/svg><\/span><pre class=\"shiki github-light\" style=\"background-color: #fff\" tabindex=\"0\"><code><span class=\"line\"><span style=\"color: #005CC5\">cd<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">~\/Buch-Scan\/<\/span><\/span><\/code><\/pre><\/div>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Verwendung des Tool <code>convert<\/code> (von ImageMagick), um alle Bilder zu einer PDF zusammenzuf\u00fcgen. Darauf achten, dass alle Dateien alphabetisch korrekt benannt sind (z.B. <code>seite-001.png<\/code>, <code>seite-002.png<\/code>, &#8230; <code>seite-500.png<\/code>). <\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li>F\u00fchre dann diesen Befehl aus: <\/li>\n<\/ul>\n\n\n\n<div class=\"wp-block-kevinbatdorf-code-block-pro cbp-has-line-numbers\" data-code-block-pro-font-family=\"Code-Pro-JetBrains-Mono\" style=\"font-size:clamp(14px, .875rem, 21px);font-family:Code-Pro-JetBrains-Mono,ui-monospace,SFMono-Regular,Menlo,Monaco,Consolas,monospace;--cbp-line-number-color:#24292e;--cbp-line-number-width:calc(1 * 0.6 * .875rem);line-height:clamp(20px, 1.25rem, 30px);--cbp-tab-width:2;tab-size:var(--cbp-tab-width, 2)\"><span style=\"display:flex;align-items:center;padding:10px 0px 10px 16px;margin-bottom:-2px;width:100%;text-align:left;background-color:#f2f2f2;color:#2f363c\">Bash<\/span><span role=\"button\" tabindex=\"0\" style=\"color:#24292e;display:none\" aria-label=\"Copy\" class=\"code-block-pro-copy-button\"><pre class=\"code-block-pro-copy-button-pre\" aria-hidden=\"true\"><textarea class=\"code-block-pro-copy-button-textarea\" tabindex=\"-1\" aria-hidden=\"true\" readonly>convert *.png Buch-Rohscan.pdf <\/textarea><\/pre><svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" style=\"width:24px;height:24px\" fill=\"none\" viewBox=\"0 0 24 24\" stroke=\"currentColor\" stroke-width=\"2\"><path class=\"with-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2m-6 9l2 2 4-4\"><\/path><path class=\"without-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2\"><\/path><\/svg><\/span><pre class=\"shiki github-light\" style=\"background-color: #fff\" tabindex=\"0\"><code><span class=\"line\"><span style=\"color: #6F42C1\">convert<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">*<\/span><span style=\"color: #032F62\">.png<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">Buch-Rohscan.pdf<\/span><span style=\"color: #24292E\"> <\/span><\/span><\/code><\/pre><\/div>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Dieser Prozess kann je nach Aufl\u00f6sung und Anzahl der Bilder eine Weile dauern. Am Ende entsteht eine (gro\u00dfe) Datei namens <code>Buch-Rohscan.pdf<\/code> in dem Ordner.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Von der PDF-Datei mit Bildern zur PDF mit digitalem Text.<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">OCR-Prozess starten<\/h3>\n\n\n\n<p>Jetzt kommt die Magie. Im selben Ordner (<code>~\/Buch-Scan\/<\/code>) wird <code><strong>ocrmypdf<\/strong><\/code> auf die gerade erstellte PDF-Datei ausgef\u00fchrt.<\/p>\n\n\n\n<div class=\"wp-block-kevinbatdorf-code-block-pro cbp-has-line-numbers\" data-code-block-pro-font-family=\"Code-Pro-JetBrains-Mono\" style=\"font-size:clamp(14px, .875rem, 21px);font-family:Code-Pro-JetBrains-Mono,ui-monospace,SFMono-Regular,Menlo,Monaco,Consolas,monospace;--cbp-line-number-color:#24292e;--cbp-line-number-width:calc(1 * 0.6 * .875rem);line-height:clamp(20px, 1.25rem, 30px);--cbp-tab-width:2;tab-size:var(--cbp-tab-width, 2)\"><span style=\"display:flex;align-items:center;padding:10px 0px 10px 16px;margin-bottom:-2px;width:100%;text-align:left;background-color:#f2f2f2;color:#2f363c\">Bash<\/span><span role=\"button\" tabindex=\"0\" style=\"color:#24292e;display:none\" aria-label=\"Copy\" class=\"code-block-pro-copy-button\"><pre class=\"code-block-pro-copy-button-pre\" aria-hidden=\"true\"><textarea class=\"code-block-pro-copy-button-textarea\" tabindex=\"-1\" aria-hidden=\"true\" readonly>ocrmypdf -l deu+frk --jobs 4 Buch-Rohscan.pdf Buch-Fertig-OCR.pdf<\/textarea><\/pre><svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" style=\"width:24px;height:24px\" fill=\"none\" viewBox=\"0 0 24 24\" stroke=\"currentColor\" stroke-width=\"2\"><path class=\"with-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2m-6 9l2 2 4-4\"><\/path><path class=\"without-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2\"><\/path><\/svg><\/span><pre class=\"shiki github-light\" style=\"background-color: #fff\" tabindex=\"0\"><code><span class=\"line\"><span style=\"color: #6F42C1\">ocrmypdf<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">-l<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">deu+frk<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">--jobs<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #005CC5\">4<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">Buch-Rohscan.pdf<\/span><span style=\"color: #24292E\"> <\/span><span style=\"color: #032F62\">Buch-Fertig-OCR.pdf<\/span><\/span><\/code><\/pre><\/div>\n\n\n\n<p>Befehl im \u00dcberblick:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><code>ocrmypdf<\/code>: Das Programm.<\/li>\n\n\n\n<li><code>-l deu+frk<\/code>: <strong class=\"\">Das ist der wichtigste Teil.<\/strong> Die OCR-Engine, soll sowohl nach deutschem Text als auch nach Fraktur-Schrift suchen. Das verbessert die Erkennungsrate massiv.<\/li>\n\n\n\n<li><code>--jobs 4<\/code>: Optional, aber sehr empfohlen. Dies weist das Programm an, 4 CPU-Kerne parallel zu nutzen. Anpassen an die Anzahl der Kerne des verwendeten PCs, um den Prozess erheblich zu beschleunigen.<\/li>\n\n\n\n<li><code>Buch-Rohscan.pdf<\/code>: Die Eingabedatei.<\/li>\n\n\n\n<li><code>Buch-Fertig-OCR.pdf<\/code>: Der Name der Ausgabedatei.<\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"990\" height=\"730\" src=\"https:\/\/shijing.de\/wp-content\/uploads\/2025\/09\/image-2.png\" alt=\"\" class=\"wp-image-3754\" srcset=\"https:\/\/shijing.de\/wp-content\/uploads\/2025\/09\/image-2.png 990w, https:\/\/shijing.de\/wp-content\/uploads\/2025\/09\/image-2-300x221.png 300w, https:\/\/shijing.de\/wp-content\/uploads\/2025\/09\/image-2-768x566.png 768w\" sizes=\"auto, (max-width: 990px) 100vw, 990px\" \/><\/figure>\n\n\n\n<p>Das Ergebnis ist eine voll durchsuchbare PDF-Datei, in der sich der Text nun durchsuchen, markieren und kopieren l\u00e4sst.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong class=\"\">Die technische Optimierung: Kleiner und zukunftssicher<\/strong><\/h3>\n\n\n\n<p>Ein wesentlicher Schritt der finalen Aufbereitung war die Optimierung der PDF-Datei durch <strong>ocrmypdf<\/strong>. Dieser Prozess brachte drei entscheidende Vorteile:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong class=\"\">Effizientere Bildkompression:<\/strong> Die Bilddaten der Scans wurden neu komprimiert, was die Dateigr\u00f6\u00dfe der Bilder um <strong class=\"\">33,5 %<\/strong> reduzierte, ohne die sichtbare Qualit\u00e4t zu mindern.<\/li>\n\n\n\n<li><strong class=\"\">Massive Reduzierung der Gesamtgr\u00f6\u00dfe:<\/strong> Die finale PDF-Datei ist um \u00fcber <strong class=\"\">80 %<\/strong> kleiner als die urspr\u00fcngliche Roh-Datei. Dies verbessert die Ladezeiten und erleichtert den Umgang mit dem Dokument erheblich.<\/li>\n\n\n\n<li><strong class=\"\">Standard f\u00fcr Langzeitarchivierung (PDF\/A):<\/strong> Die Datei wurde im PDF\/A-Format gespeichert. Dieser internationale Standard garantiert, dass das Dokument auch in ferner Zukunft noch korrekt und lesbar dargestellt werden kann.<\/li>\n<\/ul>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Der Ausgangspunkt f\u00fcr die Erstellung dieser Internetseite Der Weg zu einer digitalen Version des Shijing war lang und voller Herausforderungen. Meine Mutter, Hildegard Fischer, beschreibt hier in ihren eigenen Worten den aufwendigen Prozess der Digitalisierung. Im Jahr 2005 hatte ich das \u00fcber 100 Jahre alte, handschriftliche Buch mit dem Titel \u201eSchi-King \u2013 Shijing SINICE cum [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-3725","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/shijing.de\/index.php?rest_route=\/wp\/v2\/pages\/3725","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/shijing.de\/index.php?rest_route=\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/shijing.de\/index.php?rest_route=\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/shijing.de\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/shijing.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=3725"}],"version-history":[{"count":29,"href":"https:\/\/shijing.de\/index.php?rest_route=\/wp\/v2\/pages\/3725\/revisions"}],"predecessor-version":[{"id":3774,"href":"https:\/\/shijing.de\/index.php?rest_route=\/wp\/v2\/pages\/3725\/revisions\/3774"}],"wp:attachment":[{"href":"https:\/\/shijing.de\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=3725"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}