PatProd1

Die Magie der Patente-Produktion

Was tun wir eigentlich?

Vieles, Verschiedenes und dann auch dies:

Wir verwandeln lose PDFs über XMLs zu schönen, strukturierten PDFs.

Diese Magie lassen wir im Bereich der PatProd, der Patente-Produktion, spielen.

Wer sich für die detaillierte Zauber-Formel interessiert, sollte sich bei uns als Entwickler bewerben.

Wer sich für die Zauber-Wirkung interessiert, darf sich in diesen kleinen Artikel vertiefen…

Der Erfinder, nennen wir ihn Kai Zen, reicht ein Manuskript beim DPMA ein. Es enthält alle wichtigen Bestandteile, die auch eine Patentschrift enthalten muss: die Zusammenfassung mit der Hauptzeichnung, die Beschreibung, die Ansprüche und die Anhängenden Zeichnungen.

Kai Zen interessiert sich dabei weniger für Ästhetik und Design seines Manuskripts als vielmehr für die Inhalte. Das DPMA allerdings hat da andere Vorstellungen von einer schönen und rechtlich korrekten Patentschrift. Deswegen schickt es das Manuskript von Kai Zen zunächst ins Ausland. iNCO erfasst dort das Manuskript und macht es nach den Layoutrichtlinien des DPMA „schick“, sodass eine schöne, einheitliche Publikationsschrift entsteht.

Hauptzutat für diese Verwandlung ist ein XML-Dokument: Es enthält die Verweise auf das Manuskript, die die Erfindung genau beschreiben und die bibliografischen Daten, also die Daten über den Patentinhaber, den Erfinder, die Technologie, das Anmeldedatum, usw., die später auf der Titelseite erscheinen.

Anhand dieses XMLs vollzieht iNCO den ersten Zauberschritt, in Magiersprache „Erfassen“ genannt.

In diesem Schritt spielen verschiedene Aktionen eine Rolle, die Erfasser haben eine Menge zu tun: Sie rahmen bzw. markieren einzelne Bestandteile, um uns zu sagen, welche Inhalte, wo im Manuskript zu finden sind, sie begradigen und säubern die Bilder, um sie für den Druck vorzubereiten und sie erfassen die Listen aus Kai Zens Manuskript.

Dann wird die OCR ausgeführt. Sie erkennt nicht nur den Text als Text, sondern auch seine Bedeutung. So kann sie beispielsweise erkennen, wo Kai Zen in seinem Manuskript ein anderes Patent erwähnt hat oder wo er auf eine Zeichnung verweist. All das geschieht wie von Zauberhand.

Die Erfasser gehen hinterher aber noch auf Nummer sicher und kontrollieren die Zauberwirkung der OCR. Gegebenenfalls korrigieren sie mit ihren flinken Fingern ein wenig nach.

 

Dann kommt das große Finale:

Kai Zens Manuskript wird an den Workflow geschickt, der das Dokument validiert. Bei Validität schickt er die Nachricht „Ich will ein Dokument machen!“ an den sogenannten Pre-Satz.

Das ist das Startsignal für das Satzmodul! Die bibliografischen Daten und die Daten aus der Korrektur werden zu einem strukturierten Dokument verschmolzen, dem ST.36 XML. Die Bilder werden hinzugefügt und dann, knall-bumm-blitz, der Satzserver friemelt, bastelt, rechnet, tüftelt, ruckelt, rückt:

Herauskommt ein maßgeschneidertes PDF, das auf den Punkt genau die Layout-Wünsche des DPMA in Erfüllung gehen lässt.

 

Der Satzexchange meldet: Ich bin fertig!

 

Kai Zens Manuskript ist jetzt kein Buchstabensalat mehr, sondern ein hübsches PDF, das den Richtlinien für Publikationsschriften des DPMA exakt entspricht.

 

Und was tun wir dabei?

Wir betreuen die Software, die diese Magie möglich macht…

 

 

Eine kleine Zutatenliste für die PatProd-Zauberei gibt es hier:

 

Manuskript, erste Seite

 

 

 

XML, erster Teil

 

 

 

Layoutrichtlinien, Titelseite

 

 

 

PDF, Titelseite

Teilen Sie diesen Post

Share on facebook
Share on google
Share on twitter
Share on linkedin
Share on pinterest
Share on print
Share on email