Über Andreas Artinger

Andreas Artinger hat an der Friedrich-Alexander-Universität Erlangen-Nürnberg studiert und arbeitet bei der PRODATO Integration Technology GmbH als Managing Consultant im Analytics Team.

Optimierung von Lookups in Talend mit temporären Tabellen

Bei der Entwicklung von Data Integration Jobs mit Talend gibt es meist die Anforderung, Daten aus zwei unterschiedlichen Quellen miteinander zu verknüpfen. Eine beispielhafte Anwendung hierfür ist z.B. das Nachschlagen von Verkaufspreisen für eine (ca. 900 Einträge kurze) Liste von Büchern. Nehmen wir für diesen Beitrag an, dass uns diese Liste als CSV Datei vorliegt. Bücher haben (meist) eine ISBN, mit der sie eindeutig zu identifizieren sind. Hierdurch haben wir für unsere Aufgabe bereits einen Schlüssel, den wir zur Verknüpfung nutzen können. Weiterhin soll für unser Beispiel in einer PostgreSQL Datenbank eine Tabelle books_masterdata existieren, in der wir u.a. den [...]

Dynamisch generierte Bilder in JasperReports mit SimpleDataRenderer

Eine wichtige Anforderung bei der Erstellung von Berichten mit Jaspersoft ist die Darstellung von Datensätzen in leicht verständlicher Form. Grafische Darstellungen sind hierzu oft gut geeignet; so bietet Jaspersoft beispielsweise die automatische Generierung von (HTML5-)Charts an. Je nach Berichtsanforderung kann es aber sein, dass sich eine Text- und Grafikdarstellung vermischen sollen, z.B. in Form von unterschiedlich großen Balken pro Zeile wie in folgendem Beispielbericht über die Beliebtheit einzelner Farben beim Autokauf: Eine derartige Anforderung lässt sich nicht trivial über die Verwendung eines Charts abbilden. Ebenso ist die klassische Variante, Bilder über eine Datei in einen Bericht einzubinden, so wie es [...]

Aufbereitung von Daten für das Reporting mit Jaspersoft im Sinne der Drei-Schichten-Architektur

Die Drei-Schichten-Architektur beschreibt das Konzept, eine Software-Lösung in drei Schritte zu unterteilen: In Präsentationsschicht, Logikschicht und Datenhaltungsschicht. Die oberste Schicht ist hierbei für die Präsentation und Nutzerinteraktion gedacht. Diese kann z.B. durch einen Jasper-Report realisiert werden. Im Gegensatz dazu stellt die unterste Schicht (Datenhaltungsschicht) die Rohdaten dar, die in den Jasper-Report einfließen, z.B. Verkaufsdaten in einer Tabelle in einer Datenbank. In diesem Beitrag betrachte ich die mittlere Schicht (Logikschicht) einmal genauer. Diese Ebene beschreibt die Verarbeitung der Rohdaten (z.B. Selektion und Verrechnung), bevor diese angezeigt werden. Für diesen Schritt kann der Anwender eine Datenabfrage bei der Erstellung eines Jasper-Reports im Jaspersoft Studio [...]

Anbindung von OData Quellen in Talend über Java

Die Problemstellung: Einlesen von Daten aus einer OData-Quelle in Talend Bei der Zusammenführung unterschiedlicher Datenquellen zur weiteren Verarbeitung mittels Talend stößt man auch auf Daten, die man mithilfe eines Webservice abrufen kann. Hierzu gehören z.B. unter anderem OData-Schnittstellen. Bei OData handelt es sich um einen Standard für REST-Webschnittstellen. Zur Kommunikation mit REST-Webservices existiert in Talend z.B. die tREST Komponente. Um hier aber die Authentifizierung korrekt durchzuführen (stellen Sie sich z.B. vor, ihr Internetverkehr muss über einen Proxy laufen, der auf die Authentifizierung via NTLM Wert legt), die gewünschten Daten aus der XML-Antwort auszulesen oder Daten nur blockweise vom Webservice [...]