Neues Thema starten
Beantwortet

Inhalt eines RTF-Dokuments in Spreadsheet übernehmen

Hallo, ich habe hier den Fall, daß verschiedene Artikeldaten in diversen Dateiformaten vorliegen. In einer csv-Datei gibt es eine Spalte mit z.B. dem Wert 49453. Auf einem Server liegt eine Datei 49453.rtf. Diese Datei beinhaltet die Artikelbeschreibung. Wie komme ich da ran? Ich finde keinen Step, mit dem ich das machen kann.


Übrigens, mal ein Lob an die Community: Das dauert ja kaum 5 Minuten, bis man super Antworten auf Fragen erhält, Chapeau!


Beste Antwort

Hallo Spawn,


wir haben ihr Anliegen nochmal besprochen. Da wir keine Möglichkeit haben .rtf Dateien zu verarbeiten, ist es aktuell nur möglich die Dateien mittels FTPDownload (filenameSuffix = ".rtf") Step herunterzuladen und dann mittels des File2Spreadsheet Steps in ein Spreadsheet umzuwandeln. Der File2Spreadsheet Step hat als Ergebnis ein Spreadsheet mit 2 Spalten (filename und content). In einem anschließenden SpreadsheetMapper Step könnten sie dann im einfachsten Fall mittels der Suchen & Ersetzen Funktion über den regulären Ausdruck

 

\\\w+|\{.*?\}|}|\'b7

 

 die RTF spezifischen Steurungsbefehle entfernen.blob1478509775558.png


Sie erhalten den Inhalt dann ohne Formatierung. Am Ende müssten sie dann noch die Umlaute durch weitere Suchen & Ersetzen Funktionen korrigieren, z.B: "\'fc" durch "ü".


Viele Grüße

Ihr Synesty Support


Hallo Spawn,


kurze Frage damit ich das Problem besser verstehe:


Besteht das Problem darin an die Datei 49453.rtf zu kommen oder bezieht sich die Frage darauf wie du an die Artikelbeschreibung heran kommst die in der Datei steht.


viele Grüße 

Ihr Synesty Support

Letzteres - ich weiß, ich kann die Datei per FTPSingleDownload bekommen, mir geht es darum, an die darin enthaltenen Informationen heranzukommen. Die Rich Text-Formatierung ist nicht so wichtig, es würde mir reichen, die Datei meinetwegen in Normaltext umzuwandeln und den Inhalt dann auszulesen und in ein Spreadsheet einzufügen.

 

Hallo Spawn,


Hast du es schon mit den CSVReaderStep probiert?


viele Grüße

Ihr Synesty Support

Hab ich, aber die Quelle ist ja nun mal keine csv-Datei, daher liest er da nur Unsinn ein

Okay, da kommt es natürlich drauf an was in der Datei drin steht. Lege am besten ein gesondertes Ticket an und hänge dort die Datei an, dann sieht nur unser Support-Team deine Datei.


Viele Grüße
Dein Synesty Support

So richtig fällt uns da gerade auch nichts gutes ein. Wir werden das nächste Woche mal intern besprechen. 

Den SpreadsheetCSVReader kann man manchmal dazu bewegen, indem man als Trenner irgendwas einstellt, was es in der Datei nicht gibt und bei "hasHeader=NO" einstellt. 

Aber das klappt auch nicht immer.... je nach Dateiaufbau.




Antwort

Hallo Spawn,


wir haben ihr Anliegen nochmal besprochen. Da wir keine Möglichkeit haben .rtf Dateien zu verarbeiten, ist es aktuell nur möglich die Dateien mittels FTPDownload (filenameSuffix = ".rtf") Step herunterzuladen und dann mittels des File2Spreadsheet Steps in ein Spreadsheet umzuwandeln. Der File2Spreadsheet Step hat als Ergebnis ein Spreadsheet mit 2 Spalten (filename und content). In einem anschließenden SpreadsheetMapper Step könnten sie dann im einfachsten Fall mittels der Suchen & Ersetzen Funktion über den regulären Ausdruck

 

\\\w+|\{.*?\}|}|\'b7

 

 die RTF spezifischen Steurungsbefehle entfernen.blob1478509775558.png


Sie erhalten den Inhalt dann ohne Formatierung. Am Ende müssten sie dann noch die Umlaute durch weitere Suchen & Ersetzen Funktionen korrigieren, z.B: "\'fc" durch "ü".


Viele Grüße

Ihr Synesty Support

Hallo Spawn, 


einige der RTF Befehle können sie natürlich durch die entsprechenden HTML Tags mittels weiterer Suchen & Ersetzen Funktionen vorab "übersetzen", z.B:


"\par" -> "<br>" ,  "\b" -> "<b>"  bzw.  "\b0" -> "</b>"


Viele Grüße

Ihr Synesty Support

Anmelden um einen Kommentar zu veröffentlichen