MQSeries.net :: View topic - dfdl parser reading whole file vs records

jb3 · Posted: Mon Aug 21, 2017 7:04 am Post subject:

Hi everyone,

I have previously worked on xml schema(soap/files) but i am new to dfdl schema. I am currently working on arequirement which includes reading from a file and forming an XML for each record after some transformation.

I am currently breaking my head at: DFDL parsing is successful (in toolkit) for whole file. But when i configure fileinput node to read each record, the first record is parsed, but at the end i also get DFDL parsing errors

Text:CHARACTER:An error occurred whilst parsing with DFDL
Insert Type:INTEGER:5
Text:CHARACTER:CTDP3058E: Separator '%CR;%LF;%WSP*;' not found at offset '282' for sequence or choice within element '/schema[1]'.

The File is TAB delimited and the structure is:
Column1<tab>Column2<tab>Column...40
Data1<tab>Date2<tab>Data...40
Data1<tab>Date2<tab>Data...40
Data1<tab>Date2<tab>Data...40
Data1<tab>Date2<tab>Data...40
<emptyline>

There are optional columns in these as well.

the schema looks like below:
<?xml version="1.0" encoding="UTF-8"?>
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:dfdl="http://www.ogf.org/dfdl/dfdl-1.0/" xmlns:ibmDfdlExtn="http://www.ibm.com/dfdl/extensions" xmlns:ibmSchExtn="http://www.ibm.com/schema/extensions" xmlns:recSepFieldsFmt="http://www.ibm.com/dfdl/RecordSeparatedFieldFormat">
<xsd:import namespace="http://www.ibm.com/dfdl/RecordSeparatedFieldFormat" schemaLocation="IBMdefined/RecordSeparatedFieldFormat.xsd"/>
<xsd:annotation>
<xsd:appinfo source="http://www.ogf.org/dfdl/">
<dfdl:format encoding="{$dfdl:encoding}" escapeSchemeRef="" occursCountKind="implicit" ref="recSepFieldsFmt:RecordSeparatedFieldsFormat"/>
</xsd:appinfo>
</xsd:annotation>

<xsd:element ibmSchExtn:docRoot="true" name="TESTRecord">
<xsd:complexType>
<xsd:sequence dfdl:initiatedContent="no" dfdl:separator="%CR;%LF;%WSP*;" dfdl:separatorPosition="postfix" dfdl:separatorSuppressionPolicy="anyEmpty">
<xsd:element dfdl:emptyValueDelimiterPolicy="none" dfdl:initiator="" maxOccurs="unbounded" name="body">
<xsd:complexType>
<xsd:sequence dfdl:separator="%HT;">
<xsd:element dfdl:emptyValueDelimiterPolicy="none" dfdl:nilValueDelimiterPolicy="none" name="Data1" type="xsd:string"/>
<xsd:element dfdl:emptyValueDelimiterPolicy="none" dfdl:nilValueDelimiterPolicy="none" name="Data2" type="xsd:string"/>
<xsd:element dfdl:emptyValueDelimiterPolicy="none" dfdl:nilValueDelimiterPolicy="none" name="Data3" type="xsd:string"/>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>

</xsd:schema>

This should be straight forward, but the more I look at it, more confusing this gets.