Onlangs ben ik een conversie-uitdaging aangegaan waarbij 2.1 miljoen XML bestanden (relationele nawbestanden) geconverteerd/geimporteerd moesten worden naar een SQL server database in een afwijkend datamodel. Deze 2.1 miljoen XML bestanden gebruikten 4 verschillende XML formaten maar moesten wel allemaal ingelezen worden in het zelfde datamodel. Ik had de beschikking over een Windows server en SQL server 2005 om dit voor elkaar te krijgen.
Bij een dergelijke conversie loop je in ieder geval tegen de volgende uitdagingen aan:
- Windows kan niet meer dan ongeveer 64000 bestanden per map aan.
- Windows is niet gebouwd om snel met dit soort hoeveelheden bestanden om te kunnen gaan.
- Er moet XSL transformatie worden toegepast. (4 verschillende transformaties)
- De referentiele integriteit moet ‘buitenom’ bewaakt worden
- De codering van de karakterset
Ik heb dit conversietraject opgelost met behulp van SQL Server Integration Services (SSIS) en zal globaal uitleggen hoe ik dit heb gedaan. Let op! Alleen voor techneuten.
(Lees verder…)