diff --git a/TranskribusDU/spm/spmTableTemplateSep.py b/TranskribusDU/spm/spmTableTemplateSep.py
new file mode 100644
index 0000000..0b3c8ba
--- /dev/null
+++ b/TranskribusDU/spm/spmTableTemplateSep.py
@@ -0,0 +1,1198 @@
+#!/usr/bin/python
+# -*- coding: utf-8 -*-
+"""
+
+     H. Déjean
+
+    copyright Naver Labs Europe 2018
+    READ project 
+
+    mine vertical separators for inducing a table template
+    
+"""
+from __future__ import absolute_import
+from __future__ import  print_function
+from __future__ import unicode_literals
+
+import sys, os.path
+sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(sys.argv[0]))))
+sys.path.append(os.path.dirname(os.path.abspath(sys.argv[0])))
+
+from lxml import etree
+import numpy as np
+
+import common.Component as Component
+from common.chrono import chronoOff , chronoOn
+
+from spm.structuralMining import sequenceMiner
+from spm.feature import featureObject 
+
+from ObjectModel.xmlDSDocumentClass import XMLDSDocument
+from ObjectModel.XMLDSObjectClass import XMLDSObjectClass
+from ObjectModel.XMLDSGRAHPLINEClass import XMLDSGRAPHLINEClass
+from ObjectModel.XMLDSPageClass import XMLDSPageClass
+from ObjectModel.treeTemplateClass import treeTemplateClass
+from ObjectModel.XMLDSTABLEClass import XMLDSTABLEClass
+from ObjectModel.XMLDSCELLClass import XMLDSTABLECELLClass
+from ObjectModel.XMLDSTEXTClass import XMLDSTEXTClass
+from ObjectModel.XMLDSTableColumnClass import XMLDSTABLECOLUMNClass
+
+from xml_formats.Page2DS import primaAnalysis
+
+from xml_formats.PageXml import PageXml
+from util.geoTools import polygon2points
+from util.geoTools import populateGeo
+from util.geoTools import sPoints2tuplePoints
+from shapely.ops import cascaded_union
+from shapely.geometry import Polygon
+
+from util.partitionEvaluation import evalPartitions
+from util.partitionEvaluation import jaccard
+from util.partitionEvaluation import iuo
+
+
+class tableTemplateSep(Component.Component):
+    """
+        tableTemplateSep class: a component to mine page layout to infer a table template from separator
+    """
+    
+    
+    #DEFINE the version, usage and description of this particular component
+    usage = "" 
+    version = "v.01"
+    description = "description: page vertical Zones miner "
+
+    kContentSize ='contentSize'
+    
+    #--- INIT -------------------------------------------------------------------------------------------------------------    
+    def __init__(self):
+        """
+        Always call first the Component constructor.
+        """
+        Component.Component.__init__(self, "tableTemplateSep", self.usage, self.version, self.description) 
+        
+        self.docid= None
+        
+        # tag level
+        self.sTag= XMLDSGRAPHLINEClass
+        # TH for comparing numerical features for X
+        self.THNUMERICAL = 10
+        # use for evaluation
+        self.testTH = 5  # use dfor --test  BUT ALSO IN RUN !!
+        self.THCOMP = 10
+        self.evalData= None
+        
+        self.bDomTag=True
+        
+        self.fKleenPlusTH =1.5
+
+        # pattern provided manually        
+        self.bManual = False
+        
+        
+        self.bCreateRef = False
+        self.bCreateRefCluster = False
+        self.bEvalCluster=False
+        
+        self.do2DS = False
+        
+    def setParams(self, dParams):
+        """
+        Always call first the Component setParams
+        Here, we set our internal attribute according to a possibly specified value (otherwise it stays at its default value)
+        """
+        Component.Component.setParams(self, dParams)
+        if "pattern" in dParams: 
+            self.manualPattern = eval( dParams["pattern"])
+            self.bManual=True  
+
+        if "THNUM" in dParams:
+            self.testTH =   dParams["THNUM"]
+
+        if "KLEENETH" in dParams:
+            self.fKleenPlusTH =   dParams["KLEENETH"]
+            
+        if 'tag' in dParams:
+            self.sTag = dParams['tag']       
+        
+        if 'createref' in dParams:
+            self.bCreateRef = dParams['createref']   
+                                       
+        if "createrefCluster" in dParams:         
+            self.bCreateRefCluster = dParams["createrefCluster"]
+            
+        if "evalCluster" in dParams:         
+            self.bEvalCluster = dParams["evalCluster"]            
+
+        if 'dsconv' in dParams:
+            self.do2DS = dParams['dsconv']
+            
+            
+    def minePageDimensions(self,lPages):
+        """
+            use page dimensions to build highest structure
+            
+            need iterations!
+        """
+        self.THNUMERICAL = 60  # 2 cml
+        
+        ## initialization for iter 0
+        for page in lPages:
+            page.setFeatureFunction(page.getSetOfFeaturesPageSize,self.THNUMERICAL)
+            page.computeSetofFeatures()
+            
+        seqGen = sequenceMiner()
+        seqGen.setMaxSequenceLength(1)
+        seqGen.setObjectLevel(XMLDSPageClass)
+
+        lSortedFeatures  = seqGen.featureGeneration(lPages,2)
+
+        for _,p in enumerate(lPages):
+            p.lFeatureForParsing=p.getSetofFeatures()
+        icpt=0
+        lCurList=lPages[:]
+        lTerminalTemplates=[]
+        while icpt <=0:
+            if icpt > 0: 
+                #                           N ?
+                seqGen.setMaxSequenceLength(1)
+#                 print '***'*20
+                seqGen.bDebug = False
+                for elt in lCurList:
+                    if elt.getSetofFeatures() is None:
+                        elt.resetFeatures()
+                        elt.setFeatureFunction(elt.getSetOfListedAttributes,self.THNUMERICAL,lFeatureList=['virtual'],myLevel=XMLDSPageClass)
+#                         elt.setFeatureFunction(elt.getSetOfListedAttributes,self.THNUMERICAL,lFeatureList=['virtual'],myLevel=XMLDSPageClass)
+                        elt.computeSetofFeatures()
+                        elt.lFeatureForParsing=elt.getCanonicalFeatures()
+                    else:
+                        elt.setSequenceOfFeatures(elt.lFeatureForParsing)
+                lSortedFeatures  = seqGen.featureGeneration(lCurList,1)
+            lmaxSequence = seqGen.generateItemsets(lCurList)
+            seqGen.bDebug = False
+            
+            # mis very small since: space is small; some specific pages can be 
+            ## replace by PrefiwScan
+            lSeq, _ = seqGen.generateMSPSData(lmaxSequence,lSortedFeatures + lTerminalTemplates,mis = 0.002)
+            lPatterns = seqGen.miningSequencePrefixScan(lSeq,minSupport=0.01,maxPatternLength=3)
+#             lPatterns = seqGen.beginMiningSequences(lSeq,lSortedFeatures,lMIS)
+            if lPatterns is None:
+                return [lPages]
+            
+            # ignore unigram:  covered by previous steps 
+            if icpt < 3:
+                lPatterns  = list(filter(lambda p_s:len(p_s[0][0])>1,lPatterns))
+            lPatterns.sort(key=lambda x_y:x_y[1], reverse=True)
+
+            seqGen.bDebug = False
+            seqGen.THRULES = 0.8
+            lSeqRules = seqGen.generateSequentialRules(lPatterns)
+            _,dCP = self.getPatternGraph(lSeqRules)
+            
+            dTemplatesCnd = self.pattern2PageTemplate(lPatterns,dCP,icpt)
+            
+            #no new template: stop here
+            if dTemplatesCnd == {}:
+                icpt=9e9
+                break
+            _,lTerminalTemplates,_ = seqGen.testTreeKleeneageTemplates(dTemplatesCnd, lCurList)
+        
+#             print tranprob
+#             self.pageSelectFinalTemplates(lTerminalTemplates,tranprob,lCurList)
+            ## store parsed sequences in mytemplate 
+            for templateType in dTemplatesCnd.keys():
+                for _,_, mytemplate in dTemplatesCnd[templateType]:
+#                     _,lCurList = self.parseWithTemplate(mytemplate,lCurList,bReplace=True)
+                    _,_,lCurList = seqGen.parseWithTreeTemplate(mytemplate, lCurList, bReplace=True)    
+                    for elt in lCurList:
+                        if elt.getSetofFeatures() is None:
+                            elt.resetFeatures()
+                            elt.setFeatureFunction(elt.getSetOfListedAttributes,self.THNUMERICAL,lFeatureList=['virtual'],myLevel=XMLDSPageClass)
+                            elt.computeSetofFeatures()
+                            elt.lFeatureForParsing=elt.getSetofFeatures()
+            
+            icpt +=1
+#             if self.bDebug:self.printTreeView(lCurList)
+        lList = self.getFlatStructure(lCurList)
+        del seqGen        
+        # return also the tree ; also organize elements per level/pattern
+        return lList 
+            
+    def getFlatStructure(self,lElts,level=1):
+        
+        lRes=[]
+        for elt in lElts:
+            if elt.getAttribute('virtual'):
+                lRes.append(self.getFlatStructure(elt.getObjects(),level+1))
+            else:
+                lRes.append([elt])
+        try:
+            if len(lRes) == len([ x for y in lRes for x in y]):
+                lRes= [ x for y in lRes for x in y]
+        except TypeError:pass
+                 
+        return lRes
+  
+    
+    def minePageVerticalFeature(self,lPages,lFeatureList,level=XMLDSGRAPHLINEClass):
+        """
+            get page features for  vertical zones: find vertical regular vertical Blocks/text structure
+            
+        """ 
+        chronoOn()
+        
+        for i,page, in enumerate(lPages):
+            page.origFeat = []
+            # GRAPHICAL LINES 
+            gl = []
+            for graphline in page.getAllNamedObjects(level):
+                graphline.resetFeatures()
+                graphline._canonicalFeatures = None
+                # vertical 
+#                 if graphline.getHeight() > graphline.getWidth() and graphline.getHeight() > 30:
+                if graphline.getHeight() > 200.00:
+
+                    gl.append(graphline)
+                    # create a feature
+                    f = featureObject()
+                    f.setType(featureObject.NUMERICAL)
+                    f.setTH(self.THNUMERICAL)
+#                     f.setTH(5)
+                    f.setWeight(graphline.getHeight())
+                    f.setName("v")
+                    f.setObjectName(graphline)
+                    f.addNode(graphline)
+                    X = [float(x) for x in graphline.getAttribute('points').split(',')[0::2]]
+                    Y = [float(y) for y in graphline.getAttribute('points').split(',')[1::2]]
+                    a, b = np.polynomial.polynomial.polyfit(Y,X,1)
+#                     x2 = a + b * page.getHeight()
+                    ## project to Y=0
+                    f.setValue(round(a))
+#                     f.setValue(round(graphline.getX()))
+                    graphline.addFeature(f)
+                    page.setVGLFeatures(f)
+                
+# #                 horizontal
+                elif graphline.getWidth() > 10000 and graphline.getY() > 10 and  graphline.getY2() < page.getHeight() - 10  :  
+                    gl.append(graphline)
+                    # create a feature
+                    f = featureObject()
+                    f.setType(featureObject.NUMERICAL)
+                    f.setTH(self.THNUMERICAL)
+#                     f.setTH(5)
+                    f.setWeight(graphline.getWidth())
+                    f.setName("h")
+                    f.setObjectName(graphline)
+                    f.addNode(graphline)
+                    # project to X = 0
+                    f.setValue(round(graphline.getY()))
+                    graphline.addFeature(f)
+                    page.setVGLFeatures(f)                    
+#                     
+#             ## select regular x                                 
+#             seqGen = sequenceMiner()
+# #             seqGen.bDebug  =self.bDebug
+#             _fullFeatures =   seqGen.featureGeneration(gl,1)
+#             for fx in _fullFeatures:
+#                 fx.setWeight(sum(x.getHeight() for x in fx.getNodes())/64000)
+#                 # for article
+#                 fx.setWeight(len(fx.getNodes()))
+#             del seqGen
+        self.buildVZones(lPages)
+        
+        print ('chronoFeature',chronoOff())
+        
+        return lPages
+            
+        
+    
+    def buildVZones(self,lp):
+        """
+            store vertical positions in each page
+        """
+        
+        for _, p in enumerate(lp):
+            p.lf_XCut=[]
+            p.getVGLFeatures().sort(key=lambda x:x.getWeight(),reverse=True)
+            for fi in p.getVGLFeatures():
+                if  fi not in p.lf_XCut:
+#                     l = sum(x.getWidth()*x.getHeight() for x in fi.getNodes())
+#                     l = sum(x.getHeight() for x in fi.getNodes())
+#                     fi.setWeight(l)
+                    p.lf_XCut.append(fi)
+#                 else:
+#                     print  'skip!',p, fi, fi.getWeight()            
+            
+#             p.lf_XCut.sort(key=lambda x:x.getWeight(),reverse=True)
+#             p.lf_XCut = p.lf_XCut   #[:15]
+            p.lf_XCut.sort(key=lambda x:x.getValue())
+            
+#             if self.bDebug : 
+#             print (p,p.lf_XCut)          
+        
+
+    def highLevelSegmentation(self,lPages):
+        """
+            use: image size and content (empty pages)
+        """
+        
+        lSubList= self.minePageDimensions(lPages)
+
+        return lSubList
+     
+    def pattern2PageTemplate(self,lPatterns,dCA,step):
+        """
+            select patterns and convert them into appropriate templates.
+            
+            Need to specify the template for terminals; or simply the registration function ?
+        """
+        dTemplatesTypes = {}
+        for pattern,support in filter(lambda x_y:x_y[1]>1,lPatterns):
+            try:
+                dCA[str(pattern)]
+                bSkip = True
+#                 print 'skip:',pattern
+            except KeyError:bSkip=False
+            # first iter: keep only length=1
+            # test type of  patterns
+            bSkip = bSkip or (step > 0 and len(pattern) == 1)
+            bSkip = bSkip or (len(pattern) == 2 and pattern[0] == pattern[1])  
+#             print pattern, bSkip          
+            if not bSkip: 
+                ## test is pattern is mirrored         
+                template  = treeTemplateClass()
+                template.setPattern(pattern)
+                template.buildTreeFromPattern(pattern)
+                template.setType('lineTemplate')
+                try:dTemplatesTypes[template.__class__.__name__].append((pattern, support, template))
+                except KeyError: dTemplatesTypes[template.__class__.__name__] = [(pattern,support,template)]                      
+        
+        return dTemplatesTypes
+                
+    def getPatternGraph(self,lRules):
+        """
+            create an graph which linsk exoannded patterns
+            (a) -> (ab)
+            (abc) -> (abcd)
+           
+           rule = (newPattern,item,i,pattern, fConfidence)
+                   RULE: [['x=19.0', 'x=48.0', 'x=345.0'], ['x=19.0', 'x=126.0', 'x=345.0']] => 'x=464.0'[0] (22.0/19.0 = 0.863636363636)
+
+
+            can be used for  tagging go up until no parent
+            
+            for balanced bigram:  extension only: odd bigrams are filtered out
+        """
+        dParentChild= {}
+        dChildParent= {}
+        for lhs, _, _, fullpattern, _ in lRules:
+            try:dParentChild[str(fullpattern)].append(lhs)
+            except KeyError:dParentChild[str(fullpattern)] = [lhs]
+            try:dChildParent[str(lhs)].append(fullpattern)
+            except KeyError:dChildParent[str(lhs)] = [fullpattern]                
+
+        # for bigram: extend to grammy
+        for child in dChildParent.keys():
+            ltmp=[]
+            if len(eval(child)) == 2:
+                for parent in dChildParent[child]:
+                    try:
+                        ltmp.extend(dChildParent[str(parent)])
+                    except KeyError:pass
+            dChildParent[child].extend(ltmp)
+        return dParentChild,  dChildParent
+        
+            
+    def iterativeProcessVSegmentation(self, lLPages):
+        """
+            process lPages by batch
+            
+            
+            for a page: generate a template with the previous, the next   (mirrored: n-2, p-2)    n-N, p-N
+            Several templates per pages: sequence mining!
+                needed: a good way to compute template against page (as usual)!
+        """
+        
+        for lPages in lLPages:
+#             print (lPages)
+#             self.THNUMERICAL = 20 #ABP 
+            self.THNUMERICAL = 5 #NAF
+            self.minePageVerticalFeature(lPages,None,level=self.sTag)
+            for p  in lPages:
+                p.resetVerticalTemplate()
+                p._lBasicFeatures=p.lf_XCut[:]
+
+#             self.dtwMatching(lPages)
+            self.separatorBaseline(lPages)
+           
+        
+        
+    def separatorBaseline(self,lPages):
+        """
+            consider vertical separators as col 
+        """
+        tableTemplate=treeTemplateClass()
+        for p in lPages:
+            p.addVerticalTemplate(tableTemplate)
+            p.addVSeparator(tableTemplate,p.lf_XCut)
+        
+        self.tagAsRegion(lPages)    
+        
+    def dtwMatching(self,lPages):
+        """
+            create vertical zones and match them
+            
+            When possible: compute with prev page and next page and take the best alignment
+            
+            
+            test if too many elements with distance=0!!!
+        """            
+        from util.partitionEvaluation import  matchingPairs
+        
+        
+        def distX(c1,c2): 
+            o  = min(c1.getX2() , c2.getX2()) - max(c1.getX() , c2.getX())
+            if o <= 0:
+                return 1
+            return 1 -  ((min(c1.getX2() , c2.getX2()) - max(c1.getX() , c2.getX())) / max(c1.getWidth() , c2.getWidth()))
+        
+        def distW(c1,c2):
+            return abs(c1.getWidth() - c2.getWidth()) / max(c1.getWidth() , c2.getWidth())
+        
+        
+        tableTemplate=treeTemplateClass()
+        INC=0
+        for i,p in enumerate(lPages):
+            if i == len(lPages)-1:
+                INC=-2
+            # elif i == -1  : take prevoous
+            l1 =[]
+            for a,f in enumerate(p.lf_XCut):
+                o = XMLDSObjectClass()
+                o.setX(f.getValue())
+                if a == len(p.lf_XCut) -1:
+                    o.setName("%s_right"%(f.getValue()))
+                    o.setWidth(p.getWidth() - o.getX())
+                else:
+                    o.setName("%s_%s"%(f.getValue(),p.lf_XCut[a+1].getValue()))
+                    o.setWidth(p.lf_XCut[a+1].getValue() -o.getX())
+                o.setContent(str(o.getWidth()))
+                o.o = f
+                l1.append(o)
+            l2 =[]
+#             print (i+1+INC)
+            for a,f in enumerate(lPages[i+1+INC].lf_XCut):
+                o= XMLDSObjectClass()
+                o.setX(f.getValue())
+                if a == len(lPages[i+1+INC].lf_XCut) -1:
+                    o.setName("%s_right"%(f.getValue()))
+                    o.setWidth(lPages[i+1+INC].getWidth() -o.getX())
+                else:
+                    o.setName("%s_%s"%(f.getValue(),lPages[i+1+INC].lf_XCut[a+1].getValue()))
+                    o.setWidth(lPages[i+1+INC].lf_XCut[a+1].getValue() -o.getX())
+                o.setContent(str(o.getWidth()))
+                l2.append(o)        
+#             print (p,list(map(lambda x:(x.getValue(),x.getWeight()),p.lf_XCut)))
+            #create vzones
+#             lmatches = matchingPairs(l1,l2,distW)
+            lmatches = matchingPairs(l1,l2,distX)
+            lcuts=[]
+            for lc1,lc2 in lmatches:
+                #[(573.0_596.0[None] 23.0, 0.17557251908396942), (596.0_703.0[None] 107.0, 0.8091603053435115)]
+#                 print(p,lc1,lc2) 
+                lc1.sort(key=lambda x:x[-1], reverse=True)
+                bestcut = lc1[0]
+                lcuts.append(bestcut[0].o)
+#             print (p,lcuts)
+            p.addVerticalTemplate(tableTemplate)
+            p.addVSeparator(tableTemplate,lcuts)
+        
+        self.tagAsRegion(lPages)    
+            
+        
+    
+    def tagAsRegion(self,lPages):
+        """
+            create regions
+            
+            if bIgnoreRegions: delte previous regions
+                and assign new regions to textlines
+            
+            if border page regions are missing :add them?
+                or don't put them for tagging
+                
+                
+                
+            for a page: collect all 'featured' elements of the template and create a BB  -> zone of the elements  
+            
+        """
+        lAllRegions = []
+        lElementsForBB=[]
+        for page in lPages:
+            lRegions=[]
+            lAllRegions.append(lRegions)
+            if page.getNode() is not None:
+                for template in page.getVerticalTemplates():
+                    prevcut = 1
+                    lCuts=[prevcut]
+                    lRegions=[]
+                    lElementsForBB=[]
+                    lastcutpoints =""
+                    for cut in page.getdVSeparator(template):
+                        if cut.getName()=='v':
+#                             print(page,cut,cut.getNodes())
+                            newReg= XMLDSTABLECOLUMNClass()
+#                             newReg.setName('COL')
+                            domNode  = etree.Element('COL')
+                            domNode.set("x",str(prevcut))
+                            ## it is better to avoid
+                            YMinus= 1
+                            domNode.set("y",str(YMinus))
+                            domNode.set("height",str(page.getHeight()-2 * YMinus))
+                            domNode.set("width", str(cut.getValue() - prevcut))
+                            lCuts.append(cut.getValue() )
+                            newReg.setNode(domNode)
+                            page.addObject(newReg)
+                            page.getNode().append(domNode)
+#                             print (cut.getNodes())
+                            # need to take tje feature for the page itself not 'generic features'
+                            niceNode = next(iter(cut.getNodes())) #iter(s).next()
+                            pageNodes = list(filter(lambda x:x.getPage() == page, cut.getNodes()))
+                            pageNodes.sort(key=lambda x:x.getHeight(),reverse=True)
+                            niceNode = pageNodes[0]
+                            lElementsForBB.extend(pageNodes)
+#                             domNode.set('points',niceNode.getAttribute('points'))
+                            X = [float(x) for x in niceNode.getAttribute('points').split(',')[0::2]]
+                            Y = [float(y) for y in niceNode.getAttribute('points').split(',')[1::2]]
+                            a, b = np.polynomial.polynomial.polyfit(Y,X,1)
+                            x2 = a + b * page.getHeight()
+#                             print(niceNode.getAttribute('points').split(','),X,Y,a,b)
+#                             domNode.set('points',"%s,%s," %(a,0) +niceNode.getAttribute('points') + ",%s,%s"%(x2,page.getHeight()))
+                            domNode.set('points',"%s,%s" %(a,0) +",%s,%s"%(x2,page.getHeight()))
+
+                            if lastcutpoints != "":
+#                                 newReg.addAttribute('points', "%s,%s," %(a,0) +niceNode.getAttribute('points') + ",%s,%s,"%(x2,page.getHeight())+lastcutpoints)
+                                newReg.addAttribute('points', "%s,%s" %(a,0) + ",%s,%s,"%(x2,page.getHeight())+lastcutpoints)
+
+                                newReg.setDimensions(prevcut,YMinus, page.getHeight()-2 * YMinus,cut.getValue() - prevcut)
+                                if newReg.toPolygon().is_valid:
+                                    lRegions.append(newReg)
+#                                     print (newReg.getAttribute("points"))
+                            lastcutpoints = "%s,%s,"%(x2,page.getHeight()) + "%s,%s" %(a,0) # +niceNode.getAttribute('points') + 
+
+                            prevcut  = cut.getValue()
+                        elif cut.getName()=='h':
+#                             print(page,cut,cut.getNodes())
+                            newReg= XMLDSObjectClass()
+                            domNode  = etree.Element('ROW')
+                            XMinus= 1
+                            domNode.set("x",str(XMinus))
+                            ## it is better to avoid
+                            domNode.set("y",str(prevcut))
+                            domNode.set("width",str(page.getWidth()-2 * XMinus))
+                            domNode.set("height", str(cut.getValue() - prevcut))
+                            lCuts.append(cut.getValue() )
+                            newReg.setNode(domNode)
+                            page.getNode().append(domNode)
+                            niceNode = next(iter(cut.getNodes())) #iter(s).next()
+                            pageNodes = list(filter(lambda x:x.getPage() == page, cut.getNodes()))
+                            pageNodes.sort(key=lambda x:x.getHeight(),reverse=True)                            
+                            lElementsForBB.extend(pageNodes)
+
+#                             domNode.set('points',niceNode.getAttribute('points'))
+                            X = [float(x) for x in niceNode.getAttribute('points').split(',')[0::2]]
+                            Y = [float(y) for y in niceNode.getAttribute('points').split(',')[1::2]]
+                            a, b = np.polynomial.polynomial.polyfit(X,Y,1)
+                            y2 = a + b * page.getWidth()
+#                             print(niceNode.getAttribute('points').split(','),X,Y,a,b)
+                            domNode.set('points',"%s,%s," %(0,a) +niceNode.getAttribute('points') + ",%s,%s"%(page.getWidth(),y2))
+                            newReg.addAttribute('points', "%s,%s," %(0,a) +niceNode.getAttribute('points') + ",%s,%s"%(page.getWidth(),y2))
+#                             domNode.set('points',cut.getObjectName().getAttribute('points'))
+                            newReg.setDimensions(XMinus,prevcut,cut.getValue() - prevcut, page.getWidth()-2 * XMinus)
+    #                         print newReg.getX(),newReg.getY(),newReg.getHeight(),newReg.getWidth(),cut.getValue() - prevcut
+                            lRegions.append(newReg)
+                            prevcut  = cut.getValue()                            
+                
+                if lElementsForBB:
+                    x1,y1,x2,y2 = cascaded_union([ x.toPolygon() for x in lElementsForBB]).bounds
+                    tableX = XMLDSTABLEClass()
+                    domNode  = etree.Element('COLUMN')
+                    tableX.setNode(domNode)
+                    domNode.set("x",str(x1))
+                    domNode.set("y",str(y1))
+                    domNode.set("width",str(x2-x1))
+                    domNode.set("height", str(y2-y1))
+                    page.getNode().append(domNode)
+
+                if lRegions != []:
+#                     print(list([ (x,x.is_valid) for x in  [e.toPolygon() for e in page.getAllNamedObjects(XMLDSTEXTClass) if e.getAttribute('id')=='p1_line_1507005136612_1983']]))
+#                     lvalidGeom = list(filter(lambda x:x.is_valid and x.area >0, [e.toPolygon() for e in page.getAllNamedObjects(XMLDSTEXTClass) if e.getAttribute('id')=='p1_line_1507005136612_1983']))
+                    lvalidGeom = list(filter(lambda x:x.is_valid and x.area >0, [e.toPolygon() for e in page.getAllNamedObjects(XMLDSTEXTClass)]))
+                    lEltValid = list(filter(lambda x:x.toPolygon().is_valid and x.toPolygon().area >0 , page.getAllNamedObjects(XMLDSTEXTClass)))
+#                     print ("====",len(lvalidGeom),len(lEltValid),len( page.getAllNamedObjects(XMLDSTEXTClass)),len([r.toPolygon() for r in lRegions]))
+                    dPositions = populateGeo(list([r.toPolygon() for r in lRegions]),lvalidGeom)
+                    for z in dPositions:
+#                         print (z, [page.getAllNamedObjects(XMLDSTEXTClass)[i] for i in dPositions[z]])
+                        lRegions[z].setObjectsList([lEltValid[i] for i in dPositions[z]])
+                        for e in  lRegions[z].getObjects():
+#                             print (e.getAttribute('id'),e.getX(),e.getX2(),lRegions[z].getX(),lRegions[z].toPolygon())
+                            e.setParent(lRegions[z])
+                            lRegions[z].getNode().append(e.getNode())
+#                             if z ==0: print (lRegions[z].getAttribute("points"),e, e.toPolygon().intersection(lRegions[z].toPolygon()))
+#                         lRegions[z].tagMe()
+        return lAllRegions
+    
+    
+                
+                
+    def generateTableTemplate(self,lT1):
+        """
+            create a table object:
+            table zone: page
+            columns: the created vertical zones
+        """
+        
+        from util.unitConversion import convertDot2Pixel
+         
+        for template in lT1: 
+            ### create a table: assumption: the full page
+            page= self.lPages[0]
+            dpi=300
+#             pageXmlDoc,pageNode = PageXml.createPageXmlDocument(creatorName='NLE', filename = "%s_%s"% (self.getInputFileName(),'tt.pxml'), imgW = int(page.getWidth()), imgH = int(page.getHeight()))
+            pageXmlDoc,pageNode = PageXml.createPageXmlDocument(creatorName='NLE', filename = "%s_%s"% (os.path.basename(self.getInputFileName()),'tt.pxml'), imgW = convertDot2Pixel(dpi,page.getWidth()), imgH = convertDot2Pixel(dpi,page.getHeight()))
+
+            tableNode= PageXml.createPageXmlNode('TableRegion')            
+            pageNode.append(tableNode)
+            tableNode.set('id','TableRegion_1')
+#             tableNode.set('x','0')
+#             tableNode.set('y','0')
+#             tableNode.set('height',str(page.getHeight()))
+#             tableNode.set('width',str(page.getWidth()))
+            coords = PageXml.createPageXmlNode('Coords')    
+            tableNode.append(coords)
+            hcuts= list(filter(lambda x:x.getName()=='h',template.getPattern()))[0:-1]
+            vcuts= list(filter(lambda x:x.getName()=='v',template.getPattern()))
+            print (hcuts,vcuts)
+            # #hcuts[0].getValue()\
+            #hcuts[-1].getValue()))
+            if vcuts == []: return
+            a,z,e,r,t,y,u,i = map(lambda x:convertDot2Pixel(dpi,x),(vcuts[0].getValue(), 0  
+                                                                    ,vcuts[-1].getValue(),0 
+                                                                    ,vcuts[-1].getValue(),page.getHeight()
+                                                                    ,vcuts[0].getValue(),page.getHeight()-20))  
+            coords.set('points','%d,%d %d,%d %d,%d %d,%d'%(a,z,e,r,t,y,u,i))
+            print (template,template.getPattern())
+#             print (hcuts,vcuts)
+            
+            prevrcut= 20
+#             prevrcut=hcuts[0].getValue()
+#             for i,rcut in enumerate([hcuts[0],hcuts[-1]])
+            for i,rcut in enumerate([page.getHeight()-20]):
+                prevccut= vcuts[0].getValue()
+                for j,ccut in enumerate(vcuts[1:]):
+#                     print (i,ccut,j,rcut)
+                    cellNode  =  PageXml.createPageXmlNode('TableCell')
+                    
+                    cellNode.set("id","TableCell%d%d"%(i,j))
+                    cellNode.set("row",str(i))
+                    cellNode.set("col",str(j))
+
+                    cellNode.set("colSpan","1")
+                    cellNode.set("rowSpan","1")
+                    
+                    
+                    for border in ["leftBorderVisible","rightBorderVisible","topBorderVisible","bottomBorderVisible"]:
+                        cellNode.set(border,"true")
+                    for border in ["topBorderVisible","bottomBorderVisible"]:
+                        cellNode.set(border,"false")
+                           
+                    coords = PageXml.createPageXmlNode('Coords')       
+                    cellNode.append(coords)  
+                    ###    KEY!!!! point order is very important
+                    a,z,e,r,t,y,u,o = map(lambda x:convertDot2Pixel(dpi,x),(prevccut,prevrcut, ccut.getValue(),prevrcut ,ccut.getValue(),rcut,prevccut,rcut))
+#                     a,z,e,r,t,y,u,o = map(lambda x:convertDot2Pixel(dpi,x),(prevccut,prevrcut, ccut.getValue(),prevrcut ,ccut.getValue(),rcut.getValue(),prevccut,rcut.getValue()))
+                    coords.set('points', '%d,%d %d,%d %d,%d %d,%d'%( a,z,u,o,t,y,e,r))
+#                     print ('\t',prevccut,prevrcut, ccut.getValue(),prevrcut ,ccut.getValue(),rcut.getValue(),prevccut,rcut.getValue())
+                     
+                    corners = PageXml.createPageXmlNode('CornerPts')
+                    corners.text = '0 1 2 3'
+                    
+                    cellNode.append(corners)   
+                    tableNode.append(cellNode)
+                    prevccut  = ccut.getValue() 
+#                 prevrcut  = rcut.getValue()     
+
+
+#             print(etree.tostring(pageXmlDoc, pretty_print=True))
+            pageXmlDoc.write("tt0.xml")        
+    
+
+
+    def testGeometry(self, th, srefData, srunData, bVisual=False):
+        """
+            compare geometrical zones (dtw + iou)
+            :param
+            
+            returns tuple (cntOk, cntErr, cntMissed,ltisRefsRunbErrbMiss
+            
+        """
+
+        cntOk = cntErr = cntMissed = 0
+        ltisRefsRunbErrbMiss = list()
+        RefData = etree.XML(srefData.strip("\n").encode('utf-8'))
+        RunData = etree.XML(srunData.strip("\n").encode('utf-8'))
+        
+        lPages = RefData.xpath('//%s' % ('PAGE[@number]'))
+        
+        for ip,page in enumerate(lPages):
+            lY=[]
+            key=page.get('pagekey') 
+            xpath = ".//%s" % ("COL")
+            lcols = page.xpath(xpath)
+            if len(lcols) > 0:
+                for col in lcols:
+                    xpath = ".//@points"
+                    lpoints  = col.xpath(xpath) 
+                    colgeo = cascaded_union([ Polygon(sPoints2tuplePoints(p)) for p in lpoints])
+                    if lpoints != []:
+                        lY.append(colgeo)
+        
+            if RunData is not None:
+                lpages = RunData.xpath('//%s' % ('PAGE[@pagekey="%s"]' % key))
+                lX=[]
+                if lpages != []:
+                    for page in lpages[0]:
+                        xpath = ".//%s" % ("COL")
+                        lcols = page.xpath(xpath)
+                        if len(lcols) > 0:
+                            for col in lcols:
+                                xpath = ".//@points"
+                                lpoints =  col.xpath(xpath)
+                                if lpoints != []:
+                                    lX.append(  Polygon(sPoints2tuplePoints(lpoints[0])))
+                    lX = list(filter(lambda x:x.is_valid,lX))
+                    ok , err , missed,lfound,lerr,lmissed = evalPartitions(lX, lY, th,iuo)
+                    cntOk += ok 
+                    cntErr += err
+                    cntMissed +=missed
+                    [ltisRefsRunbErrbMiss.append((ip, y1.bounds, x1.bounds,False, False)) for (x1,y1) in lfound]
+                    [ltisRefsRunbErrbMiss.append((ip, y1.bounds, None,False, True)) for y1 in lmissed]
+                    [ltisRefsRunbErrbMiss.append((ip, None, x1.bounds,True, False)) for x1 in lerr]
+
+#                     ltisRefsRunbErrbMiss.append(( lfound, ip, ok,err, missed))
+#                     print (key, cntOk , cntErr , cntMissed)
+        return (cntOk , cntErr , cntMissed,ltisRefsRunbErrbMiss)         
+    
+    
+    def testCluster(self, th, srefData, srunData, bVisual=False):
+        """
+        <DOCUMENT>
+          <PAGE number="1" imageFilename="g" width="1457.52" height="1085.04">
+            <TABLE x="120.72" y="90.72" width="1240.08" height="923.28">
+              <COL>
+                <TEXT id="line_1502076498510_2209"/>
+                <TEXT id="line_1502076500291_2210"/>
+                <TEXT id="line_1502076502635_2211"/>
+                <TEXT id="line_1502076505260_2212"/>
+        
+            
+            
+            NEED to work at page level !!??
+            then average?
+        """
+        cntOk = cntErr= cntMissed = 0
+        RefData = etree.XML(srefData.strip("\n").encode('utf-8'))
+        RunData = etree.XML(srunData.strip("\n").encode('utf-8'))
+
+        lPages = RefData.xpath('//%s' % ('PAGE[@number]'))
+        for page in lPages:
+            lY=[]
+            key=page.get('pagekey') 
+            xpath = ".//%s" % ("COL")
+            lcols = page.xpath(xpath)
+            if len(lcols) > 0:
+                for col in lcols:
+#                     if col.get('width') and int(row.get('width'))>100:
+                        xpath = ".//@id"
+                        lid  = col.xpath(xpath) 
+                        if lid != []:
+                            lY.append(lid)
+        
+            if RunData is not None:
+                lpages = RunData.xpath('//%s' % ('PAGE[@pagekey="%s"]' % key))
+                lX=[]
+                if lpages != []:
+                    for page in lpages:
+                        xpath = ".//%s" % ("COL")
+                        lcols = page.xpath(xpath)
+                        if len(lcols) > 0:
+                            for col in lcols:
+#                                 if row.get('width') and int(row.get('width'))>100:
+                                    xpath = ".//@id"
+                                    lid =  col.xpath(xpath)
+                                    if lid != []:
+                                        lX.append( lid)
+    #                 assert len(lX) > 0
+    #                 assert len(lY) > 0
+#                     print(key,len(lY),len(lX))
+                    ok , err , missed,lf,lerr,lmiss = evalPartitions(lX, lY, th,jaccard)
+                    cntOk += ok 
+                    cntErr += err
+                    cntMissed +=missed
+#                     print (key, cntOk , cntErr , cntMissed)
+        ltisRefsRunbErrbMiss= list()
+        return (cntOk , cntErr , cntMissed,ltisRefsRunbErrbMiss)  
+            
+    
+    def testCompare(self, srefData, srunData, bVisual=False):
+        """
+        as in Shahad et al, DAS 2010
+
+        Correct Detections 
+        Partial Detections 
+        Over-Segmented 
+        Under-Segmented 
+        Missed        
+        False Positive
+                
+        """
+        dicTestByTask = dict()
+        if self.bEvalCluster:
+#             dicTestByTask['CLUSTER']= self.testCluster(srefData,srunData,bVisual)
+            dicTestByTask['CLUSTER100']= self.testCluster(1.0,srefData,srunData,bVisual)
+            dicTestByTask['CLUSTER90']= self.testCluster(0.9,srefData,srunData,bVisual)
+            dicTestByTask['CLUSTER80']= self.testCluster(0.8,srefData,srunData,bVisual)
+#             dicTestByTask['CLUSTER50']= self.testCluster(0.5,srefData,srunData,bVisual)
+
+        else:
+            dicTestByTask['T80']= self.testGeometry(0.50,srefData,srunData,bVisual)
+#             dicTestByTask['T100']= self.testGeometry(1.0,srefData,srunData,bVisual)
+
+    #         dicTestByTask['FirstName']= self.testFirstNameRecord(srefData, srunData,bVisual)
+#         dicTestByTask['Year']= self.testYear(srefData, srunData,bVisual)
+    
+        return dicTestByTask    
+        
+    
+    def createRefGeo(self,doc):
+        """
+            create a REF file
+            :params doc: xmldoc
+            
+            returns a doc xml (ref format)
+        """
+        ODoc = XMLDSDocument()
+        ODoc.loadFromDom(doc,listPages = range(self.firstPage,self.lastPage+1))        
+  
+        root=etree.Element("DOCUMENT")
+        refdoc=etree.ElementTree(root)
+        
+
+        for page in ODoc.getPages():
+#             print(page)
+            #imageFilename="..\col\30275\S_Freyung_021_0001.jpg" width="977.52" height="780.0">
+            pageNode = etree.Element('PAGE')
+            pageNode.set("number",page.getAttribute('number'))
+            pageNode.set("pagekey",os.path.basename(page.getAttribute('imageFilename')))
+            pageNode.set("width",str(page.getAttribute('width')))
+            pageNode.set("height",str(page.getAttribute('height')))
+
+            root.append(pageNode)   
+            lTables = page.getAllNamedObjects(XMLDSTABLEClass)
+            for table in lTables:
+                tableNode = etree.Element('TABLE')
+                tableNode.set("x",table.getAttribute('x'))
+                tableNode.set("y",table.getAttribute('y'))
+                tableNode.set("width",str(table.getAttribute('width')))
+                tableNode.set("height",str(table.getAttribute('height')))
+                tableNode.set("points",table.getAttribute('points'))
+                pageNode.append(tableNode)
+
+                # iterate over rows
+                for index,row in enumerate(table.getColumns()):
+#                     print (index, list([c for c in row.getCells()]))
+#                     rowpolygon = cascaded_union([c.toPolygon() for c in row.getCells()])
+#                     if type(rowpolygon) == shapely.geometry.multipolygon.MultiPolygon:
+#                         print ([list(p.exterior.coords) for p in rowpolygon.geoms])
+#                     x1,y1,x2,y2 = rowpolygon.bounds
+                    rowNode= etree.Element("COL")
+                    tableNode.append(rowNode)
+#                     rowNode.set('y',str(y1))
+#                     rowNode.set('height',str(y2 - y1))
+#                     rowNode.set('x',str(x1))
+#                     rowNode.set('width',str(x2 - x1))
+                    rowNode.set('id',str(index))
+#                     rowNode.set('points',str(rowpolygon.exterior.coords))
+                    for cell in row.getCells():
+                        cNode =  etree.Element("CELL")
+                        rowNode.append(cNode)
+                        cNode.set('points',polygon2points(cell.toPolygon()))
+                        
+#         print (etree.tostring(refdoc,pretty_print = True))       
+        return refdoc
+        
+    def createRunGeo(self,doc):
+        """
+            create a RUN file
+            :params doc: xmldoc
+            
+            returns a doc xml (ref format)
+        """
+        self.ODoc = doc #XMLDSDocument()
+#         self.ODoc.loadFromDom(doc,listPages = range(self.firstPage,self.lastPage+1))        
+  
+  
+        root=etree.Element("DOCUMENT")
+        refdoc=etree.ElementTree(root)
+        
+
+        for page in self.ODoc.getPages():
+            pageNode = etree.Element('PAGE')
+            pageNode.set("number",page.getAttribute('number'))
+            pageNode.set("pagekey",os.path.basename(page.getAttribute('imageFilename')))
+            pageNode.set("width",str(page.getAttribute('width')))
+            pageNode.set("height",str(page.getAttribute('height')))
+
+            root.append(pageNode)   
+            tableNode = etree.Element('TABLE')
+            tableNode.set("x","0")
+            tableNode.set("y","0")
+            tableNode.set("width","0")
+            tableNode.set("height","0")
+            pageNode.append(tableNode)
+                
+            lCols  = page.getAllNamedObjects(XMLDSTABLECOLUMNClass)
+            for col in lCols:
+                cNode= etree.Element("COL")
+                tableNode.append(cNode)
+                if col.getAttribute('points'):
+                    cNode.set('points',col.getAttribute('points'))
+                        
+        return refdoc        
+        
+    def createRefCluster(self,doc):
+        """
+            Ref: a row = set of textlines
+            :param doc: dox xml
+            returns a doc (ref format): each column contains a set of ids (textlines ids)
+        """            
+        self.ODoc = XMLDSDocument()
+        self.ODoc.loadFromDom(doc,listPages = range(self.firstPage,self.lastPage+1))        
+  
+  
+        root=etree.Element("DOCUMENT")
+        refdoc=etree.ElementTree(root)
+        
+
+        for page in self.ODoc.getPages():
+            pageNode = etree.Element('PAGE')
+            pageNode.set("number",page.getAttribute('number'))
+            pageNode.set("pagekey",os.path.basename(page.getAttribute('imageFilename')))
+            pageNode.set("width",str(page.getAttribute('width')))
+            pageNode.set("height",str(page.getAttribute('height')))
+
+            root.append(pageNode)   
+            lTables = page.getAllNamedObjects(XMLDSTABLEClass)
+            for table in lTables:
+                ## fake table for separators
+                if table.getWidth() < 40: continue
+                dCols={}
+                tableNode = etree.Element('TABLE')
+                tableNode.set("x",table.getAttribute('x'))
+                tableNode.set("y",table.getAttribute('y'))
+                tableNode.set("width",str(table.getAttribute('width')))
+                tableNode.set("height",str(table.getAttribute('height')))
+                pageNode.append(tableNode)
+                for cell in table.getAllNamedObjects(XMLDSTABLECELLClass):
+                    try:dCols[int(cell.getAttribute("col"))].extend(cell.getObjects())
+                    except KeyError:dCols[int(cell.getAttribute("col"))] = cell.getObjects()
+        
+                for rowid in sorted(dCols.keys()):
+                    cNode= etree.Element("COL")
+                    cNode.text =""
+                    tableNode.append(cNode)
+                    for elt in dCols[rowid]:
+                        if elt.getY() >200:
+                            txtNode = etree.Element("TEXT")
+                            txtNode.set('id',elt.getAttribute('id'))
+                            cNode.append(txtNode)
+#                             cNode.text += str(elt.getContent())
+                        
+        return refdoc
+                
+
+    def createRunCluster(self,doc):
+        """
+            Ref: a row = set of textlines
+            :param doc: dox xml
+            returns a doc (ref format): each column contains a set of ids (textlines ids)
+        """            
+        self.ODoc = doc #XMLDSDocument()
+#         self.ODoc.loadFromDom(doc,listPages = range(self.firstPage,self.lastPage+1))        
+  
+  
+        root=etree.Element("DOCUMENT")
+        refdoc=etree.ElementTree(root)
+        
+
+        for page in self.ODoc.getPages():
+            pageNode = etree.Element('PAGE')
+            pageNode.set("number",page.getAttribute('number'))
+            pageNode.set("pagekey",os.path.basename(page.getAttribute('imageFilename')))
+            pageNode.set("width",str(page.getAttribute('width')))
+            pageNode.set("height",str(page.getAttribute('height')))
+
+            root.append(pageNode)   
+            tableNode = etree.Element('TABLE')
+            tableNode.set("x","0")
+            tableNode.set("y","0")
+            tableNode.set("width","0")
+            tableNode.set("height","0")
+            pageNode.append(tableNode)
+                
+            lCols  = page.getAllNamedObjects(XMLDSTABLECOLUMNClass)
+            for col in lCols:
+                cNode= etree.Element("COL")
+                cNode.text=""
+                tableNode.append(cNode)
+                for elt in col.getObjects():
+                    if elt.getY() >200:
+                        txtNode= etree.Element("TEXT")
+                        txtNode.set('id',elt.getAttribute('id'))
+                        cNode.append(txtNode)
+                        cNode.text += str(elt.getContent())
+#         print (etree.tostring(refdoc,pretty_print = True))       
+                
+        return refdoc
+                
+                
+    
+    #--- RUN ---------------------------------------------------------------------------------------------------------------
+    
+    def loadDSDoc(self,doc):
+        """
+        
+        """
+        self.doc= doc
+        self.ODoc = XMLDSDocument()
+        
+        chronoOn()
+        self.ODoc.loadFromDom(self.doc,listPages=range(self.firstPage,self.lastPage+1))        
+        self.lPages= self.ODoc.getPages()
+#         for p in self.lPages:
+#             if len(p.getObjects())> 20: print (p,len(p.getObjects()))
+#         ss
+        print('chronoloading:', chronoOff())
+        sys.stdout.flush()
+
+
+    def testRun(self, filename, outFile=None):
+        """
+        evaluate using ABP new table dataset with tablecell
+        """
+        self.evalData = None
+        doc = self.loadDom(filename)
+        doc = self.run(doc)
+        if self.bEvalCluster:
+            self.evalData = self.createRunCluster( self.ODoc)
+        else:
+            self.evalData = self.createRunGeo(self.ODoc)
+        if outFile: self.writeDom(doc)
+        return etree.tostring(self.evalData,encoding='unicode',pretty_print=True)
+    
+    def run(self,doc):
+        """
+            for a set of pages, associate each page with several vertical zones  aka column-like elements
+            Populate the vertical zones with page elements (text)
+
+            indicate if bigram page template (mirrored pages)
+             
+        """
+        if self.bCreateRef:
+            if self.do2DS:
+                dsconv = primaAnalysis()
+                doc = dsconv.convert2DS(doc,self.docid)
+            
+            refdoc = self.createRefGeo(doc)
+            return refdoc
+        
+        elif self.bCreateRefCluster:
+            if self.do2DS:
+                dsconv = primaAnalysis()
+                doc = dsconv.convert2DS(doc,self.docid)
+            
+            refdoc = self.createRefCluster(doc)            
+            return refdoc
+        
+        elif self.bManual:
+#             self.tagWithTemplate(self.manualPattern,self.lPages)
+            self.THNUMERICAL = 30
+#             level=XMLDSTEXTClass
+            self.minePageVerticalFeature(self.lPages, ['x','x2'],level=self.sTag)
+            self.processWithTemplate(self.manualPattern,self.lPages)
+            return self.doc 
+
+        else:
+            chronoOn()
+            self.ODoc = XMLDSDocument()
+            self.ODoc.loadFromDom(doc,listPages = range(self.firstPage,self.lastPage+1))
+            # first mine page size!!
+            ## if width is not the 'same' , then  initial values are not comparable (x-end-ofpage)
+            self.lPages = self.ODoc.getPages() 
+            lSubPagesList = self.highLevelSegmentation(self.lPages)
+            
+            lTemplates = self.iterativeProcessVSegmentation(lSubPagesList)
+#             print( 'chronoprocessing: ', chronoOff())
+            self.addTagProcessToMetadata(doc)
+#             doc = self.createRefGeo(doc)
+#             doc = self.createRefCluster(doc)
+
+            return doc #, lTemplates, self.lPages
+        
+
+    #--- TESTS -------------------------------------------------------------------------------------------------------------    
+    #
+    # Here we have the code used to test this component on a prepared testset (see under <ROOT>/test/common)
+    # Do: python ../../src/common/TypicalComponent.py --test REF_TypicalComponent/
+    #
+    
+
+#--- MAIN -------------------------------------------------------------------------------------------------------------    
+#
+# In case we want to use this component from a command line
+#
+# Do: python TypicalComponent.py -i toto.in.xml
+#
+if __name__ == "__main__":
+    
+    
+    docM = tableTemplateSep()
+
+    #prepare for the parsing of the command line
+    docM.createCommandLineParser()
+    docM.add_option("-f", "--first", dest="first", action="store", type="int", help="first page number", metavar="NN")
+    docM.add_option("-l", "--last", dest="last", action="store", type="int", help="last page number", metavar="NN")
+    docM.add_option("-t", "--tag", dest="tag", action="store", type="string", help="tag level", metavar="S")
+    docM.add_option("--pattern", dest="pattern", action="store", type="string", help="pattern to be applied", metavar="[]")
+    docM.add_option("--TH", dest="THNUM", action="store", type="int", help="TH as eq delta", metavar="NN")
+    docM.add_option("--KTH", dest="KLEENETH", action="store", type="float", help="TH for sequentiality", metavar="NN")
+    docM.add_option("--createref", dest="createref", action="store_true", default=False, help="create REF file (GEO) for component")
+    docM.add_option("--createrefC", dest="createrefCluster", action="store_true", default=False, help="create REF file for component (cluster of textlines)")
+    docM.add_option("--evalC", dest="evalCluster", action="store_true", default=False, help="evaluation using clusters (of textlines)")
+    docM.add_option("--dsconv", dest="dsconv", action="store_true", default=False, help="convert page format to DS")
+        
+    #parse the command line
+    dParams, args = docM.parseCommandLine()
+    
+    #Now we are back to the normal programmatic mode, we set the componenet parameters
+    docM.setParams(dParams)
+    
+    doc = docM.loadDom()
+    docM.loadDSDoc(doc)
+#     docM.bDebug = True
+    doc = docM.run(doc)
+    
+    if doc and docM.getOutputFileName() != "-":
+        docM.writeDom(doc, True)
+
+        
diff --git a/TranskribusDU/tasks/DU_ABPTableRCAnnotation.py b/TranskribusDU/tasks/DU_ABPTableRCAnnotation.py
index f17838a..f23816b 100644
--- a/TranskribusDU/tasks/DU_ABPTableRCAnnotation.py
+++ b/TranskribusDU/tasks/DU_ABPTableRCAnnotation.py
@@ -88,6 +88,7 @@ def tag_DU_row_col_header(lCells, maxRowSpan):
             pass
         if len(lText) == 1:
             lText[0].set(sDURow,lLabelsBIEOS_R[3])
+            
         elif len(lText) > 1:
     #         lText.sort(key=lambda x:float(x.prop('y')))
             lText[0].set(sDURow,lLabelsBIEOS_R[0])
@@ -130,9 +131,9 @@ def tag_DU_row_col_header(lCells, maxRowSpan):
     lRegions= MultiPageXml.getChildByName(root,'TextRegion')
     for region in lRegions:
         lText =  MultiPageXml.getChildByName(region,'TextLine')
-        [x.set(sDURow,lLabelsBIEOS_R[-1]) for x in lText]
-        [x.set(sDUCol,lLabelsSM_C[-1]) for x in lText]
-        [x.set(sDUHeader,lLabels_HEADER[-1]) for x in lText]
+        [x.set(sDURow,lLabelsBIEOS_R[-1]) for x in lText if x.getparent() == region]
+        [x.set(sDUCol,lLabelsSM_C[-1]) for x in lText if x.getparent() == region]
+        [x.set(sDUHeader,lLabels_HEADER[-1]) for x in lText if x.getparent() == region]
         
     return
 
diff --git a/TranskribusDU/xml_formats/DS2PageXml.py b/TranskribusDU/xml_formats/DS2PageXml.py
index 2d12cfe..29f773b 100644
--- a/TranskribusDU/xml_formats/DS2PageXml.py
+++ b/TranskribusDU/xml_formats/DS2PageXml.py
@@ -52,11 +52,11 @@ def __init__(self):
     
         self.dpi = 300
 
-        self.xrce_id=10000        
+        self.nle_id=10000        
         
         self.storagePath = ''
         
-        self.dTagNameMapping = {'PAGE':'Page','TEXT':'TextLine', 'LINE':'TextLine','COLUMN':'TextRegion','REGION':'TextRegion','BLOCK':'TextRegion','GRAPHELT':'LineDrawingRegion','TABLE':'TableRegion','CELL':'TableCell'} 
+        self.dTagNameMapping = {'PAGE':'Page','TEXT':'TextLine', 'LINE':'TextLine','COLUMN':'TextRegion','REGION':'TextRegion','BLOCK':'TextRegion','GRAPHELT':'LineDrawingRegion','TABLE':'TableRegion','CELL':'TableCell','SeparatorRegion':'SeparatorRegion'} 
 
         self.pageXmlNS = None
         
@@ -111,7 +111,8 @@ def DSPoint2PagePoints(self,sPoints):
         lx= list(map(lambda x:1.0*float(x)*self.dpi/72.0, lPoints))
         # order left right 
         xx =  list(zip(lx[0::2], lx[1::2]))
-        xx.sort(key=lambda xy:xy[0])
+#         xx.sort(key=lambda xy:xy[0])
+#         print (sPoints, xx,' '.join(["%d,%d"%(xa,ya) for xa,ya  in xx]))
         return ' '.join(["%d,%d"%(xa,ya) for xa,ya  in xx])
         
     def convertDSObject(self,DSObject,pageXmlParentNode):
@@ -149,19 +150,22 @@ def convertDSObject(self,DSObject,pageXmlParentNode):
         try:
             pageXmlName= self.dTagNameMapping[DSObject.getName()]
         except KeyError: 
-#             print DSObject.getName() ," not declared"
+            print (DSObject.getName() ," not declared")
             return 
+#         print (DSObject.getName())
         domNode= PageXml.createPageXmlNode(pageXmlName)
         if DSObject.getID():
-            domNode.set("id", "xrce_%s"%DSObject.getID())
-        else: self.addXRCEID(domNode)
+            domNode.set("id", "nle_%s"%DSObject.getID())
+        else: self.addNLEID(domNode)
         pageXmlParentNode.append(domNode)
         coordsNode = etree.Element('{%s}Coords'%(self.pageXmlNS))
 #         coordsNode.setNs(self.pageXmlNS)
-        coordsNode.set('points', self.BB2Polylines(DSObject.getX(),DSObject.getY(), DSObject.getHeight(),DSObject.getWidth()))        
+        if DSObject.hasAttribute('points'):
+            coordsNode.set('points',self.DSPoint2PagePoints(DSObject.getAttribute('points')))    
+        else:     
+            coordsNode.set('points', self.BB2Polylines(DSObject.getX(),DSObject.getY(), DSObject.getHeight(),DSObject.getWidth()))     
         domNode.append(coordsNode)            
         
-        
         for attr in ['custom', 'structure','col','type','DU_row','DU_header','DU_col']:
             if DSObject.hasAttribute(attr):
                 domNode.set(attr, DSObject.getAttribute(attr))
@@ -201,8 +205,8 @@ def convertDSObject(self,DSObject,pageXmlParentNode):
             cornerNode.text = "0 1 2 3"
 #             cornerNode.setNs(self.pageXmlNS)
             domNode.append(cornerNode)    
-            coordsNode.set('colSpan',str(DSObject.getColSpan()))
-            coordsNode.set('rowSpan',str(DSObject.getRowSpan()))
+            domNode.set('colSpan',str(DSObject.getColSpan()))
+            domNode.set('rowSpan',str(DSObject.getRowSpan()))
             
         
         #process objects
@@ -210,9 +214,9 @@ def convertDSObject(self,DSObject,pageXmlParentNode):
             self.convertDSObject(subobject, domNode)
         
         
-    def addXRCEID(self,node):
-        node.set("id", "xrce_%d"%self.xrce_id)  
-        self.xrce_id += 1
+    def addNLEID(self,node):
+        node.set("id", "nle_%d"%self.nle_id)  
+        self.nle_id += 1
         
         
     
@@ -236,7 +240,7 @@ def convertDSPage(self,OPage,pageXmlPageNODE):
         for DSObject in lElts:
             self.convertDSObject(DSObject,pageXmlPageNODE)
 
-#         # get graphelt elements
+# #         # get graphelt elements
         lElts= OPage.getAllNamedObjects(XMLDSGRAPHLINEClass)
         for DSObject in lElts:
             self.convertDSObject(DSObject,pageXmlPageNODE)