CofeehousePy/services/corenlp/test/regression/test-rte-system.py

#!/usr/bin/env python


import os
import re
import time
import random

dataset = "RTE2_dev"
score = 0.0
minScore = 0.60

memory = "-ms2g -mx7g"


# Set up file paths -------------------------------------------------------------

dataDir = "/u/nlp/rte/data/byformat"
tmpDir = "/tmp/rte-regression.%d" % os.getpid()
os.mkdir(tmpDir)
rteFile = "%s/rte/%s.xml" % (dataDir, dataset)
kbeFile = "%s/%s.kbe.xml" % (tmpDir, dataset)
pipelineFile = "%s/%s.pipeline.info.xml" % (tmpDir, dataset)
alignFile = "%s/%s.align.xml" % (tmpDir, dataset)
logFile = "%s/%s.log" % (tmpDir, dataset)
regressionFile = "%s/regression/%s.regression.log" % (dataDir, dataset)


# Make KBE file from RTE file ---------------------------------------------------

def makeKBEFile():
  javaclass = "edu.stanford.nlp.util.XMLTransformer"
  xsltransformer = "/u/nlp/rte/data/resources/RTE_to_KBEval.xsl"
  cmd = "java -server %s %s " % (memory, javaclass) + \
        "-in %s " % rteFile + \
        "-out %s " % kbeFile + \
        "-transform %s " % xsltransformer + \
        "> %s 2>&1 " % logFile
  # print "cmd is:\n", cmd
  os.system(cmd)


# Annotation --------------------------------------------------------------------

def doAnnotation():
  javaclass = "edu.stanford.nlp.rte.RTEPipeline"
  cmd = "java -server %s %s " % (memory, javaclass) + \
        "-kbeIn %s " % kbeFile + \
        "-infoOut %s " % pipelineFile + \
        "> %s 2>&1 " % logFile
  # print "cmd is:\n", cmd
  os.system(cmd)


# Alignment & inference ---------------------------------------------------------
    
def doAlignmentAndInference():
  aligner = "stochastic"
  javaclass = "edu.stanford.nlp.rte.KBETester"
  cmd = "java -server %s %s " % (memory, javaclass) + \
        "-info %s " % pipelineFile + \
        "-saveAlignments %s " % alignFile + \
        "-aligner %s " % aligner + \
        "-twoClass " + \
        "-balancedData " + \
        "-verbose 1 " + \
        "> %s 2>&1 " % logFile
  # print "cmd is:\n", cmd
  os.system(cmd)


# Extract score -----------------------------------------------------------------

def extractScore():
  for line in os.popen("grep '^Accuracy:' %s" % logFile):
    line = line.strip()
    # print line
    fields = re.split('\s+', line)
    score = float(fields[-1])
  return score


# Get previous score ------------------------------------------------------------

def getPreviousScore():
  prev = 0.0
  for line in os.popen("grep '^PASS' %s" % regressionFile):
    line = line.strip()
    # print line
    fields = re.split('\s+', line)
    prev = float(fields[1])
  return prev


# Save score --------------------------------------------------------------------

def saveScore(score, minScore, logFile):
  if score >= minScore:
    result = "PASS"
  else:
    result = "FAIL"
  f = open(regressionFile, "a")
  print >>f, \
        "%s  %.4f  %.4f  %s  %s" % \
        (result,
         score,
         minScore,
         time.strftime("%Y%m%d-%H%M%S"),
         logFile)
  f.close()
  

# main --------------------------------------------------------------------------

makeKBEFile()
doAnnotation()
doAlignmentAndInference()
# score = random.random()
score = extractScore()
minScore = max(minScore, getPreviousScore())

if score >= minScore:
  print "PASS score %.4f >= min %.4f" % (score, minScore)
else:
  print "FAIL score %.4f >= min %.4f, output in %s" % (score, minScore, logFile)

saveScore(score, minScore, logFile)
Added CoreNLP 2021-01-09 03:43:33 +01:00			`#!/usr/bin/env python`


			`import os`
			`import re`
			`import time`
			`import random`

			`dataset = "RTE2_dev"`
			`score = 0.0`
			`minScore = 0.60`

			`memory = "-ms2g -mx7g"`


			`# Set up file paths -------------------------------------------------------------`

			`dataDir = "/u/nlp/rte/data/byformat"`
			`tmpDir = "/tmp/rte-regression.%d" % os.getpid()`
			`os.mkdir(tmpDir)`
			`rteFile = "%s/rte/%s.xml" % (dataDir, dataset)`
			`kbeFile = "%s/%s.kbe.xml" % (tmpDir, dataset)`
			`pipelineFile = "%s/%s.pipeline.info.xml" % (tmpDir, dataset)`
			`alignFile = "%s/%s.align.xml" % (tmpDir, dataset)`
			`logFile = "%s/%s.log" % (tmpDir, dataset)`
			`regressionFile = "%s/regression/%s.regression.log" % (dataDir, dataset)`


			`# Make KBE file from RTE file ---------------------------------------------------`

			`def makeKBEFile():`
			`javaclass = "edu.stanford.nlp.util.XMLTransformer"`
			`xsltransformer = "/u/nlp/rte/data/resources/RTE_to_KBEval.xsl"`
			`cmd = "java -server %s %s " % (memory, javaclass) + \`
			`"-in %s " % rteFile + \`
			`"-out %s " % kbeFile + \`
			`"-transform %s " % xsltransformer + \`
			`"> %s 2>&1 " % logFile`
			`# print "cmd is:\n", cmd`
			`os.system(cmd)`


			`# Annotation --------------------------------------------------------------------`

			`def doAnnotation():`
			`javaclass = "edu.stanford.nlp.rte.RTEPipeline"`
			`cmd = "java -server %s %s " % (memory, javaclass) + \`
			`"-kbeIn %s " % kbeFile + \`
			`"-infoOut %s " % pipelineFile + \`
			`"> %s 2>&1 " % logFile`
			`# print "cmd is:\n", cmd`
			`os.system(cmd)`


			`# Alignment & inference ---------------------------------------------------------`

			`def doAlignmentAndInference():`
			`aligner = "stochastic"`
			`javaclass = "edu.stanford.nlp.rte.KBETester"`
			`cmd = "java -server %s %s " % (memory, javaclass) + \`
			`"-info %s " % pipelineFile + \`
			`"-saveAlignments %s " % alignFile + \`
			`"-aligner %s " % aligner + \`
			`"-twoClass " + \`
			`"-balancedData " + \`
			`"-verbose 1 " + \`
			`"> %s 2>&1 " % logFile`
			`# print "cmd is:\n", cmd`
			`os.system(cmd)`


			`# Extract score -----------------------------------------------------------------`

			`def extractScore():`
			`for line in os.popen("grep '^Accuracy:' %s" % logFile):`
			`line = line.strip()`
			`# print line`
			`fields = re.split('\s+', line)`
			`score = float(fields[-1])`
			`return score`


			`# Get previous score ------------------------------------------------------------`

			`def getPreviousScore():`
			`prev = 0.0`
			`for line in os.popen("grep '^PASS' %s" % regressionFile):`
			`line = line.strip()`
			`# print line`
			`fields = re.split('\s+', line)`
			`prev = float(fields[1])`
			`return prev`


			`# Save score --------------------------------------------------------------------`

			`def saveScore(score, minScore, logFile):`
			`if score >= minScore:`
			`result = "PASS"`
			`else:`
			`result = "FAIL"`
			`f = open(regressionFile, "a")`
			`print >>f, \`
			`"%s %.4f %.4f %s %s" % \`
			`(result,`
			`score,`
			`minScore,`
			`time.strftime("%Y%m%d-%H%M%S"),`
			`logFile)`
			`f.close()`


			`# main --------------------------------------------------------------------------`

			`makeKBEFile()`
			`doAnnotation()`
			`doAlignmentAndInference()`
			`# score = random.random()`
			`score = extractScore()`
			`minScore = max(minScore, getPreviousScore())`

			`if score >= minScore:`
			`print "PASS score %.4f >= min %.4f" % (score, minScore)`
			`else:`
			`print "FAIL score %.4f >= min %.4f, output in %s" % (score, minScore, logFile)`

			`saveScore(score, minScore, logFile)`