/ - Diff - HYTOS - 일정관리

개정판 aec5980d

ID	aec5980d5511e636cfe332e4ca1a714b589d3925
상위	567c7c1c
하위	d38e9e65

함의성이(가) 6년 이상 전에 추가함

build issue #655: tesseract moved programdata

     import TrainingImageList_UI
     from TrainingEditorDialog import QTrainingEditorDialog
     runningPath = os.getcwd()
     ###tesseractPath = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR', 'tessdata')
     tesseractPath = os.path.join('C:\\ProgramData\\Digital PID', 'Tesseract-OCR', 'tessdata')###
     ###pytesseract.pytesseract.tesseract_cmd = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR', 'tesseract.exe')
     pytesseract.pytesseract.tesseract_cmd = os.path.join('C:\\ProgramData\\Digital PID', 'Tesseract-OCR', 'tesseract.exe')###
     ###tesseract_cmd = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR', 'tesseract.exe')
     tesseract_cmd = os.path.join('C:\\ProgramData\\Digital PID', 'Tesseract-OCR', 'tesseract.exe')###
     ###unicharset_extractor_cmd = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR', 'unicharset_extractor.exe')
     unicharset_extractor_cmd = os.path.join('C:\\ProgramData\\Digital PID', 'Tesseract-OCR', 'unicharset_extractor.exe')###
     set_unicharset_properties_cmd = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR', 'set_unicharset_properties.exe')
     dataPath = os.path.join(os.getenv('ALLUSERSPROFILE'), 'Digital PID')
     tesseractPath = os.path.join(dataPath, 'Tesseract-OCR', 'tessdata')
     pytesseract.pytesseract.tesseract_cmd = os.path.join(dataPath, 'Tesseract-OCR', 'tesseract.exe')
     tesseract_cmd = os.path.join(dataPath, 'Tesseract-OCR', 'tesseract.exe')
     unicharset_extractor_cmd = os.path.join(dataPath, 'Tesseract-OCR', 'unicharset_extractor.exe')
     set_unicharset_properties_cmd = os.path.join(dataPath, 'Tesseract-OCR', 'set_unicharset_properties.exe')
     #langDataPath = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR', 'set_unicharset_properties.exe')
     shapeclustering_cmd = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR', 'shapeclustering.exe')
     mftraining_cmd = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR', 'mftraining.exe')
     cntraining_cmd = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR', 'cntraining.exe')
     combine_tessdata_cmd = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR', 'combine_tessdata.exe')
     shapeclustering_cmd = os.path.join(dataPath, 'Tesseract-OCR', 'shapeclustering.exe')
     mftraining_cmd = os.path.join(dataPath, 'Tesseract-OCR', 'mftraining.exe')
     cntraining_cmd = os.path.join(dataPath, 'Tesseract-OCR', 'cntraining.exe')
     combine_tessdata_cmd = os.path.join(dataPath, 'Tesseract-OCR', 'combine_tessdata.exe')
     DEFAULT_CONF = """
         --psm 6 -c tessedit_char_whitelist=ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789-~.,/!@#$%&*(){}[]<>:;+=?\\"\\'
-...
             from PIL import Image
             import math
             try:
                 ###os.environ['TESSDATA_PREFIX'] = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR')
                 os.environ['TESSDATA_PREFIX'] = os.path.join('C:\ProgramData\Digital PID', 'Tesseract-OCR')###
                 os.environ['TESSDATA_PREFIX'] = os.path.join(dataPath, 'Tesseract-OCR')
                 appDocData = AppDocData.instance()
                 project = appDocData.getCurrentProject()
                 self.oCRLang = appDocData.getCurrentProject().getName()
-...
                 return None
             try:
                 originPath = os.getcwd()
                 os.chdir(dataPath)
                 # 1
                 trainingImgPath = self.get_short_path_name(trainingImgPath)
                 trainingBoxPathT = self.get_short_path_name(trainingBoxPath.replace('.box', ''))
                 trainingBoxPathT = trainingImgPath.replace('.tif', '')
                 trainCmd = '\"' + tesseract_cmd + '\" ' + trainingImgPath + ' ' + trainingBoxPathT + ' nobatch box.train'# &timeout 15'
                 subprocess.call(trainCmd, shell = True)
-...
                 trainingBoxPathU = self.get_short_path_name(trainingBoxPath)
                 unicharsetExtractorCmd = '\"' + unicharset_extractor_cmd + '\"' + ' ' + trainingBoxPathU# + ' &timeout 15'
                 subprocess.call(unicharsetExtractorCmd, shell = True)
                 '''
                 # 3
                 inputUnicharset = os.path.join(runningPath, 'unicharset')
                 inputUnicharset = os.path.join(dataPath, 'unicharset')
                 inputUnicharset = self.get_short_path_name(inputUnicharset)
                 scriptPath = ' --script_dir=//langdata-master'
                 setUnicharsetPropertiesCmd = '\"' + set_unicharset_properties_cmd + '\" -U ' + inputUnicharset + ' -O ' + inputUnicharset + scriptPath# + ' &timeout 15'
-...
                 fw.close()
                 # 5
                 trPath = os.path.join(project.getTrainingFilePath(), self.oCRLang + '.' + self.oCRLang + 'F.exp0.tr')
                 trPath = self.get_short_path_name(trPath)
                 trPath = trainingImgPath.replace('.tif', '.tr')
                 fontProperty = self.get_short_path_name(fontProperty)
                 shapeclusteringCmd = '\"' + shapeclustering_cmd + '\" -F ' + fontProperty + ' -U ' + inputUnicharset + ' ' + trPath# + ' &timeout 15'
                 subprocess.call(shapeclusteringCmd, shell = True)
-...
                 self.deleteMidProcessFile()
                 os.rename(os.path.join(runningPath, 'inttemp'), os.path.join(runningPath, self.oCRLang + '.inttemp'))
                 os.rename(os.path.join(runningPath, 'normproto'), os.path.join(runningPath, self.oCRLang + '.normproto'))
                 os.rename(os.path.join(runningPath, 'pffmtable'), os.path.join(runningPath, self.oCRLang + '.pffmtable'))
                 os.rename(os.path.join(runningPath, 'shapetable'), os.path.join(runningPath, self.oCRLang + '.shapetable'))
                 os.rename(os.path.join(runningPath, 'unicharset'), os.path.join(runningPath, self.oCRLang + '.unicharset'))
                 os.rename(os.path.join(dataPath, 'inttemp'), os.path.join(dataPath, self.oCRLang + '.inttemp'))
                 os.rename(os.path.join(dataPath, 'normproto'), os.path.join(dataPath, self.oCRLang + '.normproto'))
                 os.rename(os.path.join(dataPath, 'pffmtable'), os.path.join(dataPath, self.oCRLang + '.pffmtable'))
                 os.rename(os.path.join(dataPath, 'shapetable'), os.path.join(dataPath, self.oCRLang + '.shapetable'))
                 os.rename(os.path.join(dataPath, 'unicharset'), os.path.join(dataPath, self.oCRLang + '.unicharset'))
                 # 8
                 combineTessdataCmd = '\"' + combine_tessdata_cmd + '\" ' + self.oCRLang + '.'
                 subprocess.call(combineTessdataCmd, shell = True)
                 if os.path.isfile(os.path.join(tesseractPath, self.oCRLang + '.traineddata')):
                     os.remove(os.path.join(tesseractPath, self.oCRLang + '.traineddata'))
                 os.rename(os.path.join(runningPath, self.oCRLang + '.traineddata'), os.path.join(tesseractPath, self.oCRLang + '.traineddata'))
                 os.rename(os.path.join(dataPath, self.oCRLang + '.traineddata'), os.path.join(tesseractPath, self.oCRLang + '.traineddata'))
                 self.deleteMidProcessFile()
                 '''
             except Exception as ex:
                 print('error occured({}) in {}:{}'.format(ex, sys.exc_info()[-1].tb_frame.f_code.co_filename, sys.exc_info()[-1].tb_lineno))
                 from App import App
-...
                 App.mainWnd().addMessage.emit(MessageType.Error, message)
             finally:
                 self.deleteMidProcessFile()
                 os.chdir(originPath)
         '''
             @brief      delete Mid Process File
-...
         '''
         def deleteMidProcessFile(self):
             try:
                 if os.path.isfile(os.path.join(runningPath, self.oCRLang + '.inttemp')):
                     os.remove(os.path.join(runningPath, self.oCRLang + '.inttemp'))
                 if os.path.isfile(os.path.join(runningPath, self.oCRLang + '.normproto')):
                     os.remove(os.path.join(runningPath, self.oCRLang + '.normproto'))
                 if os.path.isfile(os.path.join(runningPath, self.oCRLang + '.pffmtable')):
                     os.remove(os.path.join(runningPath, self.oCRLang + '.pffmtable'))
                 if os.path.isfile(os.path.join(runningPath, self.oCRLang + '.shapetable')):
                     os.remove(os.path.join(runningPath, self.oCRLang + '.shapetable'))
                 if os.path.isfile(os.path.join(runningPath, self.oCRLang + '.unicharset')):
                     os.remove(os.path.join(runningPath, self.oCRLang + '.unicharset'))
                 if os.path.isfile(os.path.join(dataPath, self.oCRLang + '.inttemp')):
                     os.remove(os.path.join(dataPath, self.oCRLang + '.inttemp'))
                 if os.path.isfile(os.path.join(dataPath, self.oCRLang + '.normproto')):
                     os.remove(os.path.join(dataPath, self.oCRLang + '.normproto'))
                 if os.path.isfile(os.path.join(dataPath, self.oCRLang + '.pffmtable')):
                     os.remove(os.path.join(dataPath, self.oCRLang + '.pffmtable'))
                 if os.path.isfile(os.path.join(dataPath, self.oCRLang + '.shapetable')):
                     os.remove(os.path.join(dataPath, self.oCRLang + '.shapetable'))
                 if os.path.isfile(os.path.join(dataPath, self.oCRLang + '.unicharset')):
                     os.remove(os.path.join(dataPath, self.oCRLang + '.unicharset'))
             except Exception as ex:
                 print('error occured({}) in {}:{}'.format(ex, sys.exc_info()[-1].tb_frame.f_code.co_filename, sys.exc_info()[-1].tb_lineno))
                 from App import App

                     humkyung 2018.08.13 set tesseract executable path to relative of this file path
     '''
     #pytesseract.pytesseract.tesseract_cmd = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR', 'tesseract.exe')
     pytesseract.pytesseract.tesseract_cmd = os.path.join('C:\ProgramData\Digital PID', 'Tesseract-OCR', 'tesseract.exe')
     #tesseract_cmd = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR', 'tesseract.exe')
     pytesseract.pytesseract.tesseract_cmd = os.path.join(os.getenv('ALLUSERSPROFILE'), 'Digital PID', 'Tesseract-OCR', 'tesseract.exe')
     DEFAULT_CONF = """
         --psm 6 -c tessedit_char_whitelist=abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789-~.,/!@#$%&*(){}[]<>:;+=?\\"
-...
     """
     def getTextInfo(img, startPoint, angle = 0, flag = FLAG_IMAGE_TO_BOXES, conf = DEFAULT_CONF):
         try:
             ###os.environ['TESSDATA_PREFIX'] = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'Tesseract-OCR')
             os.environ['TESSDATA_PREFIX'] = os.path.join('C:\ProgramData\Digital PID', 'Tesseract-OCR')###
             os.environ['TESSDATA_PREFIX'] = os.path.join(os.getenv('ALLUSERSPROFILE'), 'Digital PID', 'Tesseract-OCR')
             textInfoList = []
             docData = AppDocData.instance()

내보내기 Unified diff

프로젝트

일반

사용자정보

HYTOS

개정판 aec5980d