/DTI_PID/DTI_PID/TextDetector.py - Diff - HYTOS - 일정관리

개정판 eea44d8f

ID	eea44d8f06ad8946253d5a1678c7f15ea7125b7d
상위	5c59ae39
하위	e57134bc, 6b3cb476

백흠경이(가) 5년 이상 전에 추가함

issue #663: fixed a routine recognizing text from image

Change-Id: I6360bae8fe30c0863a5fb0dfa15fee64f2970af3

             try:
                 tInfoList = self.getTextAreaInfo(img, offset[0], offset[1])
             except Exception as ex:
                 print('error occured({}) in {}:{}'.format(ex, sys.exc_info()[-1].tb_frame.f_code.co_filename, sys.exc_info()[-1].tb_lineno))
                 print('error occurred({}) in {}:{}'.format(ex, sys.exc_info()[-1].tb_frame.f_code.co_filename, sys.exc_info()[-1].tb_lineno))
             return tInfoList
-...
 .11.08 euisung     add white char list check process on db
         '''
         @staticmethod
         def recognizeTextFromImage(tInfo, imgOCR, offset, searchedSymbolList, worker, listWidget, maxProgressValue):
         def recognizeTextFromImage(tInfos, imgOCR, offset, searchedSymbolList, worker, listWidget, maxProgressValue):
             import re
             res = []
             appDocData = AppDocData.instance()
             app_doc_data = AppDocData.instance()
             try:
                 x = tInfo.getX() - round(offset[0])
                 y = tInfo.getY() - round(offset[1])
                 img = imgOCR[y:y+tInfo.getH(), x:x+tInfo.getW()]
                 # set angle 0 if symbol contains the text area is instrumentation
                 category = None
                 contains = [symbol for symbol in searchedSymbolList if symbol.contains(tInfo)]
                 if contains:
                     _type = contains[0].getType()
                     category = appDocData.getSymbolCategoryByType(_type)
                     if 'Instrumentation' == category: tInfo.setAngle(0)
                 # up to here
                 for tInfo in tInfos:
                     x = tInfo.getX() - round(offset[0])
                     y = tInfo.getY() - round(offset[1])
                     img = imgOCR[y:y+tInfo.getH(), x:x+tInfo.getW()]
                     # set angle 0 if symbol contains the text area is instrumentation
                     category = None
                     contains = [symbol for symbol in searchedSymbolList if symbol.contains(tInfo)]
                     if contains:
                         _type = contains[0].getType()
                         category = app_doc_data.getSymbolCategoryByType(_type)
                         if 'Instrumentation' == category:
                             tInfo.setAngle(0)
                     # up to here
                 whiteCharList = appDocData.getConfigs('Text Recognition', 'White Character List')
                 if len(whiteCharList) is 0:
                     resultTextInfo = TOCR.getTextInfo(img, (x, y), tInfo.getAngle(), language=appDocData.OCRData)
                 else:
                     resultTextInfo = TOCR.getTextInfo(img, (x, y), tInfo.getAngle(), language=appDocData.OCRData, conf = whiteCharList[0].value)
                     whiteCharList = app_doc_data.getConfigs('Text Recognition', 'White Character List')
                     if len(whiteCharList) is 0:
                         resultTextInfo = TOCR.getTextInfo(img, (x, y), tInfo.getAngle(), language=app_doc_data.OCRData)
                     else:
                         resultTextInfo = TOCR.getTextInfo(img, (x, y), tInfo.getAngle(), language=app_doc_data.OCRData, conf=whiteCharList[0].value)
                 if resultTextInfo is not None and len(resultTextInfo) > 0:
                     for result in resultTextInfo:
                         result.setX(result.getX() + round(offset[0]))
                         result.setY(result.getY() + round(offset[1]))
                         if 'Instrumentation' == category:
                             text = re.sub('[^a-zA-Z0-9]+', '', result.getText())
                             result.setText(text)
                     res.extend(resultTextInfo)
                     if listWidget is not None:
                         item = QListWidgetItem('{},{},{} is recognized'.format(resultTextInfo[0].getX(), resultTextInfo[0].getY(), resultTextInfo[0].getText()))
                         listWidget.addItem(item)
                 else:
                     pass
                     if resultTextInfo is not None and len(resultTextInfo) > 0:
                         for result in resultTextInfo:
                             result.setX(result.getX() + round(offset[0]))
                             result.setY(result.getY() + round(offset[1]))
                             if 'Instrumentation' == category:
                                 text = re.sub('[^a-zA-Z0-9]+', '', result.getText())
                                 result.setText(text)
                         res.extend(resultTextInfo)
                 if worker is not None: worker.updateProgress.emit(maxProgressValue, resultTextInfo[0].getText() if resultTextInfo is not None and 1 == len(resultTextInfo) else None)
                         if listWidget is not None:
                             item = QListWidgetItem('{},{},{} is recognized'.format(resultTextInfo[0].getX(), resultTextInfo[0].getY(), resultTextInfo[0].getText()))
                             listWidget.addItem(item)
                     else:
                         pass
                     if worker is not None:
                         worker.updateProgress.emit(maxProgressValue, resultTextInfo[0].getText() if resultTextInfo is not None and 1 == len(resultTextInfo) else None)
             except Exception as ex:
                 message = 'error occured({}) in {}:{}'.format(ex, sys.exc_info()[-1].tb_frame.f_code.co_filename, sys.exc_info()[-1].tb_lineno)
                 worker.displayLog.emit(MessageType.Error, message)
                 message = 'error occurred({}) in {}:{}'.format(repr(ex), sys.exc_info()[-1].tb_frame.f_code.co_filename, sys.exc_info()[-1].tb_lineno)
                 if worker is not None:
                     worker.displayLog.emit(MessageType.Error, message)
             return res
-...
         '''
         def recognizeText(self, imgSrc, offset, tInfoList, searchedSymbolList, worker, listWidget, maxProgressValue, onlyTextArea = False):
             import concurrent.futures as futures
             from multiprocessing import Process, Queue
             from Area import Area
             try:
-...
                     imgOCR = cv2.imread(path, 1)
                     imgOCR = cv2.threshold(cv2.cvtColor(imgOCR, cv2.COLOR_BGR2GRAY), 0, 255, cv2.THRESH_BINARY+cv2.THRESH_OTSU)[1]
                     pool = futures.ThreadPoolExecutor(max_workers = THREAD_MAX_WORKER)
                     for tInfo in tInfoList:
                         future = pool.submit(TextDetector.recognizeTextFromImage, tInfo, imgOCR, offset, searchedSymbolList, worker, listWidget, maxProgressValue)
                     text_info_array = np.array_split(tInfoList, THREAD_MAX_WORKER)
                     pool = futures.ThreadPoolExecutor(max_workers=THREAD_MAX_WORKER)
                     for tInfo in text_info_array:
                         future = pool.submit(TextDetector.recognizeTextFromImage, tInfo, imgOCR, offset, searchedSymbolList,
                                              worker, listWidget, maxProgressValue)
                         data = future.result()
                         if data: self.textInfoList.extend(data)
                     pool.shutdown(wait = True)
                         if data:
                             self.textInfoList.extend(data)
                     pool.shutdown(wait=True)
                     ## remove text item has only 1 character
                     #for index in range(len(self.textInfoList) - 1, -1, -1):
                     # remove text item has only 1 character
                     # for index in range(len(self.textInfoList) - 1, -1, -1):
                     #    if len(self.textInfoList[index].getText()) is 1:
                     #        self.textInfoList.pop(index)
-...
                     if worker is not None: worker.updateProgress.emit(maxProgressValue, None)
             except Exception as ex:
                 message = 'error occured({}) in {}:{}'.format(ex, sys.exc_info()[-1].tb_frame.f_code.co_filename, sys.exc_info()[-1].tb_lineno)
                 message = 'error occurred({}) in {}:{}'.format(repr(ex), sys.exc_info()[-1].tb_frame.f_code.co_filename, sys.exc_info()[-1].tb_lineno)
                 worker.displayLog.emit(MessageType.Error, message)
         '''

내보내기 Unified diff

프로젝트

일반

사용자정보

HYTOS

개정판 eea44d8f