KR20030011271A - A method and system for form recognition and digitized image processing - Google Patents

A method and system for form recognition and digitized image processing Download PDF

Info

Publication number
KR20030011271A
KR20030011271A KR1020027008936A KR20027008936A KR20030011271A KR 20030011271 A KR20030011271 A KR 20030011271A KR 1020027008936 A KR1020027008936 A KR 1020027008936A KR 20027008936 A KR20027008936 A KR 20027008936A KR 20030011271 A KR20030011271 A KR 20030011271A
Authority
KR
South Korea
Prior art keywords
mark
data
image data
identification
digital image
Prior art date
Application number
KR1020027008936A
Other languages
Korean (ko)
Inventor
버겔슨앨란피
반씨클스코트
그로쓰버그데이비드
레온어맨드주니어
리드수잔비
Original Assignee
팀브렐 시스템즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/480,914 external-priority patent/US6697056B1/en
Priority claimed from US09/692,291 external-priority patent/US6707466B1/en
Priority claimed from US09/692,272 external-priority patent/US6600482B1/en
Application filed by 팀브렐 시스템즈 코포레이션 filed Critical 팀브렐 시스템즈 코포레이션
Publication of KR20030011271A publication Critical patent/KR20030011271A/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

폼 (45) 위에 매뉴얼식으로 형성한 마크 (230) 의 위치에 기초한, 미리 프린트한 마크 (45) 의 자동 식별 방법 및 시스템을 제공한다. 본 방법은, 잉크 이미지 데이터 (412) 를 수신하는 단계; 마크 (230) 의 존재 및 위치를 식별하여, 수신한 잉크 데이터 및 폼의 저장된 이미지 사이의 임의의 오정렬을 결정하는 단계; 및 오정렬을 교정하기 위하여 잉크 데이터를 시프트하는 단계를 포함한다. 시스템은 디지타이저 (35), 및 사용자가 하나 이상의 식별 마크 (220, 230) 를 입력하는 위치를 나타내는 폼에 고유한 하나 이상의 미리 프린트한 지시자를 포함하는 미리 프린트한 폼 (45) 을 포함한다. 디지타이저 (35) 는, 폼위에 형성한 마크의 하나 이상의 디지털 이미지를 포함하며, 데이터 베이스에 결합되는 컴퓨터 프로세서에 이미지 데이터를 송신한다. 프로세서 (25) 는 사용자가 형성한 하나 이상의 식별 마크의 존재와 위치를 식별하고, 상기 하나 이상의 마크의 위치에 기초하여 폼을 식별한다.Provided are an automatic identification method and system for the pre-printed mark (45) based on the position of the mark (230) manually formed on the form (45). The method includes receiving ink image data 412; Identifying the presence and location of the mark 230 to determine any misalignment between the received ink data and the stored image of the form; And shifting the ink data to correct misalignment. The system includes a preprinted form 45 that includes a digitizer 35 and one or more preprinted indicators unique to the form indicative of where the user enters one or more identification marks 220, 230. Digitizer 35 includes one or more digital images of marks formed on the form and transmits the image data to a computer processor coupled to the database. The processor 25 identifies the presence and location of one or more identification marks formed by the user and identifies the form based on the location of the one or more marks.

Description

폼 인식 및 디지털 이미지 처리 방법 및 시스템 {A METHOD AND SYSTEM FOR FORM RECOGNITION AND DIGITIZED IMAGE PROCESSING}A METHOD AND SYSTEM FOR FORM RECOGNITION AND DIGITIZED IMAGE PROCESSING

디지타이저 장치에 위치하는 폼을 자동으로 식별하는 시스템들이 알려져 있다 (여기서 사용하는 용어 "폼" 은 실제 페이지 대신에 페이지에 프린트된 이미지를 가리키는 것으로서; 즉, 동일한 이미지로 프린트된 페이지가 2 개 있는 경우, 그들을 동일한 폼으로 간주한다) 예를들어, 미국특허번호 제5,869,789호 (Reid-Green) 는 디지타이저 시스템에 페이퍼 (paper) 를 올려놓을 때 페이퍼에 미리 코딩한 페이지 번호를 검출하는 페이지 인식 시스템을 설명하고 있다. 시스템은 페이지의 뒷면에 미리 코딩한 페이지 식별자를 검출하기 위하여 내장 스캐너를 사용한다. 미국특허번호 제5,555,101호 (Larson et al.) 는 팩시밀리가 수신한 폼에 대한 자동 페이지 인식 시스템을 설명하고 있으며, 여기서는 폼을 식별하기 위하여 미리 프린트된 패턴을 이용한다.Systems are known that automatically identify a form located on a digitizer device (the term "form" used herein refers to an image printed on a page instead of an actual page; that is, when there are two pages printed with the same image). For example, US Pat. No. 5,869,789 (Reid-Green) describes a page recognition system that detects pre-coded page numbers on paper when placing paper on a digitizer system. Doing. The system uses a built-in scanner to detect the precoded page identifier on the back side of the page. US Pat. No. 5,555,101 (Larson et al.) Describes an automated page recognition system for a form received by the facsimile, which uses a preprinted pattern to identify the form.

미국특허번호 제5,629,499호 (Flickinger et al.) 는 전자 클립보드를 개시하고 있으며, 그 위에 사용한 폼을 인식하는 2 가지 방법을 설명하고 있다. 제 1 방법에서는, 클립보드에 디스플레이된 다양한 폼 식별자들을 토글링하기 위해 토글 스위치 (toggle switch) 를 사용하며, 제 2 방법에서는, 바코드 판독기가 폼위에 미리 프린트한 바코드를 판독한다. 토글 디스플레이는, 클립보드가 새로운 폼 세트를 사용할 때마다 다시 프로그램해야하는 마이크로 프로세서를 포함할 것을 요구한다.U.S. Patent No. 5,629,499 (Flickinger et al.) Discloses an electronic clipboard and describes two methods of recognizing a form used thereon. In the first method, a toggle switch is used to toggle the various form identifiers displayed on the clipboard, and in the second method, the barcode reader reads a barcode previously printed on the form. The toggle display requires the clipboard to include a microprocessor that must be reprogrammed each time a new set of forms is used.

페이퍼위에 놓은 페이퍼 폼에 형성된 노테이션 (notation) 을 기록하는 디지털 노트패드가 알려져 있다. 예를들어, A.T.Cross Company 는 무선 송신을 이용하여 펜 이동을 디지털화하고 기록하는 휴대용 디지털 노트패드인 CrossPad (35; 도 1 참조) 를 시장화하였다. CrossPad 는 기록된 펜이동을 처리 및 분석용 퍼스널 컴퓨터에 송신한다. 그러나, CrossPad 자체는 미리 프린트한 폼을 식별할 수는 없다. CrossPad 가 기록하고 컴퓨터로 송신한 정보는, 단지 사용자가 폼위에 기록하여 입력한 펜 스트로크 (pen stroke) 를 포함한다. 폼위에 미리 프린트한 정보는 CrossPad 가 검출할 수는 없다. CrossPad 에는 사용자가 토글링할 수 있는 폼 ID 디스플레이가 없을 뿐만 아니라 바코드 리더도 없다.Digital notepads are known which record the notation formed in a paper form placed on paper. For example, A.T. Cross Company has marketed CrossPad (35; see FIG. 1), a portable digital notepad that digitizes and records pen movements using wireless transmission. CrossPad sends the recorded pen movements to the personal computer for processing and analysis. However, CrossPad itself cannot identify preprinted forms. The information recorded by CrossPad and transmitted to the computer only includes pen strokes entered and recorded by the user on the form. Preprinted information on the form cannot be detected by CrossPad. CrossPad has no form ID display that can be toggled by the user, nor does it have a barcode reader.

CrossPad 와 같은 장치들은 사용자가 입력한 정보만을 검출하기 때문에, 이들 장치는 일반적으로 미리 프린트한 정보에 기초하여 폼을 식별하는 시스템에서는 사용할 수 없다. 디지타이저에 다수의 폼이 있는 경우, Reid-Green 에 개시된 것과 같은 시스템도 폼 식별 정보 (form identification information) 를 검출할수는 없다. 예를들어, Reid-Green 은 스택 바닥에 있는 폼만을 식별한다. Flickinger et al. 에서 설명하고 있는 장치는 다수의 페이지들을 판독할 수는 있으나, CrossPad 형 장치에는 없는 추가적인 (고가의) 폼 판독 메카니즘을 필요로 한다. 이런 바코드 판독기 또는 다른 폼 판독 메카니즘을 디지타이저에서 사용함으로써, 디지타이저의 비용과 무게가 증대된다.Because devices such as CrossPad only detect user-entered information, these devices are generally not available in systems that identify forms based on preprinted information. If there are multiple forms in the digitizer, even systems such as those described in Reid-Green cannot detect form identification information. For example, Reid-Green only identifies the foam at the bottom of the stack. Flickinger et al. The device described in Figure 2 can read multiple pages, but requires an additional (expensive) form reading mechanism not found in CrossPad-type devices. By using such a barcode reader or other form reading mechanism in the digitizer, the cost and weight of the digitizer is increased.

CrossPad 형 장치의 다른 단점은 페이퍼 폼에 기록한 입력 마크들의 공간적인 관계가 밑에 있는 "디지털 폼 (digital form)" 위의 대응하는 디지털 마크들의 공간적 관계와 동일하지 않다는 것이다. 이 오프셋 ("디지털 드리프트") 은 수 밀리미터가 될 수도 있다.Another disadvantage of the CrossPad type device is that the spatial relationship of the input marks written on the paper form is not the same as the spatial relationship of the corresponding digital marks on the underlying "digital form." This offset (“digital drift”) may be several millimeters.

CrossPad 형 장치의 또다른 단점은, 폼을 사용시 폼에 미리 프린트한 정보는 업로드되는 디지털 잉크 파일 (digital ink file) 의 일부분이 아니라는 사실에 있다. 업로드후 디지털 잉크 파일을 선택적으로 사용하기 위해, 사용시 페이퍼폼에 있는 문맥정보 (contextual information) 이미지를 디지털 잉크 이미지에 추가시킬 필요가 있다. 원본 폼의 이미지를 그 위에 기록한 정보와 함께 재생성할 수 있도록, 2 개의 이미지를 정확하게 정렬시켜야 한다.Another disadvantage of CrossPad type devices is the fact that when using the form, the information preprinted on the form is not part of the digital ink file that is uploaded. In order to selectively use a digital ink file after uploading, it is necessary to add the contextual information image in the paper form to the digital ink image. The two images must be correctly aligned so that the image of the original form can be reproduced with the information recorded on it.

따라서, 폼위에 미리 프린트한 정보에 의존하지 않고, CrossPad 및 유사 장치에서 사용하는 폼을 인식할 수 있는 자동화된 폼 인식 시스템이 요청되고 있다.Thus, there is a need for an automated form recognition system that can recognize forms for use in CrossPad and similar devices without relying on information preprinted on the form.

또한, 불필요한 LCD 디스플레이 (프로그램가능 마이크로프로세서와 함께) 와 토글 스위치 또는 다른 입력 장치를 CrossPad 형 전자 클립보드에 통합할 필요가 없는 시스템이 요청되고 있다.There is also a need for a system that eliminates the need for integrating unnecessary LCD displays (with programmable microprocessors), toggle switches or other input devices into the CrossPad-type electronic clipboard.

또한, CrossPad 형 장치와 다른 디지타이저에 대한 디지털 드리프트 (digital drift) 를 교정하는 방법 및 시스템이 요청되고 있다. 폼위의 수기 정보의 디지털 잉크 이미지를 밑에 있는 폼 이미지와 결합시키고 정렬하는 방법이 요청되고 있다.There is also a need for a method and system for correcting digital drift for CrossPad type devices and other digitizers. There is a need for a method of combining and aligning a digital ink image of handwritten information on a form with an underlying form image.

본 발명은 일반적으로 디지타이저 장치를 사용한 데이터 엔트리 (entry) 에 관한 것으로서, 보다 구체적으로는 디지타이저 (digitizer) 에 위치하는 폼을 식별하며 디지타이저 패드에 대한 디지털 이미지 오프셋을 결정하고 교정하는 시스템 및 방법에 관한 것이다.FIELD OF THE INVENTION The present invention relates generally to data entry using digitizer devices, and more particularly to systems and methods for identifying forms located on digitizers and for determining and correcting digital image offsets to digitizer pads. will be.

도 1 은 바람직한 디지타이저 시스템의 실시형태의 구성을 나타낸다.1 shows a configuration of an embodiment of a preferred digitizer system.

도 2 와 도 3 은 본 발명의 바람직한 실시형태에서 사용하는 데이터 컬렉션 폼 (data collection form) 을 나타낸다.2 and 3 show a data collection form for use in a preferred embodiment of the present invention.

도 4 는 디지털 데이터를 처리하는 소프트웨어의 동작을 나타내는 플로우차트이다.4 is a flowchart showing the operation of software for processing digital data.

도 5 와 도 6 은 폼 인식 소프트웨어의 동작을 나타내는 플로우 차트이다.5 and 6 are flow charts illustrating the operation of the form recognition software.

도 7 은 본 발명의 바람직한 실시형태에서 사용하는 존의 배치를 나타낸다.Fig. 7 shows the layout of the zones used in the preferred embodiment of the present invention.

도 8 은 본 발명의 바람직한 실시형태에서 사용하는 그래픽 사용자 인터페이스를 나타낸다.8 shows a graphical user interface for use in a preferred embodiment of the present invention.

도 9 는 바람직한 실시형태에서 사용하는 주요 폼 정렬처리 단계들을 나타낸다.9 shows the main form alignment steps used in the preferred embodiment.

도 10 은 바람직한 실시형태에서 사용하는 좌표정의를 나타낸다.10 shows coordinate definitions used in the preferred embodiment.

도 11 은 바람직한 실시형태의 잉크버블중심 위치파악 처리 (locate-ink-bubble-center process) 를 나타낸다.Fig. 11 shows a location-ink-bubble-center process of a preferred embodiment.

도 12 는 바람직한 실시형태의 정렬 이미지 인식처리 (recognize-alined-image process) 를 나타낸다.12 illustrates a recognized-alined-image process of the preferred embodiment.

도 13 은 바람직한 실시형태의 정렬 잉크의 기준이미지와의 결합 처리 (merge-aligned-ink-with-reference-image process) 를 나타낸다.Fig. 13 shows a merge-aligned-ink-with-reference-image process of the alignment ink of the preferred embodiment.

도 14 는 바람직한 실시형태의 폼 식별 처리를 나타낸다.14 shows the form identification processing of the preferred embodiment.

도 15 는 바람직한 실시형태의 폼 식별자 템플릿을 나타낸다.15 shows a form identifier template of a preferred embodiment.

도 16 은 3 면 페이퍼 가이드를 갖는 디지타이저 패드를 나타낸다.16 shows a digitizer pad having a three-sided paper guide.

본 발명은 미리 프린트한 폼에 매뉴얼식으로 (manually) 형성한 마크의 존재와 위치를 식별하는 단계; 및 마크의 위치를 데이터 베이스에 리스트된 폼 및 식별 마크의 대응위치와 비교함으로써 미리 프린트한 폼을 식별하는 단계를 포함하는 것을 특징으로 하는 미리 프린트한 폼의 자동 식별 방법을 포함한다. 또한, 본 발명은 디지타이저; 사용자가 하나 이상의 식별 마크를 입력해야할 위치를 나타내는 폼에 고유한 하나 이상의 미리 프린트한 지시자를 포함하는 미리 프린트한 폼; 및 폼위에 형성한 마크들의 하나 이상의 디지털 이미지를 수신하고, 사용자가 형성한 하나 이상의 식별 마크의 존재 및 위치를 식별하고, 상기 하나 이상의 마크의 위치를 데이터 베이스에 리스트된 폼 및 식별 마크의 대응 위치와 비교하는, 이터베이스와 결합된 컴퓨터 프로세서를 구비하는 것을 특징으로 하는 미리 프린트한 폼 식별 시스템을 포함한다. 또한, 본 발명은 미리 프린트한 폼에 매뉴얼식으로 형성한 마크의 위치를 나타내는 데이터를 수신하고 저장하는 소프트웨어, 및 상기 마크의 위치를 데이터 베이스에 리스트된 폼 및 식별 마크의 대응 위치와 비교함으로써 상기 폼을 식별하는 소프트웨어를 포함하는 것을 특징으로 하는 미리 프린트한 폼의 자동식별 컴퓨터 소프트웨어를 포함한다.The present invention includes the steps of identifying the presence and position of a mark (manually) formed on a preprinted form; And identifying the preprinted form by comparing the position of the mark with a corresponding position of the form and the identification mark listed in the database. In addition, the present invention is a digitizer; A preprinted form including one or more preprinted indicators unique to the form indicating where the user should enter one or more identification marks; And receiving one or more digital images of the marks formed on the form, identifying the presence and position of one or more identification marks formed by the user, and corresponding positions of the forms and identification marks listed in the database for the positions of the one or more marks. A pre-printed form identification system, characterized in that it has a computer processor coupled with the database, for comparison. The present invention also provides software for receiving and storing data indicating positions of marks manually formed on a preprinted form, and comparing the positions of the marks with corresponding positions of the forms and identification marks listed in the database. Automatic identification computer software of a preprinted form, characterized in that it comprises software for identifying the form.

또한, 본 발명은 디지털 드리프트를 교정하고 디지털 잉크 파일을 디지털 폼상에 매핑하는 방법을 포함한다. 일반적으로 디지타이저 패드 (예를들어, CrossPad 또는 유사장치) 는 일정양의 디지털 드리프트를 겪게된다 - 페이퍼 폼위의 기록의 상대 위치와 밑에 있는 디지털 폼위의 대응하는 디지털 마크의 상대위치 사이의 공간적인 차이. 디지털 드리프트의 양과 방향은 각각의 패드 (및 주어진 폼위의 임의의 위치) 에 대하여 일정하지만, 일반적으로 패드에 따라서 변화한다.The invention also includes a method of correcting digital drift and mapping a digital ink file onto a digital form. Digitizer pads (such as CrossPads or similar devices) typically experience a certain amount of digital drift-the spatial difference between the relative position of the recording on the paper form and the corresponding position of the corresponding digital mark on the underlying digital form. The amount and direction of the digital drift is constant for each pad (and any position on a given form), but generally varies with the pad.

바람직한 실시형태의 소프트웨어는 주어진 폼위의 알려진 랜드마크 (landmark) 를 기준으로 디지털 드리프트의 양과 방향을 결정한다. 바람직하게, 이런 랜드마크는아래에서 설명하는 폼 식별마크이다. 바람직한 실시형태에서, 폼 식별자는 원형이다. 페이퍼 폼위의 폼 식별자 원 중심의 알려진 위치를 그 아래의 디지털 폼위의 대응하는 디지털 마크의 중심과 비교한 후, 수평 및 수직 방향에서의 변화를 결정함으로써, 디지털 드리프트를 결정한다. 일단 디지털 드리프트를 결정하면, 그것은 폼 위의 모든 디지털 마킹에 대한 교정인자로서 인가된다.The software of the preferred embodiment determines the amount and direction of the digital drift based on known landmarks on a given form. Preferably, this landmark is a form identification mark as described below. In a preferred embodiment, the form identifier is circular. The digital drift is determined by comparing the known position of the form identifier circle center on the paper form with the center of the corresponding digital mark on the digital form below and determining the change in the horizontal and vertical directions. Once digital drift is determined, it is applied as a calibration factor for all digital markings on the form.

바람직하게, 이 교정 인자는 수기 디지털 잉크 이미지와 밑에 있는 폼의 이미지와의 정렬을 가능하게 하기 위해 사용된다. 이 정렬은 디지털 잉크 데이터가 기록된 폼을 우선 식별함으로써 달성된다. 그후, 식별된 폼의 미리로드된 이미지가 데이터베이스로부터 검색된다. 교정 인자는 잉크 데이터를 디지털 폼과 정렬하기 위하여 사용된다. 디지털 폼과 디지털 잉크의 정확한 정렬은 폼을채울 때 나타나는 페이퍼 폼의 복제를 가능하게 한다. 또한, 정확한 정렬은 복합 이미지가 광마크 인식 (OMR), 광문자 인식 (OCR), 및 데이터베이스로의 이미지 단편 저장 (image snippet storage) 에 의해 처리될 수 있게 한다.Preferably, this correction factor is used to enable alignment of the handwritten digital ink image with the image of the underlying foam. This alignment is achieved by first identifying the form in which the digital ink data is recorded. Then, the preloaded image of the identified form is retrieved from the database. Calibration factors are used to align the ink data with the digital form. Accurate alignment of digital forms and digital inks allows for the reproduction of paper forms that appear when filling in forms. In addition, correct alignment allows composite images to be processed by optical mark recognition (OMR), optical character recognition (OCR), and image snippet storage into a database.

또한, 본 발명은 위에 미리 프린트한 폼 식별 마크를 갖지 않았던 폼의 식별을 가능하게 하는 방법과 시스템을 포함한다. 본 발명의 이 양태의 바람직한 실시형태에서는, 다양하게 선택된 가이드의 위치에 위치하는 3 밀리미터 홀을 갖는 금속 또는 플라스틱 가이드가 디지타이저 패드의 일면에 부착된다. 바람직하게는, 가이드가 고객과 관련된 소정 위치에 설치된다. 가이드를 소정의 위치에 있는 패드면에 고정시킴으로써, 사용자는 홀에 마크를 형성할 수 있고, 여기서 홀의 위치는 미리 프린트한 마크가 가질수 있는 위치에 대응한다. 즉, 마크는 미리 프린트한 폼 식별 원을 채운 마크가 갖는 것과 동일한 위치를 갖는다. 이는 폼 식별 마크로 프린트되지 않는 미리 프린트한 폼을 갖는 고객이 개시한 시스템의 나머지에 있는 그들 폼을 사용할 수 있게 한다.The present invention also includes a method and system for enabling the identification of forms that did not have a form identification mark previously printed above. In a preferred embodiment of this aspect of the invention, a metal or plastic guide having three millimeter holes located at the positions of the various selected guides is attached to one side of the digitizer pad. Preferably, the guide is installed at a predetermined position relative to the customer. By fixing the guide to the pad surface at a predetermined position, the user can form a mark in the hole, where the position of the hole corresponds to a position that the preprinted mark can have. In other words, the mark has the same position as the mark that has filled the preprinted form identification circle. This makes it possible to use those forms in the rest of the system disclosed by the customer with preprinted forms that are not printed with the form identification mark.

바람직한 실시형태에서, 본 시스템 및 방법은 CrossPad 와 같은 디지타이저 (35), 미리 프린트한 폼 (45; pre-printed form), 퍼스널 컴퓨터 (25), 및 관련 소프트웨어를 구비하는 도 1 에 나타낸 디지타이저 시스템과 함께 사용한다. 참고상의 편의를 위해, 용어 "CrossPad" 는 본 발명을 이용할 수 있는 임의의 디지타이저 패드 (digitizer pad) 를 가리킨다. 당업자는 폼을 디지타이저 영역 (digitizer field) 에 놓을 수 있는 임의의 디지타이저 시스템에 본 시스템과 방법을 이용할 수 있음을 알 수 있다. 또한, 본 명세서에서 용어 "폼 (form) " 은 페이퍼위에 프린트한 폼을 지칭하기 위하여 사용하고 있으나, 당업자는 개시한 시스템과 방법을 다른 매체에서 구현한 폼에서 동일하고 사용할 수 있음을 알 수 있다. 예를들어, 개시한 발명은 California, Palo Alto 소재의 Xerox Corportion 이 개발한 "Gyricon" 또는 Massachusetts, Cambridge 소재의 E Ink Corporation 이 개발한 유사 제품과 같은 플라스틱 래미네니트 (laminate) 또는 "전자 페이퍼 (electric paper)" 에서도 동작한다.In a preferred embodiment, the present system and method includes the digitizer system shown in FIG. 1 having a digitizer 35 such as CrossPad, a pre-printed form 45, a personal computer 25, and associated software. Use together. For convenience of reference, the term "CrossPad" refers to any digitizer pad that can utilize the present invention. Those skilled in the art will appreciate that the system and method can be used with any digitizer system that can place the form in a digitizer field. In addition, although the term “form” is used herein to refer to a form printed on paper, those skilled in the art can recognize that the disclosed systems and methods may be the same and used in forms embodied in other media. . For example, the disclosed invention is a plastic laminate or "electronic paper" such as "Gyricon" developed by Xerox Corportion, Palo Alto, California, or similar products developed by E Ink Corporation, Massachusetts, Cambridge. electric paper) ".

도 1 에 나타낸 디지타이저 시스템의 일반적인 동작은 다음과 같다. 미리 프린트한 데이터 컬렉션 폼 (45) 을 CrossPad 디지타이저 (35) 위에 위치시킨다. CrossPad (35) 가 필요로 하는 특수펜을 사용하여, 사용자는 폼 (45) 위에 마크를 한다. 폼 (45) 위에 형성한 마크를 Crosspad (35) 가 디지털 이미지로서 기록한다. 사용자는 CrossPad (35) 를 컴퓨터 (25) 에 접속시키고, CrossPad (35) 는 저장한 이미지를 컴퓨터 (25) 에 송신한다. 다른 실시형태에서, CrossPad 는 Crosspad 데이터를 인터넷 호환 포맷 (Internet-compatible format) 으로 변환하는 컨버터에 접속되며, 변환된 CrossPad 데이터를 컨버터에 의해 인터넷을 경유하여 원격지에 위치한 컴퓨터로 송신한다. 일 실시형태에서는, 그후, 컴퓨터 (25) 에 저장된 Crosspad 이미지를 컴퓨터에 저장된 소프트웨어에 의해 처리한다. 바람직한 실시형태에서 사용하는 폼과 소프트웨어를 이하 설명한다.The general operation of the digitizer system shown in FIG. 1 is as follows. Place the preprinted data collection form 45 on the CrossPad digitizer 35. Using a special pen required by CrossPad 35, the user marks on form 45. The mark formed on the form 45 is recorded by the Crosspad 35 as a digital image. The user connects the CrossPad 35 to the computer 25, and the CrossPad 35 transmits the stored image to the computer 25. In another embodiment, CrossPad is connected to a converter that converts Crosspad data into an Internet-compatible format, and transmits the converted CrossPad data to a remotely located computer via the internet by the converter. In one embodiment, the Crosspad image stored on computer 25 is then processed by software stored on the computer. Forms and software used in the preferred embodiment are described below.

도 2 는 바람직한 실시형태에서 사용하는 제 1 데이터 켈렉션 폼 (45) 을 나타낸다. 폼의 좌측여백 영역 (210) 은 폼 식별용으로 남겨두었다. "Start Here" 지시 (225) 는 사용자에게 폼 식별자용 표시자 (230) 를 채울 것을 상기시킨다 (원은 지시자 (indicator) 를 가리키고, 원을 채워서 만든 마크는 폼 식별자 (form identifier) 이다). 각각의 서로 다른 폼에 대하여, 폼 식별자 표시자 (230) 는 영역 (210) 에서 다른 존 (zone) 에 위치한다.2 shows a first data collection form 45 for use in the preferred embodiment. The left margin area 210 of the form is reserved for foam identification. The "Start Here" instruction 225 reminds the user to fill the indicator 230 for the form identifier (the circle points to an indicator and the mark created by filling the circle is the form identifier). For each different form, form identifier indicator 230 is located in a different zone in area 210.

바람직한 실시형태에서 사용하는 폼은, 그들이 하나 이상의 데이터 엔트리 시스템 (data-entry system) 에서 사용할 수 있도록 프린트된다. 예를들어, 폼 우측하단의 조준 십자선 이미지 (cross-hair image; 215) 와 폼 우측하단의 조준 십자선 이미지 (220) 를, 광스캐너로 스캔하는 경우, 폼의 이미지를 정렬하기 위해서 사용한다.Forms used in the preferred embodiment are printed so that they can be used in one or more data-entry systems. For example, the cross-hair image 215 at the bottom right of the form and the crosshair image 220 at the bottom right of the form are used to align the image of the form when scanning with a light scanner.

도 3 은 바람직한 실시형태에서 사용하는 제 2 데이터 컬렉션 폼을 나타낸다. 도 3 의 폼은 바람직한 실시형태에서 사용하는 폼의 형상을 보다 명확하게 나타내기 위해서 참조번호없이 나타내었다. 도 3 의 폼위의 폼 식별자 지시자는, 영역 (210) 에서 폼위의 폼 식별자 지시자와는 다른 존에 위치한다.3 shows a second data collection form for use in the preferred embodiment. The foam in Fig. 3 is shown without reference numerals in order to more clearly show the shape of the foam used in the preferred embodiment. The form identifier indicator on the form of FIG. 3 is located in a different zone in area 210 than the form identifier indicator on the form.

바람직하게, 폼위에 기록을 시작할 때마다 사용자는 폼 식별자 지시자를 채운다. 그러나, 에러를 줄이기 위하여, 제 2 사용자에게 CrossPad 를 건네기 전에 제 1 사용자는 복수의 지시자들을 채우고자 한다. 예를들어, 제 1 사용자는 모든 폼에 대한 지시자를 포함하는 템플릿을 사용할 수 있다. 폼 1, 3, 및 6 을 사용하는 경우, 제 1 사용자는 템플릿을 CrossPad 위에 놓고서, 폼 1 에 대한지시자를 채우며, CrossPad 의 Next Page 버튼을 누르고, 폼 3 에 대한 지시자를 채우고, Next Page 지시자를 다시 누르며, 폼 6 에 대한 지시자를 채운다. 그후, 제 1 사용자는 Back Page 버튼을 2 번 누르고, 폼 1, 3, 및 6 을 위에 클립한채로 CrossPad 를 제 2 사용자에게 전달한다. 그후, 제 2 사용자는 고유한 식별자 지시자를 채울 필요없이 폼 1, 3, 및 6 을 채울수 있다 (폼에서 폼으로 이동하는 경우에는, 제 2 사용자는 Next 및 Back page 버튼을 여전히 눌러야 한다).Preferably, whenever a user starts recording on the form, the user fills in the form identifier indicator. However, to reduce the error, the first user wants to fill a plurality of indicators before handing the CrossPad to the second user. For example, a first user can use a template that includes indicators for all forms. When using Forms 1, 3, and 6, the first user places the template on CrossPad, fills the indicator for Form 1, presses the CrossPad's Next Page button, fills in the indicator for Form 3, and next Page indicator. Click again to fill in the indicators for Form 6. The first user then presses the Back Page button twice and delivers the CrossPad to the second user with the forms 1, 3, and 6 clipped on. Thereafter, the second user can fill in Forms 1, 3, and 6 without having to fill in the unique identifier indicator (when moving from form to form, the second user must still press the Next and Back page buttons).

도 4 는 바람직한 실시형태에서 사용하는 소프트웨어의 동작을 나타낸 플로우차트이다. 폼 식별자 지시자 (230) 를 Crosspad (35) 의 사용자가 채우는 경우, 폼 식별자의 이미지와 위치는 사용자가 폼위에 기록한 임의의 다른 정보에 대한 이미지 및 위치 데이터와 함께, CrossPad 메모리에 저장된다. 데이터를 저장하기 위해 임의의 적절한 포맷을 사용할 수도 있지만, CrossPad 는 정보를 IBM 이 독점하는 데이터 포맷인 "잉크 데이터 (ink data)" 로서 저장한다. 일반적으로, 여기서는 이 데이터를 잉크 데이터라고 지칭한다.4 is a flowchart showing the operation of the software used in the preferred embodiment. When the user of the Crosspad 35 fills in the form identifier indicator 230, the image and location of the form identifier is stored in CrossPad memory, along with the image and location data for any other information the user has written on the form. Although any suitable format may be used to store the data, CrossPad stores the information as "ink data", an IBM proprietary data format. In general, this data is referred to herein as ink data.

단계 410 에서, 사용자는 퍼스널 컴퓨터에 부착된 시리얼 접속 케이블 (적외선, 이더넷, 또는 다른 접속 장치도 사용할 수 있지만) 에 CrossPad 를 플러그인시킨 후, CrossPad 의 버튼을 누름으로써, 수집된 잉크 데이터를 퍼스널 컴퓨터에 업로드한다. 다른 실시형태에서는, 먼저 잉크 데이터를 컨버터로 전달하고, 컨버터는 이 데이터를 바람직하게는 인터넷을 통하여 원격지에 위치하는 컴퓨터에 송신한다. 원격지에 위치하는 컴퓨터는 퍼스널 컴퓨터일 수 있으나, 컴퓨터는 복수의 소스로부터 데이터를 수신해야하므로 바람직하게는 서버급 컴퓨터 (예를들어,인터넷 서버) 이다.In step 410, the user plugs in the CrossPad to a serial connection cable (although infrared, Ethernet, or other connection device may be used) attached to the personal computer, and then presses the button of the CrossPad to transfer the collected ink data to the personal computer. Upload. In another embodiment, ink data is first delivered to a converter, which transmits this data to a computer located remotely, preferably via the Internet. The remotely located computer may be a personal computer, but the computer is preferably a server-class computer (eg, an internet server) because it must receive data from a plurality of sources.

단계 412 에서, 퍼스널 컴퓨터에 저장된 잉크 전달 프로그램은 전달된 잉크 데이터를 수신하며, 단계 415 에서 데이터를 컴퓨터의 하드 드라이브에 잉크 데이터 파일로서 저장한다. 바람직한 실시형태에서는, Crosspad 가 공급된 IBM 잉크 매니저 전달 프로그램 (IBM Ink Manager Transfer Program) 이 이 단계를 수행하며, "노트북 (notebook)" 으로 알려진 파일을 생성한다.In step 412, the ink delivery program stored in the personal computer receives the delivered ink data, and in step 415 stores the data as an ink data file on the hard drive of the computer. In a preferred embodiment, the IBM Ink Manager Transfer Program supplied with Crosspad performs this step and creates a file known as a "notebook."

잉크 데이터 파일을 업로드한 후에, 잉크 전달 프로그램은 단계 417 에서 잉크 컨버터 프로그램 (여기서는 TMDInkExec 라고 함) 을 시작한다. 단계 420 에서, TMDInkExec 는 업로드한 잉크 데이터 파일을 판독하고, IBM 제공 라이브러리, IBM 전기 잉크 SDK (IBM Electric Ink SDK) 에 포함된 잉크 변환 모듈을 지시하여 각각의 잉크 페이지를 비독점적인 이미지 파일 (예들들어, 그룹 4 TIFF 이지만 다른 포맷도 사용할 수 있음) 로 변환한다. TMDInkExec 는 IBM 전기 잉크 SDK 에 포함된 문서내에 있는 명령에 따라서 적절한 잉크 변환 모듈들을 지시한다. 다른 실시형태에서는, 단계 420 에서의 노트북 포맷으로부터 비독점적인 이미지 포맷으로의 변환은 원격지 컴퓨터에서도 행할 수 있으며; 예를들어 이메일이나 파일 전송 프로토콜 (file transfer protocol) 을 이용하여 잉크 데이터를 원격 컴퓨터에 전달할 수 있으며, 그후 원격지 컴퓨터 (또는 컴퓨터들) 는 다수의 수신 큐 (예를들어, 이메일 박스) 를 조사하며, 수신한 잉크 데이터의 수신 배치를 처리하는 단계 420 을 수행한다.After uploading the ink data file, the ink delivery program starts an ink converter program (here called TMDInkExec) in step 417. In step 420, TMDInkExec reads the uploaded ink data file and instructs the ink conversion module included in the IBM-supplied library, IBM Electric Ink SDK, to copy each ink page to a non-exclusive image file (e.g., For example, group 4 TIFF, but other formats can be used). TMDInkExec points to the appropriate ink conversion modules according to the instructions in the document contained in the IBM Electro Ink SDK. In another embodiment, the conversion from notebook format to non-proprietary image format in step 420 can also be performed at the remote computer; For example, the ink data can be delivered to a remote computer using e-mail or a file transfer protocol, and the remote computer (or computers) then examines a number of receive queues (e.g., email boxes). In step 420, the receiving batch of the received ink data is processed.

단계 420 의 완료시, 단계 422 에서 TMDInkExec 프로그램은 제 2 프로그램인TMDInkMonitor 에 TIFF 데이터를 더 처리하라고 통지한다. 단계 424에서, TMDInkMonitor 프로그램은 사용자가 대상 ID 를 잉크 데이터 파일의 페이지 배치 (page batch) (예를들어, 페이지가 특정 환자에 대하여 채워진 폼일 경우, 환자의 ID 를 입력할 수 있다) 에 선택적으로 할당하거나 확인하도록 그래픽 인터페이스를 디스플레이한다. 스캐너를 CrossPad 대신에 사용하는 경우에는, 대상 ID 라벨을 폼에 첨부하고, 인식하며, 인식한 번호를 시스템이 할당한다. 대상 ID 를 사용자가 할당하지 않는 경우 (그리고 CrossPad 에 의해 기록되지 않은 경우), TMDInkMonitor 프로그램은 디폴트 대상 ID 를 할당한다 (바람직하게는 1 만큼 증가한 이전 대상의 ID).Upon completion of step 420, in step 422 the TMDInkExec program notifies the second program TMDInkMonitor to further process the TIFF data. In step 424, the TMDInkMonitor program optionally assigns a target ID to a page batch of ink data files (e.g., if the page is a filled form for a particular patient, the patient's ID can be entered). Or display the graphical interface for confirmation. When using a scanner instead of CrossPad, attach the target ID label to the form, recognize it, and assign the recognized number to the system. If you do not assign a target ID (and not recorded by CrossPad), the TMDInkMonitor program assigns a default target ID (preferably the ID of the previous target, incremented by 1).

배치 업로드 ID (batch upload ID) 는 단계 426 에서 TIFF 이미지 파일의 대응 배치에 할당되고, 단계 428 에서는 TIFF 데이터이 배치 업로드 ID 와 대상 ID 하에서 데이터베이스에 기록된다. 그후, TIFF 이미지 파일이 데이터베이스로부터 카피되고, 단계 430 에서 OMR (광학식 마크 판독 또는 광학식 마크 인식) 을 이용하여 이미지를 인식 데이터로 변환하는 인식 엔진에 의해 처리된다. 인식 엔진은, 서비스하는 이미지 데이터를 컴퓨터 판독가능 텍스트로 변환 (인식) 하는 것과 관련된 다른 소프트웨어 모듈 또는 프로그램으로 서비스의 문서화된 세트를 제공하는 소프트웨어이다. Calofornia Los Gatos 소재의 Caere Corporation 에서 판매하고 있는 Caere Developer's Kit 2000 Recognition Engine 를 바람직한 실시형태에서 사용하고 있지만, 다양한 인식 엔진 (예를들어, California, San Diego 소재의 Mitek Systems, Inc. 제품, 그리고 Minnesota Minneapolis 소재의 NationalComputer Systems, Inc. 제품) 이 상업적으로 입수가능하며 당업자도 이들을 바람직한 실시형태에서 사용할 수 있다.The batch upload ID is assigned to the corresponding batch of TIFF image file in step 426, and in step 428 TIFF data is recorded in the database under the batch upload ID and the destination ID. The TIFF image file is then copied from the database and processed by the recognition engine to convert the image into recognition data using OMR (optical mark reading or optical mark recognition) at step 430. The recognition engine is software that provides a documented set of services to other software modules or programs that are involved in converting (recognizing) the service image data into computer readable text. Although the Caere Developer's Kit 2000 Recognition Engine, sold by Caere Corporation of Los Gatos, Calofornia, is used in preferred embodiments, a variety of recognition engines (eg, Mitek Systems, Inc., San Diego, Calif., And Minnesota Minneapolis) are used. National Computer Systems, Inc., commercially available, and those skilled in the art can use them in preferred embodiments.

단계 432 에서, TMDInkMonitor 는 인식 데이터에 대응하는 폼 ID 를 차례로 구동하는 폼 ID 결정 모듈을 지시한다. 폼 ID 결정 모듈이 수행하는 단계를 도 5 와 도 6 에 나타내었다.In step 432, the TMDInkMonitor instructs the form ID determination module to sequentially drive the form ID corresponding to the recognition data. 5 and 6 illustrate the steps performed by the form ID determination module.

폼 ID 결정 모듈은 OMR 인식 모듈과 OMR 채우기법 (OMR filling method) 을 이용한다. 인식 모듈은 인식 엔진의 사양과 일치하며, 서로 다른 유형의 이미지 데이터들을 컴퓨터 판독가능 텍스트로 변환하는 소프트웨어이다. 채우기법은 존 내에 발생할 것으로 예상되는 이미지 데이터의 유형을 명시한다. 일부 채우기법은 하나의 인식 모듈과 관련되고; 일부는 하나 이상의 인식모듈에 의해 지원된다. 채우기법의 일부예는 다중 폰트 머신 프린트, OMR, 핸드 프린트, 바코드, 도트매트릭스 프린팅, OCRA, 및 브라유 점자범 (Braille) 이다.The form ID determination module uses an OMR recognition module and an OMR filling method. The recognition module is software that conforms to the specifications of the recognition engine and converts different types of image data into computer readable text. The fill method specifies the type of image data expected to occur in the zone. Some fill methods are associated with one recognition module; Some are supported by one or more recognition modules. Some examples of filling methods are multi-font machine printing, OMR, hand print, bar code, dot matrix printing, OCRA, and Braille.

존 (zone) 은 사용자가 흥미를 갖는 특성을 포함하는 전체 페이지 사이즈까지의 이미지내 영역이다. 바람직한 실시형태에서, 존은 직사각형이지만, 당업자는 다른 형상의 존도 사용할 수 있음을 알 수 있다. 존들이 커버하는 이미지 데이터는 별개로서 취급 및 처리된다. 일반적인 존 유형은 그래픽 (비인식), 텍스트, 또는 바코드나 OMR 등일 수 있다. 존 영역들내의 이미지 데이터를 인식할 수 있도록, 각각의 존에는 존이 포함할 예상 정보에 기초한 특성 (property) 이 부여된다. 기본적인 존 특성은 x-y 좌표, 사이즈, 인식 모듈, 필터, 언어사전(language dictionary), 및 사용자 사전 (user dictionary) 이다. 언어사전은 언어의 사전적 요소와 그들로부터 워드 (word) 를 생성하는 규칙을 포함하는 파일이다. 이 파일은 인식된 텍스트의 비사전 워드 (non-dictionary words) 를 마크하거나 비사전 워드를 적절한 어휘로 변경시키기 위해 이용할 수 있다. 일부 인식 모듈은 언어 사전을 참조하여 그들의 인식결정을 돕는다. 사용자 사전은 워드, 스트링 (string), 및 문자 패턴을 정의하는 규칙적 표현의 리스트를 포함하며, 언어 사전 파일의 내용을 보충한다. 하나 이상의 사용자 사전이 특정 존과 관련될 수 있다. 사용자 사전내의 규칙적 표현은, 존내의 하나 이상의 문자 위치가 인식 정확도를 향상시키는 데 유효한 문자 등급, 범위 또는 개별 문자를 명시함으로써, 문자의 허용가능 패턴을 정의한다. 또한, 규칙적 표현을 마크 또는 패턴이라고도 부른다. 일반적으로, 규칙적인 표현은 일반적으로 어떻게든 예측가능한 폼유형 상황 (form-like situation) 에서 사용한다.A zone is an area in an image up to the full page size that contains features that interest the user. In a preferred embodiment, the zone is rectangular, although one skilled in the art will appreciate that other shaped zones may be used. Image data covered by zones is handled and processed separately. Common zone types may be graphical (unrecognized), text, or barcodes or OMRs. In order to be able to recognize the image data in the zone areas, each zone is given a property based on the expected information to be included in the zone. Basic zone properties are x-y coordinates, size, recognition module, filter, language dictionary, and user dictionary. A language dictionary is a file that contains the dictionary elements of a language and the rules for generating words from them. This file can be used to mark non-dictionary words of recognized text or to convert non-dictionary words into appropriate vocabulary. Some recognition modules refer to language dictionaries to help determine their recognition. The user dictionary contains a list of regular expressions that define words, strings, and character patterns, and supplements the contents of the language dictionary file. One or more user dictionaries may be associated with a particular zone. The regular expression in the user dictionary defines an acceptable pattern of characters by specifying a character class, range or individual character in which one or more character positions in the zone are effective to improve recognition accuracy. Regular expressions are also called marks or patterns. In general, regular expressions are generally used in some predictable form-like situations.

폼식별 존 템플릿 (Form Identification Zone Template) (또는 FIZT) 은 이미지로부터 폼을 식별하는 데 이용한다. 존 템플릿은, 추후 검색와 처리를 위해서 디스크 파일이나 데이터베이스 레코드 등의 매체에 명시되고 저장된 일련의 존 및 페이지 특성 (예를들어, 인식될 폼에 대응함) 이다. FIZT 는 그리그 패턴 (grid pattern) 으로 레이아웃된 일련의 존으로 이루어진다 (도 7 참조). 인식 결과를 향상시키기 위해서 존 레벨 또는 폼 레벨중의 하나에서 필터를 사용할 수 있다. 필터는, 특정 카테고리의 문자가 가능 유효 결과로 간주되는 것을 제거하기 위한 사양이다. 예를들어, 필터는 숫자 (digits only) , 대문자, 소문자, 구두점을 포함할 수 있다.Form Identification Zone Template (or FIZT) is used to identify forms from images. Zone templates are a set of zone and page features (e.g., corresponding to a form to be recognized) that are specified and stored on media such as disk files or database records for later retrieval and processing. FIZT consists of a series of zones laid out in a grid pattern (see FIG. 7). You can use filters at either the zone level or the form level to improve recognition results. A filter is a specification for removing those that a particular category of characters are considered possible valid results. For example, a filter can contain numbers (digits only), uppercase letters, lowercase letters, and punctuation marks.

다른 바람직한 실시형태에서, 본 발명은 OMR 기술을 이용하기 때문에, 폼dnl의 관련 정보를 나타내기 위해서 비표준 심볼 (심볼 ⓒ 와 유사한 N 의 원문자 등) 을 사용한다. 예를들어, 이런 관련 정보들은, 컷-앤-페이스트 영역 (cut-and-paste areas), 교정이 필요한 정보, 및 다른 데이터 파일에 대한 기준 (reference) 을 포함한다.In another preferred embodiment, because the present invention uses OMR techniques, non-standard symbols (such as N original characters similar to symbol ©) are used to represent the relevant information of the form dnl. For example, such relevant information includes cut-and-paste areas, information that needs to be corrected, and references to other data files.

폼 인식을 위한 존은 도 7 에서 번호들로 나타낸 바와 같이, 좌에서 우로 그리고 상에서 하로 정렬된다. 각각의 존은 폼이 속하는 세트의 폼 번호에 대응한다. 존들은, 폼을 스캔할 때 기록자가 원밖에 마크하거나 빗나가게 마크함으로써 발생한 잘못된 폼 식별의 가능성을 최소화하기 위하여 그들 사이에 공간을 갖고 레이아웃한다. 세트내의 폼에는 폼 번호에 대응하는 존을 할당하며, 채워지지 않은 도트 (dot) 를 폼 페이지 (도 2 및 3 참조) 위의 할당된 존 내에 미리 프린트한다. 각각의 존, 따라서 각각의 도트에는 번호를 할당한다. 테이블 ("도트맵") 은 도트 번호를 폼 세트내의 폼 번호에 매핑시킨다. 예를들어, 도트 매핑에 대한 테이블은 다음과 같다.Zones for form recognition are arranged left to right and top to bottom, as indicated by the numbers in FIG. 7. Each zone corresponds to the form number of the set to which the form belongs. Zones are laid out with spaces between them to minimize the possibility of false form identification caused by the recorder marking out of the circle or deflecting when scanning the form. Forms in the set are assigned a zone corresponding to the form number, and prefilled unfilled dots in the assigned zones on the form page (see Figures 2 and 3). Each zone, and therefore each dot, is assigned a number. The table ("dotmap") maps dot numbers to form numbers in the form set. For example, the table for dot mapping is:

"도트맵" 은 데이터베이스 테이블 또는 디스크 파일 등의 저장 매체에 추후 검색을 위해 저장된다.The "dotmap" is stored for later retrieval in storage media such as database tables or disk files.

도 5 를 참조하면, 단계 510 에서, 폼 ID 결정 모듈은 마크 검출 존 (mark sense zone) 으로부터 인식된 데이터를 검색한다. 단계 520 에서는, 첫번째 1 채워진 도트와 대응 존에 대하여 서치를 수행하며, 단계 530 에서는 그 도트 번호를 존 정의로부터 결정한다. 단계 540 에서는, 대응 폼 ID 번호를 도트 번호에 기초하여 도트매핑 테이블로부터 검색한다 (예를들어, 위의 테이블에서, 도트번호 '1'은 폼 ID 번호 '00300001-01' 에 대응한다). 단계 545 에서는, 폼 ID 번호가 결정되지 않는 경우, 단계 550 에서 페이지의 잉크-데이터-기초 이미지 (ink-data-based image) 를 사용자에게 디스플레이하며, 단계 555 에서 사용자는 즉시 적절한 폼 ID 번호를 입력한다. 단계 560 에서는, 사용자가 폼 ID 번호를 입력한다. 바람직한 실시형태는 폼을 식별하기 위하여 번호를 이용하지만, 당업자는 문자 숫자와는 다른 심볼도 사용할 수 있음을 알 수 있다. 도 5 에 나타낸 처리는 도 14 에서 보다 상세하게 나타낸다.Referring to FIG. 5, in step 510, the form ID determination module retrieves data recognized from a mark sense zone. In step 520, a search is performed on the first one filled dot and the corresponding zone, and in step 530, the dot number is determined from the zone definition. In step 540, the corresponding form ID number is retrieved from the dot mapping table based on the dot number (for example, in the above table, the dot number '1' corresponds to the form ID number '00300001-01'). In step 545, if the form ID number is not determined, in step 550 an ink-data-based image of the page is displayed to the user, and in step 555 the user immediately enters the appropriate form ID number. do. In step 560, the user enters a form ID number. While the preferred embodiment uses numbers to identify the form, one of ordinary skill in the art appreciates that symbols other than alphanumeric characters may also be used. The processing shown in FIG. 5 is shown in more detail in FIG.

도 6 을 참조하면, 폼 ID 번호가 시스템에 의해 결정되거나 사용자에 의해 입력된 후에, 단계 645 를 수행한다. 단계 645 에서는, 데이터가 폼 ID 번호에 기초하여 더 인식되고 (예를들어, 광문자 인식, 또는 핸드프린트 (handprint) 인식 - ICR (Intelligent Character Recognition) 로도 알려짐 - 을 이용함; 바람직한 인식 방법은 도 12 에 나타내었다), 단계 650 에서는, 이미지가 기록된 폼의 ID 번호 및 인식된 데이터가 데이터베이스의 편집되지 않은 파일로서 저장된다. 인식된 데이터는 폼의 카테고리에 따라서 구성되며, 사용자의 검사 스크린 (audit screen) 상에 선택적으로 디스플레이된다. 데이터는 검사가 편리하도록, 테이블 등의 포맷으로 디스플레이된다. 단계 660 에서는, 사용자가, 적절한 경우에, 검사 스크린상의 각각의 인식된 데이터 요소들을 선택적으로 검사, 확인, 및 교정한다. 바람직한 실시형태에서, 그래픽 사용자 인터페이스 (GUI; 810) (도 8 참조) 는 사용자가 "문맥 오리엔테이션 (contextual orientation)" 의 데이터를 볼 수 있도록 하며: 예를들어, 일부 데이터가 인식되지 않는 경우, 사용자는 스크린상에 디스플레이된 페이퍼 폼의 일부분의 이미지를 가지며, 사용자에게 기록된 폼 (written-on form) 의 일부분의 온스크린 이미지 (on-screen image) 를 제공하기 위하여 그 페이지에 대한 잉크 데이터의 이미지를 페이퍼 폼의 이미지위에 중첩시킨다. 이는 사용자가 기록된 폼 (written form) 없이 데이터 요소를 검사하고 입증하며 또한 페이퍼 폼이 기록된 기록된 이미지를 모두 볼 수 있도록 한다. 차례로, 이는 운영자 (operator) 가 페이퍼 폼이 기록된 사이트로부터 원격지에 있는 사이트에서 검사 및 확인을 수행할 수 있게 한다. 또한, 예를들어, 데이터가 의학 보고서일 경우, 폼위에 수기로 기록한 문맥적으로 오리엔테이션된 온스크린 관측 (contextually-oriented on-screen view) 은, 보고서를 받았을 때, 사용자가 환자의 성격뿐만 아니라 기록자의 기분까지도 새롭게 할 수 있도록 한다.Referring to Figure 6, after the form ID number is determined by the system or input by the user, step 645 is performed. In step 645, the data is further recognized based on the form ID number (e.g., using optical character recognition, or handprint recognition, also known as Intelligent Character Recognition (ICR)); In step 650, the ID number of the form on which the image is recorded and the recognized data are stored as an unedited file in the database. The recognized data is organized according to the category of the form and is optionally displayed on the user's audit screen. The data is displayed in a format such as a table for convenient inspection. In step 660, the user optionally inspects, verifies, and corrects each recognized data element on the inspection screen, as appropriate. In a preferred embodiment, a graphical user interface (GUI) 810 (see FIG. 8) allows the user to view data in a "contextual orientation": for example, if some data is not recognized, the user Has an image of a portion of the paper form displayed on the screen and an image of the ink data for that page to provide the user with an on-screen image of the portion of the written-on form. On top of the image on the paper form. This allows the user to inspect and verify data elements without a written form and also to see all the recorded images on which the paper form is written. In turn, this allows the operator to perform inspection and verification at a site remote from the site where the paper form is recorded. Also, for example, if the data is a medical report, a contextually-oriented on-screen view, recorded by hand on the form, may indicate that the user is not only the patient's personality but also the recorder when the report is received. To refresh your mood.

단계 665 에서는, 검사된 데이터를 데이터 베이스에 저장한다.In step 665, the checked data is stored in a database.

도 9 는 바람직한 폼 정렬 처리를 개략적으로 나타낸다. 단계 910 에서는, 관련 본문, 및 도 5 와 6 에서 설명한 폼 식별처리를 수행한다. 단계 915 에서는, 폼 식별 단계 910 이 성공하지 않는 경우, 단계 920 에서, 폼 정렬 처리를 종료하며, 폼을 "미확인 (unknown) " 으로 마크한다.9 schematically illustrates a preferred form alignment process. In step 910, the associated body and the form identification processing described in FIGS. 5 and 6 are performed. In step 915, if the form identification step 910 does not succeed, in step 920, the form alignment process ends, and the form is marked as "unknown".

폼 식별 단계 910 이 성공하는 경우, 단계 925 에서는 잉크버블 중심위치파악 처리 (Locate Ink Bubble Center Process) (도 10 과 11, 및 관련 본문 참조) 를 잉크 이미지 버블에서 수행한다. 이 단계에서는, 잉크 이미지 버블의 좌표 (XInkCenter, YInkCenter) 의 계산을 행한다.If the foam identification step 910 succeeds, then in step 925, a location ink bubble center process (see FIGS. 10 and 11, and related text) is performed in the ink image bubble. In this step, the coordinates (XInkCenter, YInkCenter) of the ink image bubble are calculated.

단계 925 에 후속하여, 기준 버블과 잉크 이미지 버블 사이의 오프셋 (XOffset, YOffset) 은 XOffset = XInkCenter - XMast ; YOffset = YInkCenter-YMast 로 계산한다. XMast 와 YMast 는 도 10 에서 각각 X0 와 Y0 로 표시한다.Subsequent to step 925, the offset (XOffset, YOffset) between the reference bubble and the ink image bubble is XOffset = XInkCenter-XMast; Calculate YOffset = YInkCenter-YMast. XMast and YMast are denoted by X0 and Y0 in FIG.

단계 940 에서는, 잉크정렬을 수행하며; XOffset 과 YOffset 값을 잉크 이미지에 인가하여 이미지를 시프트한다.In step 940, ink alignment is performed; Shift the image by applying the XOffset and YOffset values to the ink image.

단계 950 에서는, 정렬된 잉크 이미지를 인식한다 (도 12 와 관련 본문 참조). 마지막으로, 단계 960 에서는, 인식된 정렬 잉크 이미지를 기준 이미지 (식별된 폼의 저장된 이미지) 와 결합한다.In step 950, the aligned ink image is recognized (see FIG. 12 and related text). Finally, in step 960, the recognized alignment ink image is combined with the reference image (stored image of the identified form).

도 10 은 바람직한 잉크 버블 중심 위치파악 처리 (Locate Ink Bubble Center Process) 에서 사용하는 좌표 및 존 정의를 나타내고, 도 11 은 그 처리 단계들을 나타낸다.FIG. 10 shows the coordinates and zone definitions used in the preferred Ink Bubble Center Localization process, and FIG. 11 shows the processing steps.

도 10 은 하향으로 증가하는 y 좌표를 갖는 좌표계를 나타낸다. 기준 서치 존 (1020) 은 폼 및 폼식별 존 템플릿 (Form Identification Zone Template) 에 의해 결정할 수 있다. 폼을 식별하였기 때문에, (Xink, Yink) 에 중심을 둔 버블 잉크 서클 (1030) 을 특정 기준 버블 존 (1010) 내에서 찾게 된다. 기준버블 존 (1010) 은 기준 버블이 기준 버블 잉크 존 (1010) 의 중심이기도 한 중심 (X0, Y0) 을 가질 수 있게 한다. 기준 서치 존 (1020) 은 각각의 방향 (좌우) 에서 수평으로 거리 Xexpand 와 각각의 방향 (상하) 에서 수직으로 거리 Yexpand 로 버블 잉크 존 (1010) 을 연장시킴으로써 정의한다.10 shows a coordinate system with y coordinates increasing downwards. The reference search zone 1020 may be determined by a form and a form identification zone template. Since the foam has been identified, a bubble ink circle 1030 centered at (Xink, Yink) is found within a particular reference bubble zone 1010. The reference bubble zone 1010 allows the reference bubble to have a center X0, Y0 which is also the center of the reference bubble ink zone 1010. The reference search zone 1020 is defined by extending the bubble ink zone 1010 with the distance Xexpand horizontally in each direction (left and right) and the distance Yexpand vertically in each direction (up and down).

따라서, 기준 서치 존 (1020) 은 그 모서리가 좌표 (X1, Y1) (좌측상단 모서리), (X2, Y1) (우측상단 모서리), (X2, Y2) (우측하단 모서리), 및 (X1, Y2) (좌측하단 모서리) 를 갖는 직사각형이다.Accordingly, the reference search zone 1020 has the edges of coordinates (X1, Y1) (upper left corner), (X2, Y1) (upper right corner), (X2, Y2) (lower right corner), and (X1, Y2) is a rectangle having (lower left corner).

도 11 은 잉크 버블 위치 파악처리를 나타낸다. 단계 1105 에서는, 변수를 초기화한다. BubbleZoneLeft 는 버블 존 (1010) 좌측의 x 좌표이다. BubbleZoneRight 는 버블 존 (1010) 우측의 x 좌표이다. BubbleZoneTop 는 버블 존 (1010) 상단의 y 좌표이다. BubbleZoneBottom 는 버블 존 (1010) 하단의 y 좌표이다. 변수 YScan 을 Y1 으로 세팅한다.11 shows the ink bubble positioning process. In step 1105, the variable is initialized. BubbleZoneLeft is the x coordinate of the left side of the bubble zone 1010. BubbleZoneRight is the x coordinate of the right side of the bubble zone 1010. BubbleZoneTop is the y coordinate of the top of the bubble zone 1010. BubbleZoneBottom is the y coordinate of the bottom of the bubble zone 1010. Set the variable YScan to Y1.

초기에 변수 YTop, YBottom, XLeft, 및 XRight 를 각각, Y2, Y1, X2, 및 X1 으로 세팅한다. 잉크 버블 중심 위치 파악 처리의 마지막에, 변수 YTop 는 버블 잉크 (1030) 의 y 좌표 값을 포함하고, YBottom 은 버블 잉크 (1030) 의 바닥의 y 좌표 값을 포함하며, XLeft 는 버블 잉크 (1030) 의 좌측의 x 좌표 값을 포함하고, XRight 는 버블 잉크 (1030) 의 x 좌표 값을 포함한다. 처리가 확실한 경우, 버블 잉크가 완전한 디스크가 아닐 경우에도, 처리를 통해 버블 잉크 (1030) 의 중심을 결정하게 된다.Initially set the variables YTop, YBottom, XLeft, and XRight to Y2, Y1, X2, and X1, respectively. At the end of the ink bubble center localization process, the variable YTop contains the y coordinate value of the bubble ink 1030, YBottom contains the y coordinate value of the bottom of the bubble ink 1030, and XLeft contains the bubble ink 1030. And the x coordinate value of the left side of the XRight contains the x coordinate value of the bubble ink 1030. If the process is certain, even if the bubble ink is not a complete disc, the process determines the center of the bubble ink 1030.

단계 1110 에서는, 변수 XScan 를 X1 으로 세팅한다. 단계 115 에서는,블랙 픽셀이 (XScan, YScan) (이는 최초에는 (X1, Y1), 즉 기준 서치 존 (1020) 의 상부좌측 모서리에 있음) 에 있는 지를 체크한다. 응답이 "아니오" 인 경우, 단계 1160 에서는 변수 XScan 을 증가시킨다. 단계 1165 에서 값을 체크할 때 증분이 X2 보다 크지 않을 경우에 (즉, 스캔이 기준 서치 존 (1020) 의 우측에 도달하지 않는 경우), 단계 1115 를 반복한다. 단계 1165 에서는, 변수 XScan 의 단계 1160 에서의 증분이 XScan 이 X2 보다 큰 값을 갖도록 하고, 단계 1170 에서는 변수 Xscan 을 증가시킨다. YScan 의 값을 단계 1175 에서 체크할 때 YScan 의 값이 Y2 보다 큰 경우, 단계 1180 에서는, XInkCenter 와 YInKCenter 를 계산한다. 단계 1175 에서는, YScan 의 값이 Y2 보다 크지 않는 경우, 단계 1110 을 반복한다. 소프트웨어는 기준 서치 존에 (1020) 에 대하여 좌에서 우로, 그리고 상에서 하로 스캔한다.In step 1110, the variable XScan is set to X1. In step 115, it is checked whether the black pixel is in (XScan, YScan), which is initially at (X1, Y1), i.e., in the upper left corner of the reference search zone 1020. If the answer is no, then at step 1160 increase the variable XScan. If the increment is not greater than X2 when checking the value in step 1165 (ie, the scan does not reach the right side of the reference search zone 1020), repeat step 1115. In step 1165, the increment in step 1160 of the variable XScan causes XScan to have a value greater than X2, and in step 1170 the variable Xscan is increased. If the value of YScan is greater than Y2 when the value of YScan is checked at step 1175, at step 1180, XInkCenter and YInKCenter are calculated. In step 1175, if the value of YScan is not greater than Y2, step 1110 is repeated. The software scans from left to right and top to bottom for a reference search zone 1020.

단계 1115 에서 응답이 "예" 인 경우, 단계 1120 에서는 변수 YScan 의 현재 값이 YTop 의 현재 값보다 작은지를 체크한다. "예" 인 경우, 단계 1125 에서는, YTop 을 YScan 과 동일하게 세팅한다. 따라서, 버블잉크 (1030) 의 상단을 찾고, 그 y 좌표를 YScan 의 현재값으로 결정한다. 단계 1130 에서는, 단계 1120 에서의 응답이 "아니오" 인 경우 단계 1120 에 후속하며, 단계 1120 에서의 응답이 "예" 인 경우 단계 1125 에 후속한다.If the response is YES in step 1115, then in step 1120 it is checked whether the current value of the variable YScan is less than the current value of YTop. If YES, in step 1125, YTop is set equal to YScan. Thus, the top of the bubble ink 1030 is found and its y coordinate is determined as the current value of YScan. In step 1130, it follows step 1120 if the response in step 1120 is "no", and in step 1125 if the response in step 1120 is "yes".

단계 1130 에서는, XScan 의 현재값이 XLeft 의 현재값보다 작은지를 체크한다. 응답이 "예" 인 경우, 단계 1140 에서는 XLeft 를 XScan 과 동일하게 세팅한다. 단계 1130 에서 응답이 "예" 인 경우, 단계 1145 는 단계 1140 에 후속하며, 단계 1130 에서 응답이 "아니오" 인 경우 단계 1130 에 후속한다.In step 1130, it is checked whether the present value of XScan is smaller than the present value of XLeft. If the answer is yes, then at step 1140 set XLeft equal to XScan. If the answer is yes in step 1130, step 1145 follows step 1140, and if the response is no in step 1130, then step 1130.

단계 1145 에서는, XScan 이 XRight 보다 큰 지를 체크한다. 응답이 "예" 인 경우, 단계 1150 에서는 XRight 와 XScan 을 동일하게 세팅한다. 단계 1145 에서 응답이 "아니오" 인 경우, 단계 1155 는 단계 1145 에 후속하며, 단계 1145 에서의 응답이 "예" 인 경우, 단계 1150 에 후속한다. 단계 1155 에서는, YBottom 를 YScan 과 동일하게 세팅한다. 위에서 설명한 바와 같이, 단계 1160 은 단계 1155 에 후속한다. 처리를 계속함에 따라서, YTop 값은 그것이 버블 잉크 (1030) 의 최상단 픽셀의 y 좌표값을 반영할 때까지 감소하며; YBottom 값은 그것이 버블 잉크 (1030) 의 최하단 픽셀의 y 좌표값을 반영할 때까지 증가하며; XLeft 값은 그것이 버블 잉크 (1030) 의 최좌측 픽셀의 x 좌표값을 반영할 때까지 감소하며; XRight 값은 그것이 버블 잉크 (1030) 내의 최우측 픽셀의 x 좌표값을 반영할 때까지 증가한다. 따라서, 단계 1180 에 최종적으로 도달하면, XInkCenter (=(XLeft + XRight)/2) 와 YInkCenter (=(YTop + YBottom)/2 의 계산이, 버블잉크 (1030) 가 완벽한 디스크를 형성하는 경우, 버블 잉크 (1030) 의 중심 위치를 정확하게 결정하고, 모든 경우에 버블 잉크 (1030) 의 중심을 합리적으로 추산한다. 버블 잉크 (1030) 의 중심을 결정하는 본 방법은 단지 바람직한 실시예로서 첨부한 청구항에 개시한 발명의 범위를 제한하는 것은 아니다. 당업자는 개시한 발명의 범위로부터 일탈하지 않고 상술한 방법을 대체할 수 있는 불규칙한 형상의 2 차원 대상의 중심을 결정하는 다양한 공지 방법들이 있음을 알 수 있다.In step 1145, it is checked if XScan is greater than XRight. If the answer is yes, then at step 1150 set XRight and XScan equally. If the answer to step 1145 is "no", step 1155 follows step 1145 and if the response to step 1145 is "yes", then step 1150 follows. In step 1155, YBottom is set equal to YScan. As described above, step 1160 follows step 1155. As the processing continues, the YTop value decreases until it reflects the y coordinate value of the top pixel of the bubble ink 1030; The YBottom value increases until it reflects the y coordinate value of the lowest pixel of the bubble ink 1030; The XLeft value decreases until it reflects the x coordinate value of the leftmost pixel of the bubble ink 1030; The XRight value is increased until it reflects the x coordinate value of the rightmost pixel in bubble ink 1030. Thus, when finally reaching step 1180, the calculation of XInkCenter (= (XLeft + XRight) / 2) and YInkCenter (= (YTop + YBottom) / 2 yields a bubble when the bubble ink 1030 forms a perfect disk. Accurately determine the center position of the ink 1030, and in all cases reasonably estimate the center of the bubble ink 1030. The present method of determining the center of the bubble ink 1030 is merely a preferred embodiment in the appended claims. It will be appreciated by those skilled in the art that there are various known methods for determining the center of an irregularly shaped two-dimensional object that can be substituted for the method described above without departing from the scope of the disclosed invention. .

도 9 를 다시 참조하면, 단계 930 에서는, 잉크 버블 (1030) 과 기준 버블 (중심 (XMast, YMast) 간의 오프셋을 식 XOffset = YInkCenter-XMast 및 YOffset = YInkCenter-YMast 를 이용하여 계산한다. 그후, XOffset 과 YOffset 의 값을 잉크 이미지를 시프트하기 위해 이용한다. 예를들어, XOffset 은 양수이고 YOffset 는 음수인 경우, 잉크 이미지는 거리 |XOffset| 만큼 좌측으로 시프트하고, 거리|YOffset|만큼 하향으로 시프트한다.9, in step 930, the offset between the ink bubble 1030 and the reference bubble (center (XMast, YMast) is calculated using the equations XOffset = YInkCenter-XMast and YOffset = YInkCenter-YMast. And the value of YOffset are used to shift the ink image, for example, if XOffset is positive and YOffset is negative, the ink image shifts left by the distance | XOffset | and shifts downward by the distance | YOffset |.

바람직하게는, 거리는 픽셀의 개수로 측정한다. 따라서, 바람직한 실시형태에서, 잉크 이미지 픽셀은 |XOffset| 픽셀만큼 수평으로 이동하고, |YOffset|픽셀만큼 수직으로 이동한다. 다음의 C++ 코드는 잉크 이미지 시프트를 수행하는 바람직한 방법을 나타낸다.Preferably, the distance is measured by the number of pixels. Thus, in a preferred embodiment, the ink image pixels move horizontally by | XOffset | pixels and vertically by | YOffset | pixels. The following C ++ code illustrates a preferred method of performing ink image shift.

로드한 잉크를 프로그램에 입각하여 생성한 화이트 페이지 "널 (null)" 이미지와 결합함으로써, 잉크 픽셀을 오프셋한다. 픽셀 결과를 최대 225 (화이트) 로 세팅하는 비트와이즈 추가 알고리즘 (bitwise add algorithm) 을 픽셀을 결합하기 위하여 이용한다. 다음 코드가 이 동작을 수행한다.The ink pixels are offset by combining the loaded ink with a white page "null" image generated programmatically. A bitwise add algorithm is used to combine the pixels, which sets the pixel result up to 225 (white). The following code does this.

일단 잉크 이미지가 시프트되면 (정렬되면), OMR 및 OCR 처리를 수행하고 - 단계 950 에서 정렬된 이미지를 인식한다.Once the ink image is shifted (aligned), OMR and OCR processing is performed-in step 950 to recognize the aligned image.

도 12 는 바람직한 잉크 이미지 인식 처리를 나타낸다. 단계 1210 에서는, 폼에 대한 필드 정의 파일을 로드한다. 단계 1220 에서는, 잉크 이미지가 메모리에 로드된다. 단계 1230 에서는, 인식을 위해 필드 정의 파일과 이미지를 인식 엔진으로 보내고, 단계 1240 에서는, 인식된 결과를 데이터베이스에 저장한다.12 shows a preferred ink image recognition process. In step 1210, load the field definition file for the form. In step 1220, the ink image is loaded into the memory. In step 1230, the field definition file and the image are sent to the recognition engine for recognition, and in step 1240, the recognized results are stored in a database.

도 9 를 다시 참조하면, 단계 960 에서는 정렬된 인식 잉크 이미지를 식별된 (블랭크) 폼의 기준 이미지와 정렬한다. 이 처리를 FIG. 13 에 나타내었다. 단계 (1310) 에서는, 폼의 기준 이미지를 메모리에 로드한다. 단계 1320 에서는, 잉크 이미지를 메모리에 로드한다.Referring back to FIG. 9, step 960 aligns the aligned recognition ink image with the reference image of the identified (blank) form. This treatment 13 is shown. In step 1310, the reference image of the form is loaded into memory. In step 1320, the ink image is loaded into the memory.

단계 1330 에서는, 잉크 이미지를 기준 이미지와 결합시킨다. 잉크 픽셀을 결합하기 위하여 비트와이즈 OR 알고리즘을 프로그램기반으로 사용하여, 잉크픽셀을 기준 이미지 픽셀과 결합한다. 다음 코드가 이 동작을 수행한다.In step 1330, the ink image is combined with the reference image. The bitwise OR algorithm is used programmatically to combine the ink pixels, thereby combining the ink pixels with the reference image pixels. The following code does this.

마지막으로, 단계 1340 에서는, 결합한 이미지를 디스크 또는 다른 저장 매체에 저장한다.Finally, in step 1340, the combined image is stored on a disk or other storage medium.

도 14 는 바람직한 실시형태의 폼 식별 처리를 나타낸다. 이 처리의 일부분을 도 5 에 나타내었다. 단계 1410 에서는, 폼 세트 폼 ID 존 정의 파일을 메모리에 로드한다. 단계 1420 에서는, 잉크 이미지를 메모리에 로드한다. 단계 1425 에서는, 인식을 지시하고, 로드한 존 정의와 잉크 이미지를 사용한다. 단계 1430 에서는, 가변 폼 ID 를 1 과 동일하게 세팅한다. 단계 1435 에서는, 폼ID 에서의 인식 결과 문자가 1 과 같은지를 체크한다. 그럴 경우, 폼을 식별하며, 처리는 단계 1450 에서 종료한다. 그렇지 않을 경우, 단계 1440 을 수행하며, 여기서는 폼 ID 를 증가시킨다. 단계 1445 에서는, 폼 ID 가 폼 세트내의 폼의 개수보다 큰지를 체크한다. 그럴 경우, 폼을 식별하지 않은 채 단계 1455 에서 처리를 종료한다. 그렇지 않을 경우, 처리는 단계 1435 로 복귀한다.14 shows the form identification processing of the preferred embodiment. Part of this treatment is shown in FIG. 5. In step 1410, the form set form ID zone definition file is loaded into memory. In step 1420, the ink image is loaded into the memory. In step 1425, recognition is instructed and the loaded zone definition and ink image are used. In step 1430, the variable form ID is set equal to one. In step 1435, it is checked whether the recognition result character in the form ID is equal to one. If so, the form is identified and processing ends at step 1450. Otherwise, perform step 1440, where the form ID is incremented. In step 1445, it is checked whether the form ID is greater than the number of forms in the form set. If so, the process ends at step 1455 without identifying the form. Otherwise, processing returns to step 1435.

본 발명의 다른 실시형태에서는, 프린트된 폼 지시자를 갖지 않는 미리 프린트된 폼을 사용한다. 이런 폼의 사용이 가능하도록, 템플릿, 바람직하게는 금속 또는 플라스틱을 디지타이저 패드에 부착한다. 템플릿은 스텐실 (stencil) 로서 기능하고 (도 15 참조), 사용자는 가이드내의 홀을 채우며; 각각의 홀은 서로 다른 폼에 대응한다. 이와같이, 상술한 폼 식별 처리는 미리 프린트된 폼 표시자를 갖는 않는 폼에 이용한다.In another embodiment of the present invention, a preprinted form that does not have a printed form indicator is used. To enable the use of such foams, a template, preferably metal or plastic, is attached to the digitizer pad. The template functions as a stencil (see FIG. 15) and the user fills the holes in the guide; Each hole corresponds to a different form. In this way, the above-described form identification processing is used for a form having no preprinted form indicator.

바람직한 실시형태에서는 도 15 에 나타낸 것과 같은 구성을 사용한다. 바람직하게는, 템플릿은 디지타이저 패드 (바람직하게는 CrossPad 또는 그 파생물) 위의 사이드 페이퍼 가이드 (좌측의 3 개의 페이퍼 가이드 (1610) 를 나타내는 도 16 참조) 상에 조립하는 플라스틱 오버레이 (1510) 이다. 바람직하게는, 템플릿 (1510) 은 디지타이저 패드상의 3 개의 올려진 페이퍼 가이드에 조립가능하게 하는 3 개의 슬롯 (1530) 을 갖는다. 당업자는 다른 설치 방법에 대하여 다른 구성의 디지타이저 패드로 대체할 수 있음을 알 수 있다. 예를들어, 디지타이저 패드위에 단지 하나의 올려진 페이퍼 가이드가 존재하며 패드 우측에 있는 경우, 템플릿 (1510) 은 그것의 우측을 따라서 위치하는 단지 하나의 슬롯을 갖는다.In a preferred embodiment, a configuration as shown in FIG. 15 is used. Preferably, the template is a plastic overlay 1510 that assembles onto a side paper guide (see FIG. 16 showing the three paper guides 1610 on the left) above the digitizer pad (preferably CrossPad or a derivative thereof). Preferably, template 1510 has three slots 1530 that allow assembly to three raised paper guides on the digitizer pad. Those skilled in the art will appreciate that other installation methods may be substituted for other configurations of digitizer pads. For example, if there is only one raised paper guide above the digitizer pad and to the right of the pad, the template 1510 has only one slot located along its right side.

다시 도 15 에 나타낸 바람직한 실시형태를 참조하면, 3 개의 슬롯 (1530) 은 대략 (± 2mm) 48mm 이격되어 있고, 1mm 폭이며, 템플릿 (1510) 의 좌측 모서리로부터 5mm 이고, 대략 ( ± 1m) 48mm 길이이다. 최상측 슬롯 (1530) 의 상단은 바람직하게는 템플릿 (1510) 의 상단으로부터 15mm 이고, 최하측 슬롯 (1530) 의 바닥은 템플릿 (1510) 의 바닥 모서리로부터 바람직하게는 15mm 이다.Referring again to the preferred embodiment shown in FIG. 15, the three slots 1530 are approximately (± 2 mm) 48 mm apart, 1 mm wide, 5 mm from the left edge of the template 1510, and approximately (± 1 m) 48 mm Length. The top of the top slot 1530 is preferably 15 mm from the top of the template 1510 and the bottom of the bottom slot 1530 is preferably 15 mm from the bottom edge of the template 1510.

템플릿 (1310) 자체는 대략 2mm 두께이고, 273mm 길이이며, 27mm 폭이다. 바람직하게는, 각각의 폼 지지자 버블 (1520) 은 직경이 2.5mm 이고, 버블 (1520)간의 바람직한 최소 거리는 4 mm이다.The template 1310 itself is approximately 2 mm thick, 273 mm long, and 27 mm wide. Preferably, each foam supporter bubble 1520 is 2.5 mm in diameter and the preferred minimum distance between the bubbles 1520 is 4 mm.

설명한 실시형태로 본 발명의 목적을 완전하게 달성할 수 있는 것은 아니지만, 이들 실시형태는 단지 설명을 위한 것으로서, 본 발명을 제한하는 것은 아니다. 예를들어, CrossPad 는 사용자가 페이지업과 페이지다운 버튼을 반복적으로 누루지 않고서, 페이지 (예를들어 페이지 14 로부터 직접 페이지 3으로) 사이를 스킵할 수 있도록 용이하게 변경할 수 있다.Although the described embodiments are not able to fully achieve the object of the present invention, these embodiments are merely illustrative and do not limit the present invention. For example, CrossPad can be easily modified to allow users to skip between pages (eg, page 14 directly to page 3) without repeatedly pressing the page up and page down buttons.

Claims (57)

미리 프린트한 폼의 자동 인식 방법으로서,As an automatic recognition method of the preprinted form, (a) 미리 프린트한 폼상에 매뉴얼식으로 형성한 마크의 위치를 나타내는 데이터를 수신하고 저장하는 단계; 및(a) receiving and storing data indicating the position of a manually formed mark on a preprinted form; And (b) 상기 마크의 위치에 기초하여 상기 폼을 식별하는 단계를 포함하는 것을 특징으로 하는 자동 인식 방법.(b) identifying the form based on the position of the mark. 제 1 항에 있어서,The method of claim 1, 단계 (a) 에서 수신하고 저장한 데이터는 컴퓨터가 수신하여 컴퓨터 저장매체에 저장한 디지털 이미지 데이터인 것을 특징으로 하는 자동 인식 방법.And the data received and stored in step (a) is digital image data received and stored in a computer storage medium by the computer. 제 2 항에 있어서,The method of claim 2, 단계 (b) 는 상기 마크의 위치를 포함하는 폼식별 존을 결정하고, 그 폼 식별 존에 대응하는 폼을 결정하는 것을 포함하는 것을 특징으로 하는 자동 인식 방법.Step (b) comprises determining a form identification zone comprising the position of the mark and determining a form corresponding to the form identification zone. 제 3 항에 있어서,The method of claim 3, wherein 단계 (b) 는 폼 식별 존들을 폼 ID 들과 매칭시킨 테이블을 저장하는 것을 포함하는 것을 특징으로 하는 자동 인식 방법.Step (b) comprises storing a table that matches form identification zones with form IDs. 제 4 항에 있어서,The method of claim 4, wherein 단계 (b) 는,Step (b) is 수신된 디지털 이미지 데이터를 인식 엔진이 처리할 포맷으로 재포맷팅하는 단계;Reformatting the received digital image data into a format to be processed by the recognition engine; 상기 인식 엔진에 의해 상기 재포매팅된 데이터를 처리함으로써, 상기 재포매팅된 디지털 이미지 데이터를 인식 데이터로 변환하는 단계;Converting the reformatted digital image data into recognition data by processing the reformatted data by the recognition engine; 하나이상의 폼 식별 존에 대해 인식 데이터를 검색하는 단계;Retrieving recognition data for one or more form identification zones; 마크를 포함하는 존에 대하여 상기 검색된 인식 데이터를 서치하는 단계; 및Searching the retrieved recognition data for a zone containing a mark; And 존을 폼 ID 에 매칭시켜서 폼을 식별하는 단계를 더 포함하는 것을 특징으로 하는 자동 인식 방법.And identifying the form by matching the zone to a form ID. 제 5 항에 있어서,The method of claim 5, 사용자가 이미지가 기록된 폼을 매뉴얼식으로 식별할 수 있도록 컴퓨터상에 디지털 이미지 데이터를 디스플레이하는 단계를 더 포함하는 것을 특징으로 하는 자동 인식 방법.And displaying digital image data on a computer so that the user can manually identify the form on which the image was recorded. 제 6 항에 있어서,The method of claim 6, 인식 데이터를 사용자 컴퓨터 모니터상에 검사가 편리한 포맷으로 디스플레이하는 단계를 더 포함하는 것을 특징으로 하는 자동 인식 방법.And displaying the recognition data on a user computer monitor in a format convenient for examination. 제 7 항에 있어서,The method of claim 7, wherein 폼과 그위에 기록된 이미지의 온스크린 이미지를 제공하기 위하여, 식별된 폼의 이미지상에 중첩된 디지털 이미지 데이터를 디스플레이하는 단계를 더 포함하는 것을 특징으로 하는 자동 인식 방법.Displaying digital image data superimposed on the image of the identified form to provide an on-screen image of the form and the image recorded thereon. 제 8 항에 있어서,The method of claim 8, 상기 인식 데이터를 식별된 폼의 이미지상에 중첩된 상기 디스플레이된 디지털 이미지 데이터와 비교함으로써, 상기 인식 데이터를 검사하는 단계를 더 포함하는 것을 특징으로 하는 자동 인식 방법.Examining the recognition data by comparing the recognition data with the displayed digital image data superimposed on an image of the identified form. 미리 프린트한 폼의 식별 시스템으로서,As the identification system of the preprinted form, a) 디지타이저;a) digitizer; b) 사용자가 하나 이상의 식별 마크를 입력하는 위치를 나타내는 폼에 고유한 하나 이상의 미리 프린트한 지시자를 포함하는 미리 프린트한 폼; 및b) a preprinted form comprising one or more preprinted indicators unique to the form indicating a location at which the user enters one or more identification marks; And c) i) 폼위에 형성한 마크의 하나 이상의 디지털 이미지를 수신하고,c) i) receive one or more digital images of the marks formed on the form, ii) 사용자가 형성한 하나 이상의 식별 마크의 존재 및 위치를 식별하고,ii) identify the presence and location of one or more identification marks formed by a user, iii) 상기 하나 이상의 마크의 위치에 기초하여 폼을 식별하는, 데이터베이스와 결합된 컴퓨터 프로세서를 구비하는 것을 특징으로 하는 식별 시스템.iii) a computer processor coupled with a database for identifying a form based on the location of the one or more marks. 미리 프린트한 폼의 자동식별 컴퓨터 소프트웨어로서,As automatic identification computer software of preprinted form, (a) 미리 프린트한 폼위에 매뉴얼식으로 형성한 마크의 위치를 나타내는 데이터를 수신하고 저장하는 소프트웨어; 및(a) software for receiving and storing data indicative of the position of a manually formed mark on a preprinted form; And (b) 상기 마크의 위치에 기초하여 상기 폼을 식별하는 소프트웨어를 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.(b) software for identifying the form based on the position of the mark. 제 11 항에 있어서,The method of claim 11, 폼 식별존들을 폼 ID들과 매칭시킨 테이블을 저장하는 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And software for storing a table that matches form identification zones with form IDs. 제 11 항에 있어서,The method of claim 11, 수신 및 저장된 데이터는 컴퓨터 저장 매체에 저장된 디지털 이미지 데이터인 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And the received and stored data is digital image data stored on a computer storage medium. 제 13 항에 있어서,The method of claim 13, 다음 기준 (subsequent reference) 을 위해 상기 디지털 이미지 데이터의 관리용 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.Further comprising software for management of the digital image data for a subsequent reference. 제 14 항에 있어서,The method of claim 14, 식별하는 소프트웨어는, 상기 마크의 상기 위치를 포함하는 폼 식별 존을 결정하는 소프트웨어, 및 폼 식별 존에 대응하는 폼을 결정하는 소프트웨어를 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.The identifying software includes software for determining a form identification zone that includes the location of the mark, and software for determining a form corresponding to the form identification zone. 제 15 항에 있어서,The method of claim 15, 식별하는 소프트웨어는,Software to identify 수신 디지털 이미지 데이터를 인식 엔진이 처리하는 포맷으로 재포맷팅하고;Reformatting the received digital image data into a format processed by the recognition engine; 상기 재포맷팅된 이미지 데이터를 상기 인식 엔진에 의해 처리함으로써, 상기 재포맷팅된 디지털 이미지 데이터를 인식 데이터로 변환하고;Converting the reformatted digital image data into recognition data by processing the reformatted image data by the recognition engine; 하나 이상의 폼 식별 존에 대해 인식 데이터를 검색하고;Retrieve recognition data for one or more form identification zones; 마크를 포함하는 존에 대한 상기 검색된 인식 데이터를 서치하고; 및Search the retrieved recognition data for a zone containing a mark; And 존을 폼 ID 에 매칭함으로써 폼을 식별하는 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And software for identifying the form by matching the zone to a form ID. 제 16 항에 있어서,The method of claim 16, 사용자가 이미지가 기록된 폼을 매뉴얼식으로 식별할 수 있도록 디지털 이미지 데이터를 컴퓨터 모니터상에 디스플레이하는 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And software for displaying digital image data on a computer monitor so that a user can manually identify the form on which the image was recorded. 제 17 항에 있어서,The method of claim 17, 인식된 데이터를 사용자 컴퓨터 모니터상에 검사가 편리한 포맷으로 디스플레이하는 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And software for displaying the recognized data on a user computer monitor in a convenient format for inspection. 제 18 항에 있어서,The method of claim 18, 폼과 그위에 기록한 이미지의 온스크린 이미지를 제공하기 위하여 식별된 폼의 이미지상에 중첩된 디지털 이미지 데이터를 디스플레이하는 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And software for displaying digital image data superimposed on the image of the identified form to provide an on-screen image of the form and the image recorded thereon. 제 19 항에 있어서,The method of claim 19, 상기 인식 데이터를 식별된 폼의 이미지상에 중첩된 상기 디스플레이된 디지털 이미지 데이터와 비교함으로써, 상기 인식 데이터를 검사하는 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And identifying software for examining the recognition data by comparing the recognition data with the displayed digital image data superimposed on an image of the identified form. 제 20 항에 있어서,The method of claim 20, 폼위에 기록된 비표준 심볼에 기초하여 폼위의 관련 정보를 인식하는 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.Further comprising software for recognizing relevant information on the form based on non-standard symbols recorded on the form. 디지털 이미지 데이터 처리방법으로서,As a digital image data processing method, (a) 디지털 이미지 데이터를 수신하는 단계;(a) receiving digital image data; (b) 상기 디지털 이미지 데이터에 포함되는 제 1 마크의 위치를 결정하는 단계;(b) determining a position of a first mark included in the digital image data; (c) 상기 제 1 마크의 위치로부터 상기 기준 위치까지의 거리 및 방향을 결정하는 단계; 및(c) determining the distance and direction from the position of the first mark to the reference position; And (d) 상기 거리 및 방향에 기초하여 상기 디지털 이미지 데이터의 시프트를 수행하는 단계를 포함하는 것을 특징으로 하는 데이터 처리방법.(d) performing a shift of the digital image data based on the distance and direction. 제 22 항에 있어서,The method of claim 22, 상기 디지털 이미지 데이터는 디지타이저 패드상에 위치하는 폼에 형성한 마크에 대응하는 것을 특징으로 하는 데이터 처리방법.And said digital image data corresponds to a mark formed on a form located on a digitizer pad. 제 23 항에 있어서,The method of claim 23, 상기 폼은 식별 마크를 형성한 존의 위치에 의해 식별하는 것을 특징으로 하는 데이터 처리방법.And the form is identified by the position of the zone in which the identification mark is formed. 제 24 항에 있어서,The method of claim 24, 상기 제 1 마크는 상기 식별 마크인 것을 특징으로 하는 데이터 처리방법.And the first mark is the identification mark. 제 25 항에 있어서,The method of claim 25, 상기 식별 마크는 대략적으로 원형인 것을 특징으로 하는 데이터 처리방법.And said identification mark is approximately circular. 제 25 항에 있어서,The method of claim 25, 상기 제 1 마크의 상기 위치는 상기 제 1 마크의 중심을 위치파악함으로써 결정하는 것을 특징으로 하는 데이터 처리방법.And the position of the first mark is determined by locating the center of the first mark. 제 26 항에 있어서,The method of claim 26, 상기 제 1 마크의 상기 위치는 상기 제 1 마크의 중심을 위치파악함으로써 결정하는 것을 특징으로 하는 데이터 처리방법.And the position of the first mark is determined by locating the center of the first mark. 디지털 이미지 데이터 처리방법으로서,As a digital image data processing method, (a) 디지털 이미지 데이터를 수신하는 단계;(a) receiving digital image data; (b) 상기 디지털 이미지 데이터에 포함된 제 1 마크의 위치를 결정하는 단계;(b) determining a position of a first mark included in the digital image data; (c) 상기 제 1 마크의 위치로부터 기준 위치까지의 거리 및 방향을 결정하는 단계;(c) determining the distance and direction from the position of the first mark to a reference position; (d) 상기 거리 및 방향에 기초하여 상기 디지털 이미지 데이터의 시프트를 수행하는 단계;(d) performing a shift of the digital image data based on the distance and direction; (e) 상기 디지털 이미지 데이터를 인식 엔진에 의해 처리함으로써, 상기 시프트한 이미지 데이터를 인식 이미지 데이터로 변환하는 단계; 및(e) converting the shifted image data into recognition image data by processing the digital image data by a recognition engine; And (f) 상기 인식 이미지 데이터를 기준 이미지와 결합하는 단계를 포함하는 것을 특징으로 하는 데이터 처리방법.(f) combining the recognition image data with a reference image. 제 29 항에 있어서,The method of claim 29, 상기 디지털 이미지 데이터는 디지털 패드위에 위치하는 폼위에 형성한 마크에 대응하는 것을 특징으로 하는 데이터 처리방법.And said digital image data corresponds to a mark formed on a form located on a digital pad. 제 30 항에 있어서,The method of claim 30, 상기 기준 이미지는 상기 폼의 이미지인 것을 특징으로 하는 데이터 처리방법.And the reference image is an image of the form. 제 31 항에 있어서,The method of claim 31, wherein 상기 폼은 식별 마크를 형성한 존의 위치에 의해 식별하는 것을 특징으로 하는 데이터 처리방법.And the form is identified by the position of the zone in which the identification mark is formed. 제 32 항에 있어서,The method of claim 32, 상기 제 1 마크는 상기 식별마크인 것을 특징으로 하는 데이터 처리방법.And the first mark is the identification mark. 제 33 항에 있어서,The method of claim 33, wherein 상기 식별 마크는 대략적으로 원형인 것을 특징으로 하는 데이터 처리방법.And said identification mark is approximately circular. 제 33 항에 있어서,The method of claim 33, wherein 상기 제 1 마크의 상기 위치는 상기 제 1 마크의 중심을 위치파악함으로써 결정하는 것을 특징으로 하는 데이터 처리방법.And the position of the first mark is determined by locating the center of the first mark. 제 34 항에 있어서,The method of claim 34, wherein 상기 제 1 마크의 상기 위치는 상기 제 1 마크의 중심을 위치파악함으로써 결정하는 것을 특징으로 하는 데이터 처리방법.And the position of the first mark is determined by locating the center of the first mark. 미리 프린트한 폼의 자동 식별 방법으로서,As an automatic identification method of the preprinted form, (a) 미리 프린트한 폼위에, 디지타이저 패드에 부착된 템플릿의 홀 (hole) 을 채움으로써 매뉴얼식으로 형성한 폼의 위치를 나타내는 데이터를 수신하고 기록하는 단계; 및(a) receiving and recording, on the preprinted form, data indicating the position of the form formed manually by filling a hole in the template attached to the digitizer pad; And (b) 상기 마크의 위치에 기초하여 상기 폼을 식별하는 단계를 포함하는 것을 특징으로 하는 자동 식별 방법.(b) identifying the form based on the position of the mark. 제 37 항에 있어서,The method of claim 37, 단계 (a) 에서 수신하고 저장한 데이터는 컴퓨터가 수신하여 컴퓨터 저장매체에 저장한 디지털 이미지 데이터인 것을 특징으로 하는 자동 식별 방법.And the data received and stored in step (a) is digital image data received and stored in a computer storage medium by the computer. 제 38 항에 있어서,The method of claim 38, 단계 (b) 에서 상기 마크의 상기 위치를 포함하는 폼 식별 존을 결정하며 폼식별 존에 대응하는 폼을 결정하는 것을 포함하는 것을 특징으로 하는 자동 식별 방법.Determining in step (b) a form identification zone comprising said position of said mark and determining a form corresponding to said form identification zone. 제 39 항에 있어서,The method of claim 39, 단계 (b) 는 폼 식별 존들을 폼 ID 들과 매칭시킨 테이블을 저장하는 것을 포함하는 것을 특징으로 하는 자동 식별 방법.Step (b) comprises storing a table that matches form identification zones with form IDs. 제 40 항에 있어서,The method of claim 40, 단계 (b) 는,Step (b) is 수신 디지털 이미지 데이터를 인식 엔진이 처리하는 포맷으로 재포맷팅하는 단계;Reformatting the received digital image data into a format processed by the recognition engine; 상기 재포맷팅한 이미지 데이터를 상기 인식 엔진에 의해 처리함으로써 상기 재포맷팅한 디지털 이미지 데이터를 인식 데이터로 변환하는 단계;Converting the reformatted digital image data into recognition data by processing the reformatted image data by the recognition engine; 하나 이상의 폼 식별 존에 대해 인식 데이터를 검색하는 단계;Retrieving recognition data for one or more form identification zones; 마크를 포함하는 존에 대한 상기 검색된 인식 데이터를 서치하는 단계; 및Searching the retrieved recognition data for a zone containing a mark; And 존을 폼 ID 에 매칭시킴으로써 폼을 식별하는 단계를 더 포함하는 것을 특징으로 하는 자동 식별 방법.Identifying the form by matching the zone to a form ID. 제 41 항에 있어서,42. The method of claim 41 wherein 사용자가 이미지가 기록된 폼을 매뉴얼식으로 식별할 수 있도록, 컴퓨터 모니터상에 디지털 이미지 데이터를 디스플레이하는 단계를 더 포함하는 것을 특징으로 하는 자동 식별 방법.And displaying digital image data on a computer monitor to allow a user to manually identify the form on which the image was recorded. 제 42 항에 있어서,The method of claim 42, 인식 데이터를 사용자 컴퓨터 모니터상에 검사가 편리한 포맷으로 디스플레이하는 단계를 더 포함하는 것을 특징으로 하는 자동 식별 방법.And displaying the recognition data on a user computer monitor in a format convenient for examination. 제 43 항에 있어서,The method of claim 43, 폼과 그위에 기록한 이미지의 온스크린 이미지를 제공하기 위하여, 식별된 폼의 이미지상에 중첩된 디지털 이미지 데이터를 디스플레이하는 단계를 더 포함하는 것을 특징으로 하는 자동 식별 방법.And displaying digital image data superimposed on the image of the identified form to provide an on-screen image of the form and the image recorded thereon. 제 44 항에 있어서,The method of claim 44, 상기 인식 데이터를 식별된 폼의 이미지상에 중첩된 상기 디스플레이된 디지털 이미지 데이터와 비교함으로써, 상기 인식 데이터를 검사하는 단계를 더 포함하는 것을 특징으로 하는 자동 식별 방법.Examining the recognition data by comparing the recognition data with the displayed digital image data superimposed on an image of the identified form. 미리 프린트한 폼의 식별 시스템으로서,As the identification system of the preprinted form, a) 디지타이저;a) digitizer; b) 미리 프린트한 폼;b) preprinted foam; c) 상기 디지타이저에 부착되고, 상기 폼을 식별하기 위해 사용자가 하나 이상의 식별마크를 입력할 수 있는 하나 이상의 홀을 포함하는 템플렛;c) a template attached to the digitizer and including one or more holes through which a user can enter one or more identification marks to identify the form; d) i) 폼위에 형성한 마크의 하나 이상의 디지털 이미지를 수신하고,d) i) receive one or more digital images of the marks formed on the foam, ii) 사용자가 형성한 하나 이상의 식별 마크의 존재 및 위치를 식별하고,ii) identify the presence and location of one or more identification marks formed by a user, iii) 상기 하나 이상의 마크의 위치에 기초하여 폼을 식별하는, 데이터베이스와 결합된 컴퓨터 프로세서를 구비하는 것을 특징으로 하는 식별 시스템.iii) a computer processor coupled with a database for identifying a form based on the location of the one or more marks. 미리 프린트한 폼의 자동식별 컴퓨터 소프트웨어로서,As automatic identification computer software of preprinted form, (a) 템플렛의 하나 이상의 홀을 채움으로써 미리 프린트한 폼에 매뉴얼식으로 형성한 마크의 위치를 나타내는 데이터를 수신하고 저장하는 소프트웨어; 및(a) software for receiving and storing data indicative of the position of a manually formed mark on a preprinted form by filling in one or more holes in the template; And (b) 상기 마크의 위치에 기초하여 상기 폼을 식별하는 소프트웨어를 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.(b) software for identifying the form based on the position of the mark. 제 47 항에 있어서,The method of claim 47, 폼 식별 존들을 폼 ID 들과 매칭시킨 데이블을 저장하는 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And software for storing a table that matches form identification zones with form IDs. 제 47 항에 있어서,The method of claim 47, 수신 및 저장된 데이터는 컴퓨터 저장매체에 저장한 디지털 이미지 데이터인 것을 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And the received and stored data is digital image data stored in a computer storage medium. 제 49 항에 있어서,The method of claim 49, 다음 기준을 위하여 상기 디지털 이미지 데이터 관리용 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And further comprising software for digital image data management for the following criteria. 제 50 항에 있어서,51. The method of claim 50 wherein 식별하는 소프트웨어는 상기 마크의 상기 위치를 포함하는 폼 식별 존을 결정하는 소프트웨어, 및 폼 식별존에 대응하는 폼을 결정하는 소프트웨어를 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.The identifying software includes software for determining a form identification zone that includes the location of the mark, and software for determining a form corresponding to the form identification zone. 제 51 항에 있어서,The method of claim 51, wherein 식별하는 소프트웨어는,Software to identify 수신 디지털 이미지 데이터를 인식 엔진이 처리하는 포맷으로 재포맷팅하고;Reformatting the received digital image data into a format processed by the recognition engine; 상기 재포맷팅된 이미지 데이터를 상기 인식 엔진에 의해 처리함으로써, 상기 재포맷팅된 디지털 이미지 데이터를 인식 데이터로 변환하고;Converting the reformatted digital image data into recognition data by processing the reformatted image data by the recognition engine; 하나 이상의 폼 식별 존에 대해 인식 데이터를 검색하고;Retrieve recognition data for one or more form identification zones; 마크를 포함하는 존에 대한 상기 검색된 인식 데이터를 서치하고; 및Search the retrieved recognition data for a zone containing a mark; And 존을 폼 ID 에 매칭함으로써 폼을 식별하는 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And software for identifying the form by matching the zone to a form ID. 제 52 항에 있어서,The method of claim 52, wherein 사용자가 이미지가 기록된 폼을 매뉴얼식으로 식별할 수 있도록, 컴퓨터 모니터상에 디지털 이미지 데이터를 디스플레이하는 소프트웨어를 더 포함하는 것을 특징으로 자동식별 컴퓨터 소프트웨어.Further comprising software for displaying digital image data on a computer monitor so that a user can manually identify the form on which the image was recorded. 제 53 항에 있어서,The method of claim 53, wherein 인식 데이터를 사용자 컴퓨터 모니터상에 검사에 편리한 포맷으로 디스플레이하는 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And automatically display the identification data on a user computer monitor in a format convenient for examination. 제 54 항에 있어서,The method of claim 54, wherein 폼과 그위에 기록한 이미지의 온스크린 이미지를 제공하기 위하여 식별된 폼의 이미지의 중첩된 디지털 이미지 데이터를 디스플레이하는 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And software for displaying the superimposed digital image data of the image of the identified form to provide an on-screen image of the form and the image recorded thereon. 제 55 항에 있어서,The method of claim 55, 상기 인식 데이터를 식별 폼의 이미지상에 중첩된 상기 디스플레이된 디지털 이미지 데이터와 비교함으로써, 상기 인식 데이터를 검사하는 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.And identifying the identification data by comparing the identification data with the displayed digital image data superimposed on an image of an identification form. 제 56 항에 있어서,The method of claim 56, wherein 폼위에 기록한 비표준 심볼에 기초하여 폼위의 관련 정보를 인식하는 소프트웨어를 더 포함하는 것을 특징으로 하는 자동식별 컴퓨터 소프트웨어.Further comprising software for recognizing the relevant information on the form based on the non-standard symbols recorded on the form.
KR1020027008936A 2000-01-11 2001-01-09 A method and system for form recognition and digitized image processing KR20030011271A (en)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US09/480,914 US6697056B1 (en) 2000-01-11 2000-01-11 Method and system for form recognition
US09/480,914 2000-01-11
US69228900A 2000-10-19 2000-10-19
US09/692,291 US6707466B1 (en) 2000-01-11 2000-10-19 Method and system for form recognition and digitized image processing
US09/692,272 US6600482B1 (en) 2000-01-11 2000-10-19 Method and system for form recognition and digitized image processing
US09/692,272 2000-10-19
US09/692,289 2000-10-19
US09/692,291 2000-10-19

Publications (1)

Publication Number Publication Date
KR20030011271A true KR20030011271A (en) 2003-02-07

Family

ID=49322860

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020027008936A KR20030011271A (en) 2000-01-11 2001-01-09 A method and system for form recognition and digitized image processing

Country Status (1)

Country Link
KR (1) KR20030011271A (en)

Similar Documents

Publication Publication Date Title
US6707466B1 (en) Method and system for form recognition and digitized image processing
US6697056B1 (en) Method and system for form recognition
US6600482B1 (en) Method and system for form recognition and digitized image processing
US7131061B2 (en) System for processing electronic documents using physical documents
US7577295B2 (en) Markup symbol document processing system
US7489415B2 (en) Document processing system
US8732570B2 (en) Non-symbolic data system for the automated completion of forms
EP1672473A2 (en) Stamp sheet
JPH06149970A (en) Method and apparatus for processing image of document data
JP4785655B2 (en) Document processing apparatus and document processing method
US20110286043A1 (en) Form processing system, ocr device, form creation device, and computer readable medium
US20040036681A1 (en) Identifying a form used for data input through stylus movement by means of a traced identifier pattern
EP1654610B1 (en) Method and system for identifying multiple questionnaire pages
US5887088A (en) Inputting device and inputting method for information processing system
JP2008059157A (en) Document confirmation support system, document confirmation support device and program
JP4868224B2 (en) Additional recording information processing method, additional recording information processing apparatus, and program
US20060290999A1 (en) Image processing apparatus and network system
JP2003018393A (en) Image processing system
WO2001052519A1 (en) A method and system for form recognition and digitized image processing
US20150261735A1 (en) Document processing system, document processing apparatus, and document processing method
JP2008003739A (en) Input correction method, postscript information processing method, postscript information processor, and program
JP2005234790A (en) Handwritten slip processing system and method
KR20030011271A (en) A method and system for form recognition and digitized image processing
US20110304890A1 (en) Method for automatic conversion of paper records to digital form
JP4710707B2 (en) Additional recording information processing method, additional recording information processing apparatus, and program

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination