OCR은 'Optical Character Recognition'의 약자로, 광학 문자 인식이라는 뜻으로,
스캔된 문서나 이미지에 있는 문자를 컴퓨터가 인식하고 텍스트 데이터로 변환하는 과정입니다.
OCR 인식률은 이미지의 품질, 폰트, 해상도등 에 따라 인식률이 다를수 있는데여,
요즘은 인공지능(AI) 기반의 OCR 기술 등이 보편화 되고 있습니다.
여러 제공 AI 기반의 OCR 기술이 있지만, 스마트메이커에서는 구글에서 제공하는 Vision API 를 사용합니다.
https://cloud.google.com/vision?hl=ko
https://cloud.google.com/vision?hl=ko
cloud.google.com
서비스 이용에 앞서 데모용으로 API 사용해 보기 기능이 있어서 성능 등을 테스트해 볼수 있습니다.
원하는 이미지를 끌어다 놓은 후, 인식을 실행하게 되면 이런 형태로 인식을 하게 됩니다.
자세한 결과값은 JSON 형태로 좌표정보 및 Text 결과값을 보실 수 있습니다.
Google Cloud Vision API 를 사용하기 위해서는
사용량에 따라 비용이 발생하는 서비스 이기 때문에 가입 후, VISA 카드 등록은 필수 입니다.
일단 먼저 API 사용으로 설정이 되어야 하고

구글클라우드 서비스 콘솔에 가셔서 사용자 인증정보 에서 API키를 생성받아야 합니다.
스마트메이커에는 이 서비스를 사용하기 위해 영상인식 아톰을 사용합니다.
아마도 문자 이외에 이미지등도 인식하기 때문에 아톰 이름이 영상인식(이미지?) 인듯 합니다.
API Key 항목에 할당 받은 Key 를 설정하고,
인식대상은 텍스트로 설정합니다.
입력 데이터는 이미지 입력란 아톰을 통해 갤러리나나 카메라를 통해 입력받고,
결과값을 출력 데이터에 설정되어 있는 입력란 아톰을 받을 수 있도록 합니다.
영상인식 아톰클릭후, 사진을 넣어 실행 시키게 되면 입력란 아톰으로 추출된 텍스트를 받게 됩니다.
일단 영수증 이미지에서 텍스트는 잘 추출을 되는군요.
하지만 실용적인 앱개발 (영수증인식, 카드, 명함 인식) 을 위해서는 정형화된 템플릿 방식으로 인식을 위한 논리가 필요해 보입니다.
참고로 네이버에서도 CLOVA OCR 서비스를 제공하고 있는데여,
CLOVA
하이퍼스케일 AI로 플랫폼 경쟁력을 강화하고 비즈니스 시너지를 확장합니다.
clova.ai
비용이 만만치 않군요.ㅠㅠ
'셈플자료실' 카테고리의 다른 글
스마트메이커로 코딩없이 거래명세서 만들기 (0) | 2025.01.24 |
---|---|
스마트메이커 OpenAPI 기능을 이용하여 ChatGPT 사용하기 (0) | 2025.01.23 |
스마트메이커에 웹 위젯 삽입하기 (0) | 2025.01.21 |
스마트메이커 버튼아톰의 갤러리 기능 활용하기 (0) | 2025.01.20 |
스마트메이커 콤보박스 기본값없음 속성 활용하기 (0) | 2025.01.17 |