본문 바로가기
프로그래머

ChatGPT 사진분석시키기 | ChatGPT 4.0 마트 채소 및 과일 사진 가격정리 자동화

by 정보경험 2023. 12. 10.
반응형

아이언맨 자비스와 OpenAI ChatGPT
아이언맨 자비스와 OpenAI ChatGPT

 

마트에서 과일 및 채소 가격들을 찍어 왔습니다. 다른 백화점 마트나 동네 마트 등과 가격 비교를 하고 싶어서 ChatGPT에게 정리 요청을 하면 효율적으로 힘 안들이고 정리를 해줄수 있을지 궁금해서 실험 해보기로 했습니다. 

 

 

1. ChatGPT 준비 ( 유료 구독 버전 필요 )  

ChatGPT를 실행 시킵니다. ( 저는 유료 구독을 하고 있습니다. ) ChatGPT에 접속하는 것은 이제 모르는 사람이 없을꺼 같습니다.

아래 링크를 클릭해서 접속합니다. 

https://chat.openai.com/

 

저는 유료사용자라서 항상 ChatGPT4를 기본적으로 사용하고 있어 화면이 아래와 같습니다. 

유료 버젼은 아래 보시는것과 같이 파일을 읽혀서 트레이닝을 시킬수가 있습니다. 이번에 활용 하려는것은 이 파일 로딩을 통한 분석 요청입니다. 속도도 훨씬 빠릅니다. 

 

 

 

 

 

일반 유료 구독자가 아닌 사용자분들이 쓰는것은 아래 ChatGPT3.5 일겁니다. ChatGPT3.5 파일 로딩 기능이 보이지 않습니다. 

 

 

 

ChatGPT4 에서 아래 파일 읽어들이기 버튼을 클릭 합니다. 

 

 

 

 

2. 단순 하나의 이미지 분석 요청하기 

1) 분석 내용 및 과정 

좀더 단순한 내용을 분석 시켜 보겠습니다.

 

 

 

 

 

 

 

 

 

 

 

  2. 결론 

 사진 분석은 아무것도 아니네요, 너무 훌륭합니다. 사진에 나온 과일들의 이름을 찾아 내고 가격포 포장 브랜드 라벨링까지 잘 파악 하는것에 대해서 놀랍고 더 놀라운 사실은 사진 분석으로 끝나는게 아니고 추측과 추론을 할수 있다는게 더 놀랍습니다.  매장의 환경이라던지 한국에서 판매 되고 있을꺼라던지 고객이 독립적으로 살펴 볼수 있는 자율 쇼핑 환경이라던지 정말 믿을수 없는 답변을 주었습니다.  인턴 처럼 활용 가능하다는 말이 틀리지 않았네요. 계속 발전하면 영화 아이언맨의 자비스( J.A.R.V.I.S. )처럼 더 고도의 발달된 조력자로 활약도 가능할꺼 같습니다.

 

제가 하는 업무에 어떻게 사용하느냐에 따라 엄청난 효율성을 높일수 있을꺼 같습니다. 

 

 

 

이정도면 분석과 심지어 추론까지 어느 정도 할수 있을 정도로 대단하다는 생각이 들었습니다. 

 

 

2. 복잡한 이미지 대량 분석 요청 하기 

1) 분석 내용 및 과정  

 

대량 분석을 요청할 이미지 준비 

 

마트의 사진으로 준비했습니다. 제품 모습과 상품명 그리고 가격표가 여러제품들을 핸드폰으로 찍었습니다. 

항상 물건을 사러갈때 얼마지 얼마지 그렇타고 전단지 보기도 그렇고 해서 한번 AI 한테 일을 시켜 볼까하는 생각이 들었습니다. 

 

제품 별로 사진을 보면 

 

 

 

 

 

 

하나의 파일에 대량 이미지를 합치기

 

AI 한테줄 워드 파일 문서를 하나 엽니다. 

 

 

 

폴더에 있는 사진들을 전체 선택합니다. 

 

 

모든 사진들을 워드 파일에 일괄 복사 붙여 넣기 합니다.  하나 하나씩 붙여 넣으면 그것도 시간이 걸리니까 일괄 전체 선택 하고 마우스로 워드 파일 위로 드래그 앤 드랍합니다.   그렇게 하면 저처럼 모든 그림들이 워드파일에 정렬이 되어서 하나씩 아래과 같이 자동으로 들어갑니다. 

 

 

보기 사이즈를 줄이면 이렇게 모두 들어간 것을 확인 할수 있습니다. 

 

 

이제 파일을 저장합니다. 

 

 

 

파일을 폴더에서 선택 하도록 팝업 화면이 뜹니다. 

 

 

해당 파일을 선택 하고 열기를 누릅니다. 

 

 

 

 

 

ChatGPT4에 파일 업로드 및 분석 요청 하기  

 

아래와 같이 파일이 ChatGPT4의 채팅 다이얼로그에 업로드가 완료되었습니다. 

 

 

 

그럼 이제 부터 분석 프롬프트 즉 원한는 요청과 명령을 내려 볼까요? 

 

"파일에 있는 제품들의 명칭과 가격을 테이블로 정리해주세요. 첫번째 칼럼은 순번이고 두번째 칼럼은 제품명 세번째 칼럼은 가격입니다. 4번째 칼럼은 날짜이고 5번째 칼럼은 비고로 기타 정보가 있으면 적어주세요. "

 

 

 

 

 

 

 

 

열심히 분석을 하고 있습니다. 

 

 

 

It seems that the text extraction from the provided document didn't yield any results, which might indicate that the product information is not in a standard text format or might be contained in a different part of the document, such as tables or embedded images.

I will attempt a different approach to locate and extract the product names, prices, dates, and any additional information from the document. Let's proceed with this analysis. ​

The document doesn't contain any tables or standard text data with the product information. Another possibility is that the product details might be embedded in images within the document. I will now check for any images in the document and if found, I can perform image analysis to extract the required information. Let's proceed with this step. ​

Several images have been successfully extracted from the document. The next step is to analyze these images to identify and extract the product names, prices, dates, and any additional remarks.

I will begin by analyzing the first few images to see if they contain the relevant product information. Let's proceed with this analysis. ​

I have loaded the first few images for inspection. To proceed, I will analyze these images to extract the product names, prices, dates, and any additional remarks. This analysis will involve image recognition and text extraction. Let's start with the first image. ​

The OCR (Optical Character Recognition) results from the first few images do not provide clear or coherent text. This could be due to various factors such as the quality of the images, the complexity of the layout, or the font used in the document.

Given the complexity of extracting information from these images, a more effective approach might involve manual analysis. If you can identify specific images that likely contain the product information you're interested in, I can focus on those images for a more targeted analysis. Please let me know how you would like to proceed. ​

 

 
 
 

 

 

 

제공된 문서에서 텍스트를 추출해도 아무런 결과가 나오지 않은 것 같습니다. 이는 제품 정보가 표준 텍스트 형식이 아니거나 표나 삽입된 이미지 등 문서의 다른 부분에 포함되어 있을 수 있음을 의미할 수 있습니다.

문서에서 제품 이름, 가격, 날짜 및 추가 정보를 찾아 추출하기 위해 다른 접근 방식을 시도하겠습니다. 이 분석을 진행해 보겠습니다.​​

문서에는 제품 정보가 포함된 표나 표준 텍스트 데이터가 포함되어 있지 않습니다. 또 다른 가능성은 제품 세부 정보가 문서 내의 이미지에 포함될 수 있다는 것입니다. 이제 문서에 이미지가 있는지 확인하고 이미지가 있으면 이미지 분석을 수행하여 필요한 정보를 추출할 수 있습니다. 이 단계를 진행해 보겠습니다.​​

문서에서 여러 이미지가 성공적으로 추출되었습니다. 다음 단계는 이러한 이미지를 분석하여 제품 이름, 가격, 날짜 및 추가 설명을 식별하고 추출하는 것입니다.

처음 몇 개의 이미지를 분석하여 관련 제품 정보가 포함되어 있는지 확인하겠습니다. 이 분석을 진행해 보겠습니다.​​

검사를 위해 처음 몇 개의 이미지를 로드했습니다. 계속 진행하려면 이러한 이미지를 분석하여 제품 이름, 가격, 날짜 및 추가 설명을 추출하겠습니다. 이 분석에는 이미지 인식 및 텍스트 추출이 포함됩니다. 첫 번째 이미지부터 시작해 보겠습니다.​​

처음 몇 이미지의 OCR(광학 문자 인식) 결과는 명확하거나 일관된 텍스트를 제공하지 않습니다. 이는 이미지 품질, 레이아웃의 복잡성, 문서에 사용된 글꼴 등 다양한 요인으로 인해 발생할 수 있습니다.

 

ChatGPT4에 파일 업로드 및 분석 요청 하기 


이러한 이미지에서 정보를 추출하는 작업의 복잡성을 고려할 때 보다 효과적인 접근 방식에는 수동 분석이 포함될 수 있습니다. 관심 있는 제품 정보가 포함되어 있을 가능성이 높은 특정 이미지를 식별할 수 있는 경우, 보다 타겟화된 분석을 위해 해당 이미지에 집중할 수 있습니다. 어떻게 진행하고 싶은지 알려주시기 바랍니다.​​

 

 

복잡도가 높은 이미지 파일들을 많이 담은 것들은 분석을 전혀 못하네요. 

 

 

 

 

 

 

 

 

 

 

정확하게 가격을 읽어 들여서 표현을 했습니다. 

바코드 이미지가 흐릿하지만 혹시나 해서 일을 시켜 볼께요. 

 

 

 

 

가격 내역이 1개 단위와 여러개 단위의 가격을 정리 하도록 추가 명령어를 주어서 정리 요청을 해야할꺼 같습니다. 

 

[아래와 같이 추가 요청을 합니다. ]

 

아보카도 제품명을 이미지에 있는 제품명으로 바꾸어 주세요. 단위 칼럼을 추가해서 1개 구매시 가격이 얼마인지 그리고 9900원은 몇개를 구매했을때의 가격인지 단위에 개수를 표기해서 테이블을 수정 해서 다시 알려주세요.

 

아직은 부족한 점이 보이지만 제가 이미지를 손으로 옮겨적는것 보다는 효율성이 더 높을꺼 같습니다.

 

 

 

분석에 대한 내역은 파이썬 프로그램을 OCR 분석을 해서 아래와 같이 결과를 만들어 준겁니다. 스스로 파이썬 프로그램을 짤수 있는것도 대단하고 OCR을 사용해서 분석을 자동으로 한다는것도 정말 대단하네요. 

 

 

Result

 

(   순번   제품명      가격          날짜   비고           바코드
 0   1  아보카도  9,900원  2023-12-09  1봉지  123456789012,
 '/mnt/data/avocado_price_table_with_barcode.csv')

 

 

2) 결론   

과일 및 채소 사진만으로도 가격 정리 자동화 가능합니다. 

 

테스트와 실험을 통해서 제가 얻은것은  정확한 이미지와 정확한 요청을 한다면 어떠한 사진 분석도 가능하고 추론 및 추측등의 제안도 받을수 있을수 있어 활용도가 다양하고 높을꺼 같습니다. 이정도면 나의 업무의 효율성을 높이기 위해 인턴을 쓰는것처럼 일을 같이 하는것에는 전혀 문제가 되지 않을꺼 같고 오히려 더 많이 활용하고 쓰게 될꺼 같습니다. 구독료를 주는 가치가 충분하여 쓰는 사람들이 많이 늘어 날꺼 같습니다.

 

일부 아쉬운점은 아직은 복잡한 이미지나 불분명한 이미지에 대해서는 일부 분석력이 떨어지는 부분이 있습니다.  뭐 사람들도 해상도나 흐릿한 사진은 분석 못하니 너무 큰기대 일꺼 같기는 하지만 사람이 딱 보면 이해 할수 있고 추론 추측이 가능한 몇가지 부분까지는 못쫓아 오는 점이 아쉽다고 해야 할지 다행이라고 해야할지 많은 생각이 드네요.

 

사진들을 여러 종류 다양하게 시도를 해보아야 어떻게 효율적으로 쓸수 있을지 알수 있을꺼 같습니다. 일단 업무 효율성을 높일수 있으니 ChatGPT가 업무수행이 가능한 범위의 사진이 어떤건지를 좀더 명확하게 저도 테스트를 통해서 인지를 해야 더 잘 일을 시킬수 있을꺼 같습니다. 

 

이젠 AI를 사용한 자동화를 빨리 익히는게 중요한 시대가 되었습니다. AI 특이점이 이미 도래한거 같습니다. 더 심화될꺼 같습니다. 우리 아이들도 미래를 준비할수 있도록 AI를 어떻게 쓰고 활용할지를 잘 가르치고 준비를 시켜야 할꺼 같습니다. 곧 시대가 크게 변혁을 맞이하게 되지 않을지 추측해봅니다.

 

 

 

 

함께보면 좋은 글들입니다. 

 

 

 

 

반응형