본문 바로가기

반응형

IT

easyOCR을 이용하여 이미지에서 문자 인식해보기(초간단) EasyOCR은 이미지 내의 텍스트를 감지하고 인식하는 데 사용할 수 있는 오픈 소스 라이브러리입니다  Python 프로그래밍 언어로 작성되어 사용하기도 편하고 상당히 훌륭한 인식율을 보여줍니다. 물론 다양한 언어를 지원하고 있어 응용범위도 넓습니다.  1. easyOCR의 특징  (1) 다양한 언어 지원  EasyOCR은 80개 이상의 언어를 지원하며, 이를 통해 전 세계 다양한 문화와 언어의 텍스트 인식이 가능합니다.  영어, 중국어, 한국어, 일본어, 아랍어 등 다양한 언어를 포함하고 있습니다. (2) 딥러닝 기반 Convolutional Neural Networks(CNN)와 Recurrent Neural Networks(RNN), 그리고 CTC(Connectionist Temporal Class.. 더보기
파일 시스템이란? NTFS와 exFAT 특징과 차이점 도우에서 대용량 디스크를 포맷할때 항상 고민이 되는 부분입니다. NTFS를 사용할 것인가? 아니면 exFAT를 사용할 것인가? 일단 파일 시스템이 무엇인지 알아보겠습니다. 1. 파일 시스템이란? 파일 시스템은 윈도우나 리눅스 OS에서 파일을 저장, 관리, 검색하는 방식을 정의하는 구조와 규칙의 집합입니다. 운영 체제는 파일 시스템을 사용하여 데이터를 디스크나 다른 저장 매체에 효율적으로 저장하고, 사용자가 쉽게 접근할 수 있도록 합니다. 파일 시스템의 주요 기능 (1) 데이터 저장 파일 시스템은 데이터를 파일 형태로 저장하고, 이 파일들을 폴더로 구분함 (2) 데이터 관리 파일에 대한 정보(생성일, 수정일, 크기 등)를 관리하고, 사용자 권한 설정을 통해 접근을 제어함 (3) 데이터 검색 및 접근 파일 .. 더보기
GPT-4 Turbo 성능 및 API 가격 비교(chatGPT4, 타모델과 성능 비교) 1. GPT-4 Turbo란? GPT-4 터보는 GPT-4 출시 후 2023년 11월에 출시된 OpenAI의 최신 모델입니다. 다른 모델들이 2021년 까지의 정보를 제공하는 것과 달리 2023년 4월까지 최신 정보를 제공할 수 있는 것도 특징입니다. 여기에, 한 번의 프롬프트에 300페이지 분량의 텍스트를 넣을 수 있는 128k 컨텍스트를 지원합니다. GPT4는 8K,32K를 지원했었죠. 2. API 가격 비교 이상하군요. context 입력이 128k로 늘어나고 23년 초까지의 데이터가 포함된 GPT-4 Turbo의 API 사용 가격이 훨씬 더 쌉니다. 그냥 싼것도 아니고 1/3 이하의 가격이네요 왜 그러지? 사용자가 Turbo로 넘어오게 하려는 정책일까요? 3. 성능 비교 더보기
google gemini API vision 모델을 이용한 이미지 해석 기초(제미나이, gemini-pro-vision) 여기서는 google gemini API를 이용하여 vision 모델을 구동 시켜 보는 예제를 살펴 보겠습니다. API 사용에 대한 기초는 다음을 참고. https://yongeekd01.tistory.com/179 google gemini API 이용 개발 기초(제미나이 소개, API 사용준비, 모델들, gemini-pro, gemini-pro-vision) 1. Google gemini 소개 1.1 Gemini 개요 제미나이는 구글 AI에서 개발한 멀티모달 기반 대규모 언어 모델입니다. 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 형태의 정보를 이해하고 처리할 수 있는 yongeekd01.tistory.com 1. gemini-pro-vision 모델 사용 예제 Gemini는 텍스트와 이미지 .. 더보기
google gemini API text 모델을 이용한 개발 기초(제미나이, gemini-pro) 여기서는 google gemini API를 이용하여 Text 모델을 구동 시켜 보는 예제를 살펴 보겠습니다. API 사용에 대한 기초는 다음을 참고. https://yongeekd01.tistory.com/179 google gemini API 이용 개발 기초(제미나이 소개, API 사용준비, 모델들, gemini-pro, gemini-pro-vision) 1. Google gemini 소개 1.1 Gemini 개요 제미나이는 구글 AI에서 개발한 멀티모달 기반 대규모 언어 모델입니다. 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 형태의 정보를 이해하고 처리할 수 있는 yongeekd01.tistory.com 1. gemini-pro 모델 사용 예제 GenerativeModel을 이용하여 원하는 .. 더보기
google gemini API 이용 개발 기초(제미나이 소개, API 사용준비, 모델들, gemini-pro, gemini-pro-vision) 1. Google gemini 소개 1.1 Gemini 개요 제미나이는 구글 AI에서 개발한 멀티모달 기반 대규모 언어 모델입니다. 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 형태의 정보를 이해하고 처리할 수 있는 능력을 가지고 있습니다 * Gemini 1.0은 3가지 모델로 제공됩니다. - Gemini Ultra - 매우 복잡한 작업을 위한 가장 크고 성능이 뛰어난 모델 - Gemini Pro - 다양한 작업에 걸쳐 확장할 수 있는 모델 - Gemini Nano - 온디바이스 작업에 가장 효율적인 모델 Gemini 1.0 성능 벤치 마크 결과는 다음과 같다고 구글에서 발표했습니다. 수치상으로는 GPT-4를 앞지르는 것으로 보이지만 수치와 달리 실제 사용자 평가는 그다지 좋지 못했습니다. 구글에.. 더보기
rocky linux docker 시간 설정 변경(timezone, timedatectl) 일반적으로 ntp등을 이용하여 시간 싱크를 맞출때 rdate 명령어를 주로 사용하는 경우가 많은데 rocky linux에서는 rdate를 제공하지 않는다. 기본적으로 설치된 timezone을 변경하기 위해서는 timedatectl을 사용하게된다. 1. rocky linux timezone 변경 (host) host에서는 직접 변경할 수 있다. 먼저 현재 설정을 확인하고 set-timezone을 이용하여 설정한다. [root@localhost ~]# timedatectl Local time: 수 2024-04-03 00:33:15 EDT Universal time: 수 2024-04-03 04:33:15 UTC RTC time: 수 2024-04-03 04:33:15 Time zone: America/Ne.. 더보기
Rocky linux 시스템의 현재 접속 정보와 작업 정보 알아내기(who, w, last, netstat, ss) 시스템을 운용하다보면 부하가 올라가거나 상태가 이상할때 원인을 확인하고 싶을 때가 있습니다. ps -ef 로 프로세스를 확인하거나 top으로 부하를 확인하는 방법도 있지만 역시 확실한건 접속자와 실행 중인 작업을 알아내는 것이죠. Linux 시스템에서 현재 접속한 사용자를 확인하는 방법에는 여러 가지가 있습니다. 주로 사용하는 명령어는 who, w, last입니다. 이 명령어들은 시스템 관리자가 사용자의 로그인 상태를 모니터링하거나 문제 해결이 필요할 때 아주 유용하지만 의외로 잘 모르시는 분들이 많습니다. 각각에서 제공되는 정보는 다음과 같습니다. 1. who 명령어 who 명령어는 -a 옵션과 함께 사용하여 로그인한 사용자, 그들의 IP 주소, 로그인 방식 등을 포함한 상세 정보를 제공할 수 있습니다.. 더보기

반응형