'IT' 카테고리의 글 목록 (4 Page)

Ubuntu에서 방화벽 설정하기(우분투 ufw, IP범위, 포트범위)

Ubuntu의 방화벽 설정은 ufw와 iptables라는 두 가지 주요 도구를 사용하여 관리할 수 있습니다. ufw는 "Uncomplicated Firewall"의 약자로, 사용이 매우 간단하고 직관적인 반면 iptables는 더 세밀한 제어와 고급 기능을 제공하는 방화벽 도구입니다. * UFW 사용이 간편하고 직관적 간단한 방화벽 설정에 적합 명령어가 쉽고 빠르게 규칙을 추가/삭제 가능 * IPTables 더 세밀한 제어와 고급 기능 제공 복잡한 네트워크 환경에서 유리 다양한 체인과 규칙을 사용하여 복잡한 필터링 가능 두 도구 모두 시스템 보안을 강화하기 위해 매우 유용하지만, 각각의 특성과 장단점을 이해하고 필요에 맞게 선택하는 것이 중요합니다. UFW는 간단한 설정에, IPTables는 고급 설정에..

IT/리눅스 2024.06.05

객체 탐지 모델 YOLO의 버전별 라이센스 비교 (MIT, Apache 2.0, GPL-3.0, AGPL-3.0 차이, license)

1. YOLO 개요 YOLO (You Only Look Once)는 객체 탐지(Object Detection) 분야에서 널리 사용되는 딥러닝 모델입니다. 객체 탐지 모델은 이미지나 비디오 프레임에서 객체의 위치와 종류를 식별하는 데 사용됩니다. YOLO는 그 이름에서 알 수 있듯이 이미지를 한 번에 처리하여 객체를 탐지하는 방식을 사용합니다. 이는 다른 모델들이 사용하는 슬라이딩 윈도우나 영역 제안(region proposal) 방식을 사용하는 것과 대조적입니다 버전별 특성 비교를 보면 다음과 같습니다. 출처 : https://github.com/WongKinYiu/yolov9 2. YOLO의 주요 특징 요약 *속도와 효율성 YOLO는 전체 이미지를 단 한 번의 전진 패스(forward pass)..

IT/개발 2024.05.22

chatGPT-4o를 이용하여 이미지 분석하기(gpt-4-turbo, gpt-4o, Image Description, 이미지 해석 예제코드)

이번에 새로 chatGPT-4o가 발표되었습니다. 이미지를 분석하는 비전기능은 예전에 gpt-4-vision-preview 모델을 통해서 할 수 있었는데 이제는 통합 모델로 나오고 있습니다. 2024.05 현재 OpenAI 에서 Vision 기능을 사용할 수 있는 모델은 다음과 같습니다. 1. GPT Vision 모델 상세한 내용은 다음을 참고 하세요 https://platform.openai.com/docs/models 2. API를 이용하여 이미지 해석 해보기 (1) URL 이미지 온라인 이미지를 url 로 접근해서 해석해보겠습니다. from openai import OpenAIclient = OpenAI()#URL을 이용하여 이미지 전달 하기 response = client.chat..

IT/개발 2024.05.21

ChatGPT-4o, GPT-4 Turbo 특성 및 가격 비교(OpenAI API 사용예제)

또 난리가 났네요. 이번에 OpenAI에서 최신 모델을 또 발표 했습니다. 어디까지 발전할까요? 모델을 발표할때마다 API 비용은 계속해서 낮추고 있어 진입 장벽은 점점 낮아지고 있습니다.시장을 다 먹어버리고 올리는건 아닐지.... 의심 일단 GPT-4o 에 대해서 간단히 살펴 보면 "GPT-4o("옴니"의 "o"는 "옴니"를 의미)는 훨씬 더 자연스러운 인간과 컴퓨터 간의 상호작용을 위한 단계로, 텍스트, 오디오, 이미지 및 비디오의 모든 조합을 입력으로 받아들이고 텍스트, 오디오 및 이미지의 모든 조합을 출력으로 생성합니다. 최소 232밀리초, 평균 320밀리초 만에 오디오 입력에 응답할 수 있으며, 이는 대화에서 사람의 응답 시간(새 창에서 열기)과 비슷한 수준입니다. 영어 텍스트 및 코드에 ..

IT/개발 2024.05.16

tesseract OCR을 이용하여 이미지에서 문자 인식해보기(초간단)

Tesseract OCR (Optical Character Recognition)은 이미지에서 텍스트를 추출하는 데 사용되는 강력하고 오픈 소스 소프트웨어로 다양한 운영 체제에서 널리 사용되고 있습니다. Tesseract는 Hewlett-Packard (HP)에서 1985년에 개발이 시작되었으며, 2005년부터는 Google이 개발을 주도하고 있습니다. 1. tesseract 특징 - Tesseract는 100개 이상의 언어를 지원하며, 각 언어에 대한 트레이닝 데이터를 통해 인식 능력을 강화할 수 있습니다. 사용자는 특정 언어를 위한 트레이닝 데이터 파일을 다운로드하여 사용할 수 있습니다. - 사용자는 자신만의 트레이닝 데이터를 생성하여 Tesseract의 인식 능력을 특정 언어나 글꼴에 맞게 조..

IT/개발 2024.05.09

easyOCR을 이용하여 이미지에서 문자 인식해보기(초간단)

EasyOCR은 이미지 내의 텍스트를 감지하고 인식하는 데 사용할 수 있는 오픈 소스 라이브러리입니다 Python 프로그래밍 언어로 작성되어 사용하기도 편하고 상당히 훌륭한 인식율을 보여줍니다. 물론 다양한 언어를 지원하고 있어 응용범위도 넓습니다. 1. easyOCR의 특징 (1) 다양한 언어 지원 EasyOCR은 80개 이상의 언어를 지원하며, 이를 통해 전 세계 다양한 문화와 언어의 텍스트 인식이 가능합니다. 영어, 중국어, 한국어, 일본어, 아랍어 등 다양한 언어를 포함하고 있습니다. (2) 딥러닝 기반 Convolutional Neural Networks(CNN)와 Recurrent Neural Networks(RNN), 그리고 CTC(Connectionist Temporal Class..

IT/개발 2024.05.03

파일 시스템이란? NTFS와 exFAT 특징과 차이점

도우에서 대용량 디스크를 포맷할때 항상 고민이 되는 부분입니다. NTFS를 사용할 것인가? 아니면 exFAT를 사용할 것인가? 일단 파일 시스템이 무엇인지 알아보겠습니다. 1. 파일 시스템이란? 파일 시스템은 윈도우나 리눅스 OS에서 파일을 저장, 관리, 검색하는 방식을 정의하는 구조와 규칙의 집합입니다. 운영 체제는 파일 시스템을 사용하여 데이터를 디스크나 다른 저장 매체에 효율적으로 저장하고, 사용자가 쉽게 접근할 수 있도록 합니다. 파일 시스템의 주요 기능 (1) 데이터 저장 파일 시스템은 데이터를 파일 형태로 저장하고, 이 파일들을 폴더로 구분함 (2) 데이터 관리 파일에 대한 정보(생성일, 수정일, 크기 등)를 관리하고, 사용자 권한 설정을 통해 접근을 제어함 (3) 데이터 검색 및 접근 파일 ..

IT/리눅스 2024.04.17

GPT-4 Turbo 성능 및 API 가격 비교(chatGPT4, 타모델과 성능 비교)

1. GPT-4 Turbo란? GPT-4 터보는 GPT-4 출시 후 2023년 11월에 출시된 OpenAI의 최신 모델입니다. 다른 모델들이 2021년 까지의 정보를 제공하는 것과 달리 2023년 4월까지 최신 정보를 제공할 수 있는 것도 특징입니다. 여기에, 한 번의 프롬프트에 300페이지 분량의 텍스트를 넣을 수 있는 128k 컨텍스트를 지원합니다. GPT4는 8K,32K를 지원했었죠. 2. API 가격 비교 이상하군요. context 입력이 128k로 늘어나고 23년 초까지의 데이터가 포함된 GPT-4 Turbo의 API 사용 가격이 훨씬 더 쌉니다. 그냥 싼것도 아니고 1/3 이하의 가격이네요 왜 그러지? 사용자가 Turbo로 넘어오게 하려는 정책일까요? 3. 성능 비교

IT/개발 2024.04.11

google gemini API vision 모델을 이용한 이미지 해석 기초(제미나이, gemini-pro-vision)

여기서는 google gemini API를 이용하여 vision 모델을 구동 시켜 보는 예제를 살펴 보겠습니다. API 사용에 대한 기초는 다음을 참고. https://yongeekd01.tistory.com/179 google gemini API 이용 개발 기초(제미나이 소개, API 사용준비, 모델들, gemini-pro, gemini-pro-vision)1. Google gemini 소개 1.1 Gemini 개요 제미나이는 구글 AI에서 개발한 멀티모달 기반 대규모 언어 모델입니다. 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 형태의 정보를 이해하고 처리할 수 있는yongeekd01.tistory.com 1. gemini-pro-vision 모델 사용 예제 Gemini는 텍스트와 이미지 및..

IT/개발 2024.04.04

google gemini API text 모델을 이용한 개발 기초(제미나이, gemini-pro)

여기서는 google gemini API를 이용하여 Text 모델을 구동 시켜 보는 예제를 살펴 보겠습니다. API 사용에 대한 기초는 다음을 참고. https://yongeekd01.tistory.com/179 google gemini API 이용 개발 기초(제미나이 소개, API 사용준비, 모델들, gemini-pro, gemini-pro-vision) 1. Google gemini 소개 1.1 Gemini 개요 제미나이는 구글 AI에서 개발한 멀티모달 기반 대규모 언어 모델입니다. 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 형태의 정보를 이해하고 처리할 수 있는 yongeekd01.tistory.com 1. gemini-pro 모델 사용 예제 GenerativeModel을 이용하여 원하는 ..

IT/개발 2024.04.04

빗자루검 블로그

IT 138

티스토리툴바