'IT/개발' 카테고리의 글 목록 (2 Page)

본문 바로가기

IT/개발

vlc를 이용해서 동영상 파일을 rtsp 스트림으로 전송하기 개발하면서 테스트 하다보면 스트림을 가상으로 생성해서 수신해야 하는 경우가 있습니다. 여기서는 많이 사용하는 vlc 를 이용하여 rtsp 스트림을 전송해보고 다른 app에서 수신해보겠습니다. 1. 네트워크 스트림 열기 미디어 > 스트림하기 선택 스트림할 대상 파일 추가 하기 스트림 드롭다운에서 스트림 선택 스트림 출력을 rtsp로 선택 추가하기를 눌러서 rstp 주소를 생성합니다.이 주소로 다른 장치나 app에서 access 가능 합니다. 트랜스코딩은 코덱 변경등이 필요할때는 해도 좋고 원본 대로 내보내도 상관 없습니다. 이제 스트림 버튼 누릅니다. 프로그래스 바로 재생이 시작되는 것을 볼수 있습니다. 재생 중 화면이 보이지는 않습니다. 반복 재생 하고 싶으면 아래 루.. 더보기

google Gemma 2 개요 및 간단 테스트 1. 개요 LLM 시장에서 뒤쳐진 채로 열심히 뒤따라가고 있는 구글이 또 제미나이를 기반으로 하는 또 하나의 모델을 버전업 해서 출시했습니다. 항상 그렇지만 이번엔 정말 좋아요... 라는 멘트와 함께 발표자료를 보면 다음과 같네요. 효율성과 성능을 위한 새로운 개방형 모델 표준 * 특대형 성능 27B에서 Gemma 2는 해당 크기 클래스에서 최고의 성능을 제공하며, 심지어 크기가 두 배 이상인 모델에 대한 경쟁력 있는 대안을 제공합니다. 9B Gemma 2 모델도 클래스 최고의 성능을 제공하며, 크기 범주에서 Llama 3 8B 및 기타 개방형 모델을 능가합니다. * 탁월한 효율성 및 비용 절감 27B Gemma 2 모델은 단일 Google Cloud TPU 호스트, NVIDIA A100 80.. 더보기

ChatGPT API로 구현할때 토큰 수 제한 문제 해결하기(문자열 token 수 세기, tiktoken) 이전에 chatGPT를 API를 이용해서 Discord bot 을 구현 했습니다. 아래 참조 https://yongeekd01.tistory.com/193 chatGPT를 discord bot으로 만들어보자(초간단, 대화기억, chatGPT-4o)1. discord 서버 생성하기 우선 discord bot이 일을 하기 위한 서버환경을 만들어 줘야 합니다. 하나 생성해볼까요? discord를 실행하고 좌측의 + 버튼을 눌러서 서버를 생성합니다. 서버의 이름yongeekd01.tistory.com 생각해보니 채팅을 무한히 반복하면 토큰수가 초과되어 세션에 문제가 생기는걸 깜빡 했습니다. 그부분을 해결해 보겠습니다. 대화를 계속 누적해서 보내다 보니 생길 수 밖에 없는 문제겠네요. openai에서.. 더보기

chatGPT를 discord bot으로 만들어보자(초간단, 대화기억, chatGPT-4o) 1. discord 서버 생성하기 우선 discord bot이 일을 하기 위한 서버환경을 만들어 줘야 합니다. 하나 생성해볼까요? discord를 실행하고 좌측의 + 버튼을 눌러서 서버를 생성합니다. 서버의 이름을 지정하고 서버 이미지도 간단하게 넣어줍니다.이후 만들기 버튼을 누르면 왼쪽 서버목록에 추가된 것을 볼 수 있습니다. 초대한 사람만 사용할 수 있도록 채널권한을 비공개로 변경해 줍니다. 2. Bot 생성하기 다음 url로 접속해서 application을 생성합니다. https://discord.com/developers/applications Discord Developer Portal — API Docs for Bots and DevelopersIntegrate your s.. 더보기

pytorch openpose를 사용해보자(초간단, yolov9 연동 결과) OpenPose는 사람의 자세 인식을 위한 오픈 소스 딥러닝 모델 입니다. 이 라이브러리는 단일 이미지나 비디오에서 사람의 뼈대구조에 대한 키포인트를 실시간으로 감지할 수 있습니다. 주로 다음과 같은 기능을 제공합니다. (1) 다수의 사람 객체 인식 이미지나 비디오에서 여러 사람을 동시에 감지하고 각 사람의 자세를 추출 (2) 다중 키포인트 인식 사람의 신체 부위(어깨, 팔꿈치, 손목, 무릎, 발목 등)와 얼굴, 손의 키포인트를 인식 (3) 실시간 처리 GPU를 활용하여 실시간으로 이미지나 영상에서 사람의 자세를 분석 Body Pose Estimation: 신체의 18개 주요 부위를 감지합니다. Hand Keypoint Detection: 각 손의 21개 키포인트를 감지합니다. 그외에 잘 사.. 더보기

paddle OCR을 이용해서 문자 인식 해보기(easy OCR과 결과 비교) PaddleOCR은 중국어, 한글 등 여러 언어를 지원하는 PaddlePaddle 기반의 OCR 라이브러리입니다. 관련된 작업을 할 일이 있어서 Tesseract OCR, Easy OCR, Paddle OCR 을비교해보고 있는데 결과적으로 paddle OCR이 성능이 상당이 좋네요. 확인해보겠습니다. 1 필요한 패키지 설치 pip install paddlepaddle pip install paddleocr *gpu 사용시 pip install paddlepaddle-gpu 2. 기본 코드 작성 이미지 읽어서 박스치고 아래에 인식된 문자열 출력 하는 코드 from paddleocr import PaddleOCRfrom PIL import Image, ImageDraw, ImageFontim.. 더보기

객체 탐지 모델 YOLO의 버전별 라이센스 비교 (MIT, Apache 2.0, GPL-3.0, AGPL-3.0 차이, license) 1. YOLO 개요 YOLO (You Only Look Once)는 객체 탐지(Object Detection) 분야에서 널리 사용되는 딥러닝 모델입니다. 객체 탐지 모델은 이미지나 비디오 프레임에서 객체의 위치와 종류를 식별하는 데 사용됩니다. YOLO는 그 이름에서 알 수 있듯이 이미지를 한 번에 처리하여 객체를 탐지하는 방식을 사용합니다. 이는 다른 모델들이 사용하는 슬라이딩 윈도우나 영역 제안(region proposal) 방식을 사용하는 것과 대조적입니다 버전별 특성 비교를 보면 다음과 같습니다. 출처 : https://github.com/WongKinYiu/yolov9 2. YOLO의 주요 특징 요약 *속도와 효율성 YOLO는 전체 이미지를 단 한 번의 전진 패스(forward pass).. 더보기

chatGPT-4o를 이용하여 이미지 분석하기(gpt-4-turbo, gpt-4o, Image Description, 이미지 해석 예제코드) 이번에 새로 chatGPT-4o가 발표되었습니다. 이미지를 분석하는 비전기능은 예전에 gpt-4-vision-preview 모델을 통해서 할 수 있었는데 이제는 통합 모델로 나오고 있습니다. 2024.05 현재 OpenAI 에서 Vision 기능을 사용할 수 있는 모델은 다음과 같습니다. 1. GPT Vision 모델 상세한 내용은 다음을 참고 하세요 https://platform.openai.com/docs/models 2. API를 이용하여 이미지 해석 해보기 (1) URL 이미지 온라인 이미지를 url 로 접근해서 해석해보겠습니다. from openai import OpenAIclient = OpenAI()#URL을 이용하여 이미지 전달 하기 response = client.chat.. 더보기

이전 1 2 3 4 5 ··· 7 다음

티스토리툴바