본문 바로가기

이것저것

chatGPT 연동 AR 글래스 rizzGPT(whisper, Monocle AR, 구글 glass 비교)

반응형

스탠포드 학생들이 chatGPT와 연동하여 응답을 표시하는 AR 글래스를 만들었다는 소식입니다. 

약간은 예전 구글 글래스와 비슷해 보이는데요. 

 

 

구글 글래스는 이미 한번 실패를 경험 했죠

 

"구글 글래스는 안경 형태의 웨어러블 기기로서 음성인식을 주요 입력 인터페이스로 사용하였으나, 다른 언어로 말하거나 명령하는 경우 인식에 실패할 수 있었고, 또한 입력한 내용을 키보드로 수정할 수 없는 등의 한계가 있다

세계 최초로 AR 글래스를 출시한 구글은 역사적으로 길이 남을 실패사례를 남긴채 제품을 단종했다"

 

구글 글래스

구글 글래스 3의 스펙은 다음과 같습니다. 

 

  • TI OMAP 4430 SoC. ARM Cortex-A9 MP2 1.2 GHz CPU, PowerVR SGX540 304 MHz GPU
  • 2GB LPDDR2 SDRAM, 16GB 내장 메모리 (사용가능 메모리 12GB)
  • 8피트 거리의 25인치 HD 스크린, 또는 640×360 Himax HX7309 LCoS 디스플레이
  • 모노 골전도 이어폰
  • Wi-Fi 1/2/3, 블루투스
  • 500만 화소, 720p 카메라 레코딩
  • 트랙패드, MyGlass 앱 
  • Li-ion 570mAh, 마이크로 USB 충전
  • 36g

 

 

rizzGPT는 어떨까요?

rizzGPT는 아직 정확한 스펙은 공개하지 않은 듯 합니다. 

 

어디에 응용이 가능할까요?

소개글에는 어색한 데이트에서 할말을 chatGPT가 알려준다는 내용인데...

마주보고 앉아서 chatGPT가 불러주는 내용을 사람이 따라하는건 좀 이상하긴 합니다. 

이제 시작인 거겠죠?

 

 

rizzGPT

 

 

아래는 샘플 영상입니다. 

 

https://twitter.com/i/status/1639830383616487426

 

 

반응형

 

기본 연동기능은 스마트폰을 이용하여 구현했습니다. 마이크 입력을 블루투스로 스마트폰에 전달 하고  음성 신호의 텍스트 변환은 잘 알려진 음성인식 모델인 whisper를 사용하고 있다고 합니다.

상대방의 언어를 text로 변환해서 chatGPT에 전달하고 응답을 글래스에 표시하는 형태로 보입니다. 

 

 

이렇게 시작된 기술이 또 몇년 내에 어떠한 변화를 만들어 낼지 궁금합니다.

반응형