시스템 전체 구조
이 시스템은 4개의 주요 계층으로 구성되어 있습니다. 각 계층은 XR 글래스를 통해 수집된 사용자의 일상 데이터를 처리, 저장하고 의미있는 정보로 변환하여 제공하는 역할을 합니다. 아래 다이어그램의 각 계층을 클릭하면 해당 섹션으로 이동하여 더 자세한 내용을 확인할 수 있습니다.
1. 데이터 수집 계층
모든 라이프로그는 XR 글래스에 내장된 센서로부터 시작됩니다. 이 센서들은 사용자의 주변 환경과 행동에 대한 원시 데이터를 실시간으로 수집하여 다음 계층으로 전송합니다. 각 센서 카드에 마우스를 올려 어떤 데이터가 수집되는지 확인해보세요.
카메라
패스스루 영상을 통해 사용자가 보는 장면을 기록합니다. (공간 및 객체 인식의 기반)
IMU
관성 측정 장치로, 사용자의 머리 움직임과 이동 경로를 추적합니다. (이동 문맥 파악)
마이크
사용자의 발화와 주변 소리를 녹음합니다. (대화 및 청각 문맥 파악)
2. 원시/통합 로그 생성 계층
수집된 각기 다른 형태의 원시 데이터(영상, 움직임, 소리)는 '멀티모달 상황 인지 모듈'에서 종합적으로 분석됩니다. 각 데이터는 독립적으로 처리되어 문맥 정보로 변환된 후, 멀티모달 LLM을 통해 하나의 통합된 텍스트 로그로 생성됩니다. 아래 버튼을 클릭하여 시뮬레이션 과정을 확인해보세요.
영상 🖼️
거실 소파와 TV가 보임
IMU 🧭
소파 근처에서 약간의 움직임 감지
음성 🗣️
주변 소리: 키보드 타이핑
결과: 통합 멀티모달 라이프로그 (10초)
[2025-10-15 02:21:10] 거실 소파 근처에 앉아 TV를 보면서 키보드를 치고 있는 것으로 보임.
3. 데이터 저장 및 압축 계층
10초마다 생성되는 방대한 라이프로그는 비효율적입니다. '의미 기반 데이터 압축 모듈'은 연속된 로그들의 내용(의미)이 얼마나 유사한지를 계산하여, 비슷한 활동들을 하나의 '이벤트'로 자동 그룹화합니다. 아래 슬라이더를 조절하여 '유사도 임계값'을 변경하고, 로그들이 어떻게 이벤트로 묶이는지 확인해보세요.
총 10개의 로그가 3개의 이벤트로 그룹화되었습니다.
4. 검색 및 탐색 계층
사용자는 WebXR 인터페이스를 통해 자연어 질문으로 자신의 라이프로그를 탐색할 수 있습니다. 시스템은 질문의 의도를 파악하여 압축된 이벤트 중에서 가장 관련성 높은 기록을 찾고, 원본 데이터를 기반으로 LLM이 답변을 생성합니다. 아래 검색창에 예시 질문을 입력하고 검색 과정을 시뮬레이션 해보세요.
요약에서 해당 시간대 이벤트만 집계