LLaTiSA: Towards Difficulty-Stratified Time Series Reasoning from Visual Perception to Semantics

Paper ID: 2604.17295 • 81 Upvotes

Time Series LLM VLM Reasoning RAG Vision Benchmark Evaluation

LLaTiSA: Towards Difficulty-Stratified Time Series Reasoning from Visual Perception to Semantics

📝 핵심 요약

LLM 기반 시계열 추론 모델 개발 시, 시각적 패턴과 정밀하게 조정된 수치 테이블 통합을 통해 성능 향상 및 다양한 시계열 작업에서 일반화 성능을 확보할 수 있음을 보임.

📖 상세 내용

LLM이 시계열 데이터를 이해하는 데 어려움을 겪고 있으며, 기존 연구는 단편적인 태스크 정의와 모호한 벤치마크로 인해 통합된 시계열 추론 모델(TSRM) 개발에 어려움을 겪고 있다. 본 연구에서는 시계열 추론(TSR)을 인지 복잡성에 따라 4단계로 분류하고, 다양한 태스크 조합과 검증된 CoT 궤적을 포함하는 계층적 시계열 추론 데이터셋 HiTSR(83k 샘플)을 제안한다. HiTSR을 활용하여 시각적 패턴과 정밀하게 조정된 수치 테이블을 통합하여 VLMs의 시간적 인지 능력을 향상시키는 강력한 TSRM인 LLaTiSA를 제안한다. 다단계 커리큘럼 fine-tuning 전략을 통해 LLaTiSA는 우수한 성능을 달성하고 다양한 TSR 작업 및 실제 시나리오에서 강력한 out-of-distribution 일반화 성능을 보여준다.

🔑 주요 내용 (Key Points)

시계열 추론을 위한 4단계 분류법 제시
HiTSR 데이터셋 (83k 샘플) 구축 및 활용
시각적 정보와 수치 정보를 결합한 LLaTiSA 모델 제안

💡 실무적 가치 (Relevance)

시계열 데이터 분석 및 예측 시스템 개발 시, LLaTiSA 모델 구조와 HiTSR 데이터셋 구축 방법을 참고하여 LLM의 성능을 향상시킬 수 있다.

✅ 추천 액션 (Actionable Items)

HiTSR 데이터셋을 활용하여 기존 모델의 시계열 추론 성능 평가
LLaTiSA 모델 구조를 기반으로 시각적 정보와 수치 정보를 결합하는 다양한 시도
실제 시계열 데이터에 대한 out-of-distribution 일반화 성능 테스트

View on Hugging Face View PDF (arXiv)