LLaTiSA: Towards Difficulty-Stratified Time Series Reasoning from Visual Perception to Semantics
Paper ID: 2604.17295 โข 81 Upvotes
Time Series LLM VLM Reasoning RAG Vision Benchmark Evaluation
๐ ํต์ฌ ์์ฝ
LLM ๊ธฐ๋ฐ ์๊ณ์ด ์ถ๋ก ๋ชจ๋ธ ๊ฐ๋ฐ ์, ์๊ฐ์ ํจํด๊ณผ ์ ๋ฐํ๊ฒ ์กฐ์ ๋ ์์น ํ
์ด๋ธ ํตํฉ์ ํตํด ์ฑ๋ฅ ํฅ์ ๋ฐ ๋ค์ํ ์๊ณ์ด ์์
์์ ์ผ๋ฐํ ์ฑ๋ฅ์ ํ๋ณดํ ์ ์์์ ๋ณด์.
๐ ์์ธ ๋ด์ฉ
LLM์ด ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ์ดํดํ๋ ๋ฐ ์ด๋ ค์์ ๊ฒช๊ณ ์์ผ๋ฉฐ, ๊ธฐ์กด ์ฐ๊ตฌ๋ ๋จํธ์ ์ธ ํ์คํฌ ์ ์์ ๋ชจํธํ ๋ฒค์น๋งํฌ๋ก ์ธํด ํตํฉ๋ ์๊ณ์ด ์ถ๋ก ๋ชจ๋ธ(TSRM) ๊ฐ๋ฐ์ ์ด๋ ค์์ ๊ฒช๊ณ ์๋ค. ๋ณธ ์ฐ๊ตฌ์์๋ ์๊ณ์ด ์ถ๋ก (TSR)์ ์ธ์ง ๋ณต์ก์ฑ์ ๋ฐ๋ผ 4๋จ๊ณ๋ก ๋ถ๋ฅํ๊ณ , ๋ค์ํ ํ์คํฌ ์กฐํฉ๊ณผ ๊ฒ์ฆ๋ CoT ๊ถค์ ์ ํฌํจํ๋ ๊ณ์ธต์ ์๊ณ์ด ์ถ๋ก ๋ฐ์ดํฐ์
HiTSR(83k ์ํ)์ ์ ์ํ๋ค. HiTSR์ ํ์ฉํ์ฌ ์๊ฐ์ ํจํด๊ณผ ์ ๋ฐํ๊ฒ ์กฐ์ ๋ ์์น ํ
์ด๋ธ์ ํตํฉํ์ฌ VLMs์ ์๊ฐ์ ์ธ์ง ๋ฅ๋ ฅ์ ํฅ์์ํค๋ ๊ฐ๋ ฅํ TSRM์ธ LLaTiSA๋ฅผ ์ ์ํ๋ค. ๋ค๋จ๊ณ ์ปค๋ฆฌํ๋ผ fine-tuning ์ ๋ต์ ํตํด LLaTiSA๋ ์ฐ์ํ ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ณ ๋ค์ํ TSR ์์
๋ฐ ์ค์ ์๋๋ฆฌ์ค์์ ๊ฐ๋ ฅํ out-of-distribution ์ผ๋ฐํ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋ค.
๐ ์ฃผ์ ๋ด์ฉ (Key Points)
- ์๊ณ์ด ์ถ๋ก ์ ์ํ 4๋จ๊ณ ๋ถ๋ฅ๋ฒ ์ ์
- HiTSR ๋ฐ์ดํฐ์ (83k ์ํ) ๊ตฌ์ถ ๋ฐ ํ์ฉ
- ์๊ฐ์ ์ ๋ณด์ ์์น ์ ๋ณด๋ฅผ ๊ฒฐํฉํ LLaTiSA ๋ชจ๋ธ ์ ์
๐ก ์ค๋ฌด์ ๊ฐ์น (Relevance)
์๊ณ์ด ๋ฐ์ดํฐ ๋ถ์ ๋ฐ ์์ธก ์์คํ
๊ฐ๋ฐ ์, LLaTiSA ๋ชจ๋ธ ๊ตฌ์กฐ์ HiTSR ๋ฐ์ดํฐ์
๊ตฌ์ถ ๋ฐฉ๋ฒ์ ์ฐธ๊ณ ํ์ฌ LLM์ ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์๋ค.
โ ์ถ์ฒ ์ก์ (Actionable Items)
- HiTSR ๋ฐ์ดํฐ์ ์ ํ์ฉํ์ฌ ๊ธฐ์กด ๋ชจ๋ธ์ ์๊ณ์ด ์ถ๋ก ์ฑ๋ฅ ํ๊ฐ
- LLaTiSA ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์๊ฐ์ ์ ๋ณด์ ์์น ์ ๋ณด๋ฅผ ๊ฒฐํฉํ๋ ๋ค์ํ ์๋
- ์ค์ ์๊ณ์ด ๋ฐ์ดํฐ์ ๋ํ out-of-distribution ์ผ๋ฐํ ์ฑ๋ฅ ํ ์คํธ