## 任务
验证的假设: 可能只有少数的token对时序预测是有效的 
核心: 使用LLM对原始文本进行逐步压缩,得到不同程度的摘要或者精炼文本 
→ 五个时间点的分析（只事件）
→ 五个时间点的分析 + 方向
→ 五个时间点的分析 + 强度
→ 五个时间点的分析 + 强度 + 方向
→ 只含五个时间点的强度及方向
→ 只含五个时间点的方向
→ 只含整体强度及方向
→ 只含整体方向

根据Data Generator,生成相应的表征 
文本最核心的三要素:影响时序的哪个时间步,这个点很难分析, 所以我们不去分析, 固定让LLM给出5个timestep的分析结果. 其次是事件的强度和重要性,这决定了影响的幅度. 影响的方向.  
我们想验证一个假设: 只要少数的token会影响时序预测 Less is More , 我们只需要聚焦在少数的关键token上 , 这样有助于做对齐 

我之前想过一种实验, 用LLM将文本压缩成不同的比例, 然后做归因

原始文本 -> 五个时间点的分析文本,只包含事件信息 -> 五个时间点的分析文本, 在结尾包含事件影响的方向信息 -> 五个时间点的分析文本, 在结尾包含事件强度信息 -> 五个时间点的分析文本, 在结尾包含事件方向信息以及事件包含的强度信息 -> 只包含五个时间点的强度及方向信息 -> 只包含五个时间点的方向信息 -> 只包含整体的强度及方向信息 -> 只包含整体的方向信息  

A, 原始全文。全部信息
B, 五个时间点的详细时间分析(事件+强度+方向)
C, 仅包含五个时间点的方向和强度信息
D, 仅整体强度及方向信息 
E, 仅整体方向信息 

再结合token level的可解释性分析 