## 任务概述

现有一个视频，以及若干自动生成的选择题，用于测试对视频的理解程度。总体首先需要检查并修改场景划分和场景描述，使其合理，简洁；之后需要检查每一个问题，确保其清晰合理、无歧义、可根据视频内容回答、答案与视频内容相符。

## 提供信息

- **视频**：原始视频文件；
- **关键帧**：提取了视频中的若干关键帧。我们通过帧的编号来表示视频的时间点，例如：第5帧、第2到6帧；
- **场景**：视频已经被自动划分为若干片段（根据画面剪辑、视频内容等），每个片段被称为一个“场景”。对于每个场景，提供如下信息：
  - **时间范围**：该场景在原视频中的时间范围，如：第5-10帧；
  - **详细描述**：自动生成的详细描述；
  - **简短描述**：自动生成的一句话描述；
- **选择题**：根据视频内容自动生成的若干选择题，具体包含如下信息：
  - **所属场景**：由于视频包含多场景，不同场景的信息有较大区别，因此每个选择题都**只针对其中一个场景**提问。不过，还有少量的问题较为特殊（场景编号为-1），他们是针对多场景甚至整个视频的。
  - **问题**
  - **正确选项、干扰选项**

## 标注流程

### 步骤1：场景重划分

自动生成的场景划分可能不合理。我们认为：

- **一个场景内部**不应有明显的主题切换、视频剪辑（即所有不应该划分的地方都不划分）
- **不同场景之间**应有明显的区别（即所有应该划分的地方都划分）

因此，首先需要人工调整不合理之处，可能的调整包括：

- **合并两个相邻场景**：
- **拆分某一个场景为多个场景**：
- **调整场景的时间范围**：可能自动划分的位置错误，尤其是在两场景边界处，需要人工修改

<font color="red">**注意**：不要忘记重新划分场景，且问题的新场景ID根据新划分的确定</font>

<font color="red">**修改方案**：根据需要对场景进行增删改即可。</font>

### 步骤2：场景简短描述修正

每个场景都有一个简短描述，这里需要人工修正该描述。

**我们首先介绍该简短描述的用途：**正如之前所介绍，每个问题都只针对某一个场景。因此，**需要让回答问题的一方准确得知该提问是针对哪个场景的**。这就是场景简短描述发挥的作用。在提问时，我们同时提供简短描述、问题、选项，便能保证问题的无歧义性和答案唯一性。

**基于该简短描述的目的，我们介绍该描述的修改目标**：该描述应覆盖场景中的关键特征/宏观事件/镜头意图等等，确保根据该描述，就能清晰唯一地指代这个场景，不与其它场景混淆。不过，<font color="red">**请注意不要透露过多的细节**</font>，以免意外泄露某些问题的答案。

<font color="red">**修改方案**：请直接覆盖原单元格的内容，不要写在右边。</font>


### 步骤3：问题修正

这是最关键的步骤，要对问题和答案进行检查和修改。请按照如下流程进行：

1. **检查问题所属场景**：这里我们仅考虑一般的问题，即这个问题是只针对某一个场景的。
   依次检查：

   1. **该问题应只涉及一个场景**：若否，进行修改（修改问题：明确提及与上个场景的变化；修改答案：将非本场景的答案部分删除）或者删除该问题。
       <font color="red">【例】视频 2yGaTOzaGIA 场景 2 中存在一个问题“视频中镜头的视角如何变化”，可以改为“视频中镜头拍摄了什么”（去除上个场景的内容），或者改为“视频中的内容相对于上个场景，拍摄内容有什么变化”（明确说明要包含上个场景的内容）</font>
      【例】视频 0ay2Qy3wBe8 第三个场景中的问题 "在这个场景中，除了马之外，还有哪些主要角色被介绍？" 涉及到不属于当前场景的人物，因此需要修改答案。
      【例】视频 6EIrArTyLVU 中问题 “这个人是如何从 介绍信息 转变到 健身活动的？”同时涉及“解释”和“健身”发生在两个不同场景的事件，因此需要删除
   2. **该问题所属场景应正确**：若不正确，修改为正确的场景
      **注意**，由于先前的场景重划分，许多问题所属场景可能都不正确，需要标注成重划分后的场景编号。

2. **检查问题、正确答案**：
   依次检查：

   1. **问题与场景一致**；

      【例】视频 6EIrArTyLVU 第 0 个场景有问题“男人拿着的麦克风是什么类型的” ，然而视频中没有出现麦克风，因此删除该问题；
      
   2. **问题应表述清晰、简洁、无歧义，能根据场景的内容确定明确的答案**

      【例】视频 0ay2Qy3wBe8 的第 0 个场景的问题“箭头相对于正文指向哪里？”，“正文”略显模糊，改为“箭头相对于标题指向哪里？”；

      【例】视频 6EIrArTyLVU  的第 1 个场景中有问题“画面中的文本是什么风格的”，然而画面中有两种不同风格的文本，需指代更明确，如修改为“右下角的文本是什么风格的”；

      【例】视频 6EIrArTyLVU 的第 1 个场景中问题 “画面中有多少竖直的柱子” 不明确，每个人对是否算作柱子的理解可能不同，因此删除；

      <font color="red">【例】问题中可能出现“第X帧”、“在图片中”、“XXX编号的物体“、“在当前视频后段“（应改为在场景后段） 等表述，需要修改</font>；
      
   3. **问题中不应泄露答案**

      【例】视频 0ay2Qy3wBe8 的第 9 个场景的问题“展示现代智能手机动态的场景设置是什么？”，会对答案有明显的提示作用，仅保留“场景设置是什么”；

   4. **问题不应为常识性问题**：判断标准为，能否不参考视频就正确回答；

   5. **答案需要与原视频相符**；
      【例】视频 0ay2Qy3wBe8 的第八个场景中“在这一段中，画面中添加了哪些文本元素？”，答案遗漏了原视频中的部分信息，需要人工确认并添加。
      
   6. **答案应准确回答该问题，不存在没有问到的冗余内容或者错误**；
      【例】视频 0ay2Qy3wBe8 的第 6 个场景中“这个女人在场景中的互动是如何变化的？”，答案“B. 这个女人变得更加生动，并积极参与对话，表明她与电话的互动程度有所增加。”中“与电话的互动程度有所增加” 为冗余部分，与问题无关，需要删除；

   8. **问题应不能通过阅读场景简短描述回答**；

   9. <font color="red">**问题和正确答案，干扰答案可能存在被不当翻译的情况。**</font>

      <font color="red">【例】OCR识别结果被翻译，如视频 6EIrArTyLVU 场景0， "哪个文字覆盖引入了这个场景"，选项的文字内容被翻译了，应该进行修改，保留英文原文。（可以直接从英文版本复制过来）</font>

    11. <font color="red">**答案应仅包含单一信息**
    若同一个答案包含过多信息，会导致正确选项与干扰选项在多个不同角度产生差异，使问题变简单，因此可以拆分成多个问题。
    【例】视频 6EIrArTyLVU 场景 6 问题“电视logo是什么样子的”，正确答案A包含“橙色、圆角、小电视腿、屏幕中显示SAM WOOD文字”，包含信息过多；选择将该问题拆分成两个问题，其中一个考察对电视外观的理解，另一个考察对屏幕内文字的识别
    【例】视频 2yGaTOzaGIA 场景 0 中一个问题为“视频中场景的设置是什么”，其答案为“A. 场景设置是一个热带户外体育场，正在进行一场100米短跑比赛。明显答案具有两个内容，因此可以拆分为两个问题：“视频中场景的设置是什么？A. 场景设置是一个热带户外体育场。”以及”视频中正在进行什么事件？A. 正在进行一场100米短跑比赛。并构造干扰选项（可以借助gpt）。并且在原问题下方插入（插入13空行，将原问题复制粘贴，编辑修改后区域）。</font>
    12. <font color="red">**关键帧存在一些视觉提示（数字标记，部分物体还会存在存在颜色的外轮廓），这些信息没有在视频中出现，因此不应该出现在正确答案中。**
    【例】视频 -O6mJ0VBTc4 场景 1 存在问题答案对”是什么视觉特征使数字“2”显得与众不同？A. 数字“2”用绿色高亮标记以显得微妙的不同。“这里面答案是误将关键帧物体周围的视觉辅助轮廓识别成物体的特征，应该予以修改或者删除。</font>
    13. <font color="red">**关键帧抽取中渐变转场会对上一个场景描述产生影响**
    在视频处理中，由于渐变转场的存在，关键帧抽取可能包含转场动画过程，导致对前一个场景的描述准确性受损（例如场景切换时的中间帧干扰）。需将前一个消除转场对前一个场景的影响。
    【例】视频 39HTpUG1MwQ 的 场景 -1 line 873-884 中，原描述为“从一个昏暗的环境中，有可见的分子结构，转换到一个没有任何特征或物体的白色空白画布”，因渐变转场导致关键帧包含中间动画效果，从而会有昏暗的环境之类的描述。需修正为“从膜结构的展示直接转换到没有任何特征或物体的白色背景画面”，以确保场景变化表述简洁准确。</font>
    13. <font color="red">**问题和答案过于主观**</font>
    <font color="red">部分问题过于主观，不同人的理解可能会不一样，需要在程度后面增加事实证据来使得问题答案具有唯一性。如果缺少视觉证据不好修改，则可以直接删除。
    【例】视频 -qTAeVGl_e8 的 场景 1 中，原描述为“现场观众的参与度如何”，答案为低中高，过于主观，需要删除。或者加上视觉描述“参与度高，周围挤满了人”，“参与度低，周围人逐渐离开”等等。</font>

	**解决方案**：请尽量修改问题和答案以符合条件，无法修改则直接删除
	
3. **检查干扰选项**：
   依次检查：
   
   1. **干扰选项应与视频内容不符，不存在任何歧义或争议**；
      【例】视频 6EIrArTyLVU  场景 1 中问题“黄色弹力带固定在哪里”，干扰选项“在单杠上”同样可认为正确；修改成错误的选项；
   
   2. <font color="red">**干扰选项应与正确选项风格一致，具有干扰性**；</font>
      【例】视频 0ay2Qy3wBe8 的第 8 个场景中“场景中人物周围有什么物体？”，干扰选项与正确选项差异过大，不具有干扰性。<font color="red">可以相对正确答案增加或减少一两个物体，改变物体的描述（欧元改为美元，100米改为400米，略微修改英文内容，如KONNET变为KOHNET）等方法，构造出和答案更接近的干扰选项。</font>
	
   	**解决方案**：请尽量修改干扰选项以符合条件，可以借助gpt生成。
   
4. **重复问题检查**：若发现之前出现过基本相似的问题，应删除重复问题
<font color="red">**注意：**不同场景之间的问题可能会重复，不需要删除。只有相同场景的相同问题才需要删除。</font>

5. **添加问题**，如果视频中存在明显的文字，且对理解该视频内容有帮助，可以修改与其相关的问题或构造新问题
   【例】视频 0ay2Qy3wBe8 的第 0 个场景中“该场景中的logo写着什么”。以及视频 0ay2Qy3wBe8 的第 7 个场景中“背景中的logo写着什么”

### 注意事项
1. <font color="red"> 修改问题时，均以视频为准：即判断该问题在所对应的那个视频片段是否正确；而不是仅在关键帧中是否正确。因此**标注时应只以视频内容为答案正确与否唯一标注，关键帧仅为参考**</font>
2. <font color="red">**只需要修改并提交chinese版本的excel文档**，英文版本只是作为一个参考。</font>
3. <font color="red">如果可以的话，**尽量将问题保留在原场景中**，否则场景间问题会很不平衡（一般来讲，场景分类错误只会往前后移动一个）
【例】 视频 21q-lDikdBg 场景 2-4 中，与环境，窗外阳光，绿植等问题的答案与场景 1 一致，但是不需要将这些问题都移动到场景 1 </font>
4. <font color="red">**如果问题答案对被删除了，修改后部分应该置空**，以便我们下一步操作。</font>
4. <font color="red">**如果发现存在明显重要的视频元素或者内容在问题答案对中没有提及，请进行添加。**</font>
