{
  "dataset": "duIE_zh",
  "language": "zh",
  "schema": {
    "pred": {
      "relation_types": [
        "亲属关系",
        "代言",
        "任职于",
        "位于",
        "创作",
        "包含组件",
        "参与",
        "参与评估",
        "对抗",
        "引发",
        "引发事件",
        "执行",
        "报告问题",
        "生产",
        "负责推进",
        "负责设计",
        "部署于",
        "隶属于"
      ],
      "entity_types": [
        "{'事件': '事件或情节，保持中立描述'}",
        "{'产品': '商品、服务或技术成果'}",
        "{'人物': '人物姓名，避免形容词'}",
        "{'作品': '文学、艺术、音乐等创作产物'}",
        "{'其它': '其它重要概念'}",
        "{'地点': '地理位置、场所或区域'}",
        "{'物体': '有形物体，名称中不含冠词'}",
        "{'组织': '公司、机构、团体等法人或非法人实体'}",
        "{'职务': '在组织中的职位或角色'}",
        "{'行动': '关键动作或行为'}",
        "事件",
        "产品",
        "人物",
        "作品",
        "地点",
        "文档",
        "物体",
        "组织",
        "行动"
      ],
      "event_types": [],
      "roles": [],
      "re_edges": [
        [
          "事件",
          "引发",
          "事件"
        ],
        [
          "人物",
          "亲属关系",
          "人物"
        ],
        [
          "人物",
          "代言",
          "产品"
        ],
        [
          "人物",
          "任职于",
          "组织"
        ],
        [
          "人物",
          "创作",
          "作品"
        ],
        [
          "人物",
          "参与",
          "事件"
        ],
        [
          "人物",
          "参与评估",
          "事件"
        ],
        [
          "人物",
          "执行",
          "行动"
        ],
        [
          "人物",
          "报告问题",
          "文档"
        ],
        [
          "人物",
          "负责推进",
          "行动"
        ],
        [
          "人物",
          "负责设计",
          "物体"
        ],
        [
          "人物",
          "隶属于",
          "组织"
        ],
        [
          "物体",
          "包含组件",
          "物体"
        ],
        [
          "物体",
          "引发事件",
          "事件"
        ],
        [
          "物体",
          "部署于",
          "地点"
        ],
        [
          "组织",
          "位于",
          "地点"
        ],
        [
          "组织",
          "对抗",
          "组织"
        ],
        [
          "组织",
          "生产",
          "产品"
        ]
      ],
      "ee_edges": [],
      "counts": {
        "relation_types": 18,
        "entity_types": 19,
        "event_types": 0,
        "roles": 0,
        "re_edges": 18,
        "ee_edges": 0,
        "graph_nodes": 58,
        "graph_edges": 85
      }
    },
    "gold": {
      "relation_types": [
        "丈夫",
        "上映时间",
        "专业代码",
        "主持人",
        "主演",
        "主角",
        "主题曲",
        "人口数量",
        "代言人",
        "作曲",
        "作者",
        "作词",
        "修业年限",
        "出品公司",
        "创始人",
        "制片人",
        "占地面积",
        "号",
        "嘉宾",
        "国籍",
        "妻子",
        "官方语言",
        "导演",
        "总部地点",
        "成立日期",
        "所在城市",
        "所属专辑",
        "改编自",
        "朝代",
        "校长",
        "歌手",
        "母亲",
        "毕业院校",
        "气候",
        "注册资本",
        "海拔",
        "父亲",
        "祖籍",
        "票房",
        "简称",
        "编剧",
        "获奖",
        "董事长",
        "邮政编码",
        "配音",
        "面积",
        "饰演",
        "首都"
      ],
      "entity_types": [
        "Date",
        "Number",
        "Text",
        "人物",
        "企业",
        "企业/品牌",
        "作品",
        "历史人物",
        "国家",
        "图书作品",
        "地点",
        "城市",
        "奖项",
        "娱乐人物",
        "学校",
        "学科专业",
        "影视作品",
        "文学作品",
        "景点",
        "机构",
        "歌曲",
        "气候",
        "电视综艺",
        "行政区",
        "语言",
        "音乐专辑"
      ],
      "event_types": [],
      "roles": [],
      "re_edges": [
        [
          "人物",
          "丈夫",
          "人物"
        ],
        [
          "人物",
          "国籍",
          "国家"
        ],
        [
          "人物",
          "妻子",
          "人物"
        ],
        [
          "人物",
          "母亲",
          "人物"
        ],
        [
          "人物",
          "毕业院校",
          "学校"
        ],
        [
          "人物",
          "父亲",
          "人物"
        ],
        [
          "人物",
          "祖籍",
          "地点"
        ],
        [
          "企业",
          "创始人",
          "人物"
        ],
        [
          "企业",
          "总部地点",
          "地点"
        ],
        [
          "企业",
          "注册资本",
          "Number"
        ],
        [
          "企业",
          "董事长",
          "人物"
        ],
        [
          "企业/品牌",
          "代言人",
          "人物"
        ],
        [
          "历史人物",
          "号",
          "Text"
        ],
        [
          "历史人物",
          "朝代",
          "Text"
        ],
        [
          "国家",
          "官方语言",
          "语言"
        ],
        [
          "国家",
          "首都",
          "城市"
        ],
        [
          "图书作品",
          "作者",
          "人物"
        ],
        [
          "地点",
          "海拔",
          "Number"
        ],
        [
          "娱乐人物",
          "获奖",
          "Date"
        ],
        [
          "娱乐人物",
          "获奖",
          "Number"
        ],
        [
          "娱乐人物",
          "获奖",
          "作品"
        ],
        [
          "娱乐人物",
          "获奖",
          "奖项"
        ],
        [
          "娱乐人物",
          "配音",
          "人物"
        ],
        [
          "娱乐人物",
          "配音",
          "影视作品"
        ],
        [
          "娱乐人物",
          "饰演",
          "人物"
        ],
        [
          "娱乐人物",
          "饰演",
          "影视作品"
        ],
        [
          "学校",
          "校长",
          "人物"
        ],
        [
          "学科专业",
          "专业代码",
          "Text"
        ],
        [
          "学科专业",
          "修业年限",
          "Number"
        ],
        [
          "影视作品",
          "上映时间",
          "Date"
        ],
        [
          "影视作品",
          "上映时间",
          "地点"
        ],
        [
          "影视作品",
          "主演",
          "人物"
        ],
        [
          "影视作品",
          "主题曲",
          "歌曲"
        ],
        [
          "影视作品",
          "出品公司",
          "企业"
        ],
        [
          "影视作品",
          "制片人",
          "人物"
        ],
        [
          "影视作品",
          "导演",
          "人物"
        ],
        [
          "影视作品",
          "改编自",
          "作品"
        ],
        [
          "影视作品",
          "票房",
          "Number"
        ],
        [
          "影视作品",
          "票房",
          "地点"
        ],
        [
          "影视作品",
          "编剧",
          "人物"
        ],
        [
          "文学作品",
          "主角",
          "人物"
        ],
        [
          "景点",
          "所在城市",
          "城市"
        ],
        [
          "机构",
          "占地面积",
          "Number"
        ],
        [
          "机构",
          "成立日期",
          "Date"
        ],
        [
          "机构",
          "简称",
          "Text"
        ],
        [
          "歌曲",
          "作曲",
          "人物"
        ],
        [
          "歌曲",
          "作词",
          "人物"
        ],
        [
          "歌曲",
          "所属专辑",
          "音乐专辑"
        ],
        [
          "歌曲",
          "歌手",
          "人物"
        ],
        [
          "电视综艺",
          "主持人",
          "人物"
        ],
        [
          "电视综艺",
          "嘉宾",
          "人物"
        ],
        [
          "行政区",
          "人口数量",
          "Number"
        ],
        [
          "行政区",
          "气候",
          "气候"
        ],
        [
          "行政区",
          "邮政编码",
          "Text"
        ],
        [
          "行政区",
          "面积",
          "Number"
        ]
      ],
      "ee_edges": [],
      "counts": {
        "relation_types": 48,
        "entity_types": 26,
        "event_types": 0,
        "roles": 0,
        "re_edges": 55,
        "ee_edges": 0,
        "graph_nodes": 84,
        "graph_edges": 193
      }
    }
  },
  "samples": {
    "sample_count": 286426,
    "doc_count": 191957,
    "dedup_by_text": true,
    "cross_dataset_dedup": false,
    "samples_path": "/home/iie4bu/hmb/code/hmb_6_graph_maker/data/input/re/golden_input_duIE_zh.json",
    "synthetic_used": false
  },
  "graph_f1": {
    "embedding_backend": "ollama",
    "embedding_model": "models/bge-m3",
    "ollama_model": "bge-m3",
    "device": "cuda:1",
    "embedding_dim": 1024,
    "similarity": "cosine",
    "matching": "hungarian",
    "threshold": 0.45,
    "graph_smoothing_rounds": 2,
    "graph_smoothing_alpha": 0.5
  },
  "fuzzy_threshold_sweep": {
    "enabled": false,
    "thresholds": [
      0.7,
      0.8,
      0.9
    ],
    "results": []
  },
  "normalization_spec": {
    "RE": {
      "direction_policy": "directed",
      "symmetric_policy": "none",
      "missing_type_policy": "Entity",
      "type_path_policy": "keep_atomic",
      "label_for_embedding": "replace '/' -> ' '"
    },
    "EE": {
      "label_casing_en": "lower",
      "separator_policy": "collapse_whitespace + unify(_,-)",
      "edge_form": "(event_type, role, ARG)",
      "ARG_semantics": "placeholder"
    },
    "DEDUP": {
      "dedup_mode": "normalized",
      "normalize_text_en": "strip + collapse spaces (+ optional lowercase)",
      "normalize_text_zh": "strip + collapse spaces",
      "provenance_fields_kept": "source_sample_ids, source_groups, source_dataset"
    }
  },
  "normalization_examples": [
    {
      "before": "InstructIE: Person/Place -> Located_In",
      "after": "Person Place -> located_in"
    },
    {
      "before": "Event/Attack Role:Victim",
      "after": "attack victim"
    }
  ],
  "fusion_track": {
    "base_ontologies": [
      {
        "name": "ExampleBaseOntology",
        "version": "v1.0",
        "license": "CC-BY-4.0"
      }
    ],
    "leakage_check": [
      "drop entries that exactly match gold labels"
    ],
    "mapping_fields": [
      "equivalent",
      "broader",
      "narrower"
    ]
  }
}