# Summary

## Ligand

### RAG_0_DB_0_WEB_0

考虑了位阻（cone angle，buried volume），电性（TEP），溶解性（logP），氢键生成能力（结构）四个因素，关注于位阻和电性两个因素，自己估计或引用了相关参数，最终基于位阻大小分为两类

### RAG_0_DB_0_WEB_1

考虑了位阻（cone angle），电性（TEP，HOMO/LUMO gap），极性（介电常数，logP）三个因素，对每个因素找了相关信息，最终基于位阻大小分为三类

### RAG_0_DB_1_WEB_1

考虑了分子大小（分子量，重原子数量），极性（logP，氢键数量），位阻（可旋转键数量）三个因素，相关数据主要来自数据库，最终根据极性/是否有氢键受体分为两类

### RAG_1_DB_1_WEB_1

考虑了极性（TPSA，氢键数量），溶解性（logP），位阻（可旋转键数量）三个因素，相关数据主要来自数据库，最终根据极性/是否有氢键受体分为两类

### Comment

在没有数据库信息时，LLM根据训练中获得的相关信息了解到膦配体的主要影响因素应该是位阻和电性，由此出发估计或找到了相关参数，并以此为标准分类

而在获得数据库信息之后，由于数据库中包含的信息都是分子的最基本信息，如分子量，可旋转键数量，极性等，这些基本信息通常不是决定膦配体性质的最关键因素，LLM却被限定在这些因素当中寻找分类标准，所以就会被不重要但有明显差异的因素误导并以此分类

所有大模型输出的信息本身没有明显的事实性错误

## Additive

### RAG_0_DB_0_WEB_0

选取了极性（logP），沸点，氢键供体或受体数量三个定量性质作为标准，基于这三个因素分为两类  
但将除了两个物质以外的所有物种都归为一类不够合理，其给出的定量性质范围过于宽泛

### RAG_0_DB_0_WEB_1

选取了极性（logP），酸碱性，氢键供体或受体数量，分子大小（分子量，沸点）四个主要因素，准确捕捉并分析了所有物种的结构特点，经验估计了logP和酸碱性数据，最终主要根据logP和酸碱性分为三类

### RAG_0_DB_1_WEB_1

根据数据库当中具有的数据选取了极性（logP，TPSA），分子大小（分子量），氢键供体受体数目共四个主要性质，最终根据TPSA和氢键数目分为两类，另有两个未在数据库中搜到信息的分子未进行分类

### RAG_1_DB_1_WEB_1

基本同上，在此基础上分类时还参考了结构信息，将并环的两个分子单独分为一类

### Comment

在此案例中，由于待分类的分子可以根据取代基不同相对明确的分为几类，并且对应着数据库中分子的基本信息的差异（如酯基对应着更多氢键受体，而芳基则不会），所以此时基于数据库中基本信息的分类获得了较为合理的结果。但同时展现出这一策略对于数据库中未记录的分子需要特殊考虑

## Aryl Halide

### RAG_0_DB_0_WEB_0

选取了卤素类型（C-X键键能），取代基电子性质（Hamment参数）和是否存在芳香氮（pKa）三个主要因素进行考虑，最终选择根据卤素类别分为三类

### RAG_0_DB_0_WEB_1

选取了卤素类型（电负性），取代基电子性质（Hamment参数）和分子大小（沸点和分子量）三个主要因素进行考虑，最终选择根据卤素类别分为三类

### RAG_0_DB_1_WEB_1

从数据库中选取了极性（logP，TPSA），分子量，氢键供体受体数目四个主要性质，最终根据极性和氢键受体数目分为了三类

### RAG_1_DB_1_WEB_1

基本同上，但最终分为两类（把之前三类中的两类合并）

### Comment

在没有引入DB之前，LLM的分析是比较合理的，卤素类型和取代基电子性质是影响反应物在反应中的效果的最关键因素，但引入DB之后与之前一样被简单信息误导，不再从这方面考虑。尽管给出的分类结果有合理性，但同样是缺乏对反应信息的考虑，在反应当中，弱给电子的甲氧基，电中性的乙基和强吸电子的三氟甲基差异相对会比较大

## Base

### RAG_0_DB_0_WEB_0

根据结构，碱性，沸点，极性，氢键供体受体数目几个方面考虑，最终选择根据碱性分为两类（强碱和超强碱）

### RAG_0_DB_0_WEB_1

考虑因素同上，但是将所有三种碱归为一类（上面根据共轭酸pKa是否大于22分类，这里根据共轭酸pKa是否大于10分类）

### RAG_0_DB_1_WEB_1

从数据库中选取了极性（logP，TPSA），分子量，氢键供体受体数目四个主要性质，最终根据极性和氢键受体数目分为了两类，分类结果恰好与碱性分类一致

### RAG_1_DB_1_WEB_1

同上

### Comment

同前comment，不过此处由于分子基于碱性和基本性质分类获得了相同结果，所以没有产生明显差异（但碱性和这些基本性质未必有因果关联）

## Final comment

总体而言，并未发现LLM的输出有明显的不符合化学知识的幻觉，但是如何让模型将反应信息纳入考量非常关键，目前看起来没有数据库的情况下，LLM能够做出合理的分析，但数据库中的基本分子信息所包含的内容太少，并且和反应性质关联更加有限，所以通过这些性质来判断反应性非常困难，可能反而给LLM带来了限制和误导。
