数据集筛选 2026-1-07 15:48 | 12 | 0 | 笔记 1608 字 | 7 分钟 组会-1.7下载 tinyBenchmarks: evaluating LLMs with fewer examples 纯数学方法,聚类 三步走: IRT 参数化:首先利用历史数据,通过 IRT 模型学习全量数据集中每个问题的潜在参数(主要是区分度 $\alpha$ 和 难度 $\beta$)。 聚类抽样:将这些参数作为每个问题的特征向量进行聚类…