日期: 2026年1月7日

1 篇文章

thumbnail
数据集筛选
组会-1.7下载 tinyBenchmarks: evaluating LLMs with fewer examples 纯数学方法,聚类 三步走: IRT 参数化:首先利用历史数据,通过 IRT 模型学习全量数据集中每个问题的潜在参数(主要是区分度 $\alpha$ 和 难度 $\beta$)。 聚类抽样:将这些参数作为每个问题的特征向量进行聚类…