DCG 类keras_rs.metrics.DCG(
k: int | None = None,
gain_fn: Callable[[Any], Any] = default_gain_fn,
rank_discount_fn: Callable[[Any], Any] = default_rank_discount_fn,
**kwargs: Any
)
计算折扣累计增益 (DCG)。
此指标用于评估排名质量。它计算具有分级相关性得分的项目的总和,并根据位置应用可配置的折扣。该指标处理 y_true 中的真实相关性标签(分级相关性得分(非负数,值越高表示相关性越强))与 y_pred 中的预测得分。y_pred 中的得分用于通过降序排序来确定项目的排名顺序。得分是非负的,值越高表示排名质量越好(高度相关的项目排名越高)。单个列表的得分不受限制或未进行归一化,即它不在某个范围内。
对于 y_pred 中的每个预测得分列表 s 和 y_true 中相应的真实标签列表 y,每个查询的 DCG 分数计算如下:
DCG@k(y', w') = sum_{i=1}^{k} (gain_fn(y'_i) / rank_discount_fn(i))
其中
y'_i 是排名在位置 i 的项目的真实相关性得分(通过对 y_true 根据 y_pred 进行排序得到)。gain_fn 是用户提供的将相关性 y'_i 映射到增益值的函数。默认函数 (default_gain_fn) 通常等同于 lambda y: 2**y - 1。rank_discount_fn 是用户提供的将排名 i 映射到折扣值的函数。默认函数 (default_rank_discount_fn) 通常等同于 lambda rank: 1 / log2(rank + 1)。报告的最终 DCG 分数通常是数据集中所有查询/列表的这些每个查询分数的加权平均值。
注意:sample_weight 对于排名指标的处理方式不同。对于批处理输入,sample_weight 可以是标量、1D 或 2D。标量情况和 1D 情况(列表式权重)很直接。2D 情况(项式权重)不同,因为样本权重会聚合以获得 1D 权重。有关更多详细信息,请参阅 keras_rs.src.metrics.ranking_metrics_utils.get_list_weights。
参数
y_true) 映射到增益值。默认实现为 2**y - 1。default_rank_discount_fn) 为 1 / log2(rank + 1)。True。None,表示使用 keras.backend.floatx()。keras.backend.floatx() 默认为 "float32",除非通过 keras.backend.set_floatx() 设置为其他值。如果提供了 keras.DTypePolicy,则将使用 compute_dtype。示例
>>> batch_size = 2
>>> list_size = 5
>>> labels = np.random.randint(0, 3, size=(batch_size, list_size))
>>> scores = np.random.random(size=(batch_size, list_size))
>>> metric = keras_rs.metrics.DCG()(
... y_true=labels, y_pred=scores
... )
屏蔽某些元素(可用于不均匀输入)
>>> batch_size = 2
>>> list_size = 5
>>> labels = np.random.randint(0, 3, size=(batch_size, list_size))
>>> scores = np.random.random(size=(batch_size, list_size))
>>> mask = np.random.randint(0, 2, size=(batch_size, list_size), dtype=bool)
>>> metric = keras_rs.metrics.DCG()(
... y_true={"labels": labels, "mask": mask}, y_pred=scores
... )