返回榜单

榜单规则

诗词排行榜的分数表示一首作品在当前电子书语料和算法下获得的相对排序信号,范围为1..100。它不是作品文学价值的绝对评价,也不替代人工鉴赏或学术判断。

主要参考信号

来源权重

诗选、鉴赏、评论、文史、通俗读物等来源类型不同,代表的参考价值也不同。

书籍评分

书籍本身评分越高,说明这个来源整体质量越可靠。

书内重要性

同一本书中重点讲解、反复引用或排序靠前的作品,会得到更强的书内信号。

识别置信度

系统需要确认标题、作者、正文和归并结果可靠,低置信度会降低贡献。

核心公式

S = W_source × R_book × I_in_book × C_confidence

S
一次来源贡献,表示某首作品在某一本书中提供的有效排序信号。
W_source
来源权重,表示这本书所属类型的参考强度。
R_book
书籍评分归一化后的结果,范围通常在 0 到 1 之间。
I_in_book
书内重要性归一化后的结果,表示作品在该书中的重要程度。
C_confidence
识别置信度,表示系统对这次命中和作品归并的可靠性判断。

一首作品可能出现在多本书里。系统会先计算每次有效来源贡献,再结合跨书出现频次,并在同一个榜单内部归一化, 最后换算成 1 到 100 的分数。出现得多不一定直接高分,来源质量、书内重要性和识别可靠性都会共同影响结果。

怎样理解分数

高分通常意味着作品被多个质量较高的来源稳定收录、引用或重点讲解,适合作为榜单头部候选。低分不代表作品价值低, 只表示在当前语料中,来源支持、出现频次或数据置信度相对较弱。

如果书籍评分、来源类型、识别置信度或作品归并信息存在缺失,分数可信度会受影响。系统会尽量降低低质量或低置信度信号的权重, 但最终榜单仍应被理解为数据辅助排序,而不是定论。