来源权重
诗选、鉴赏、评论、文史、通俗读物等来源类型不同,代表的参考价值也不同。
诗词排行榜的分数表示一首作品在当前电子书语料和算法下获得的相对排序信号,范围为1..100。它不是作品文学价值的绝对评价,也不替代人工鉴赏或学术判断。
诗选、鉴赏、评论、文史、通俗读物等来源类型不同,代表的参考价值也不同。
书籍本身评分越高,说明这个来源整体质量越可靠。
同一本书中重点讲解、反复引用或排序靠前的作品,会得到更强的书内信号。
系统需要确认标题、作者、正文和归并结果可靠,低置信度会降低贡献。
S = W_source × R_book × I_in_book × C_confidence
一首作品可能出现在多本书里。系统会先计算每次有效来源贡献,再结合跨书出现频次,并在同一个榜单内部归一化, 最后换算成 1 到 100 的分数。出现得多不一定直接高分,来源质量、书内重要性和识别可靠性都会共同影响结果。
高分通常意味着作品被多个质量较高的来源稳定收录、引用或重点讲解,适合作为榜单头部候选。低分不代表作品价值低, 只表示在当前语料中,来源支持、出现频次或数据置信度相对较弱。
如果书籍评分、来源类型、识别置信度或作品归并信息存在缺失,分数可信度会受影响。系统会尽量降低低质量或低置信度信号的权重, 但最终榜单仍应被理解为数据辅助排序,而不是定论。