工业界(搜索 推荐)粗排模型一般怎么做?
2023-06-25 阅读 32
工业界的搜索推荐系统通常包含两个阶段的模型:粗排模型和精排模型。粗排模型主要是为了快速地从海量数据中筛选出一批候选集,以减少后续精排模型的计算量。
在粗排模型中,通常采用一些基于规则或者基于特征的方法,比如基于关键词匹配、基于用户历史行为、基于用户画像等。常见的算法包括BM25、TF-IDF、LSI等。这些算法主要是通过计算文档与查询之间的相似度来进行排序,得到一批候选集。
此外,还可以采用基于深度学习的方法,比如卷积神经网络(CNN)、循环神经网络(RNN)、Transformer等。这些模型可以自动地从数据中学习特征,具有更好的泛化性能和适应性。
总之,工业界的搜索推荐系统粗排模型的选择主要取决于具体的业务需求和数据特点,需要根据实际情况进行选择和调整。
更新于 2023年06月27日