如何解决如何实施推荐系统?
| 我有《集体智慧》一书,但不确定如何将其实际应用。 假设我有一个带有mySQL数据库的PHP网站。用户可以在数据库中插入带有标题和内容的文章。为了简单起见,我们只比较标题。 如何煮咖啡? 关于咖啡的15件事。 大问题。 如何削铅笔? 家伙被击中球 我们打开“如何煮咖啡?”的文章,由于第二,第四标题的单词相似,因此它们将显示在“相关文章”部分。 如何使用PHP和mySQL实现此功能?如果必须使用Python,也可以。提前致谢。解决方法
在每个产品旁边存储一组关键字,该关键字本质上应该是标题中除一组停用词之外的所有内容。显示标题时,您会发现其他任何具有共同关键字的产品(与具有优先权的一个或多个共同关键字的产品)。
您可以通过根据关键字的稀缺度为每个关键字分配一个分数来进一步增强此效果(例如,稀疏单词的得分较高,例如\'PHP \'上的匹配将比关键字上的匹配更相关。 \“编程\”),或跟踪用户在一组产品之间手动导航的次数。
不管您如何,最好先使其变得简单,然后在继续进行时对其进行增强。根据数据库的大小,更高级的技术可能未必能奏效。
, 最好使用一组标签,这些标签在插入标题后将被解析并存储在数据库中,然后基于该标签进行查询。
如果您必须解析标题,则基本上可以进行LIKE查询:
SELECT * FROM ENTRIES WHERE TITLE LIKE \'%<keyword>%\';
但是,对于更详细的答案:
// You need some test to see if the word is valid.
// \"is\" should not be considered a valid match.
// This is a simple one based on length,a
// \"blacklist\" would be better,but that\'s up to you.
function isValidEntry( $word )
{
return strlen( $word ) >= 4;
}
//to hold all relevant search strings:
$terms = array();
$postTitleWords = explode( \' \',strtolower( \'How to Make Coffee\' ) );
for( $postTitleWords as $index => $word )
{
if( isValidEntry( $word ) ) $terms[] = $word;
else
{
$bef = @$postTitleWords[ $index - 1 ];
if( $bef && !isValidEntry( $bef ) ) $terms[] = \"$bef $word\";
$aft = @$postTitleWords[ $index + 1 ];
if( $aft && !isValidEntry( $aft ) ) $terms[] = \"$word $aft\";
}
}
$terms = array_unique( $terms );
if( !count( $terms ) )
{
//This is a completely unique title!
}
$search = \'SELECT * FROM ENTRIES WHERE lower( TITLE ) LIKE \\\'%\' . implode( \'%\\\' OR lower( TITLE ) LIKE \\\'%\' $terms ) . \'\\\'%\';
// either pump that through your mysql_search or PDO.
, 这可以通过在SQL查询中使用通配符来简单地实现。如果您有较大的文本,并且通配符似乎无法捕获文本的中间部分,请检查一个子字符串是否与另一个匹配。我希望这有帮助。
顺便说一句,您的问题标题是关于实施推荐系统的问题,问题描述只是关于在数据库记录中匹配字段的问题。推荐系统是一个广泛的主题,并附带许多有趣的算法(例如,协作过滤,基于内容的方法,矩阵分解,神经网络等)。如果您的项目规模如此之大,请随时探索这些高级主题。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。