
09.12.2007, 07:35
|
|
Участник форума
Регистрация: 26.12.2006
Сообщений: 107
С нами:
10196899
Репутация:
27
|
|
Всем привет, в общем такая проблемка: собираю базу цитат с различных сайтов с помощью граббера, некоторые повторяющиеся цитаты не заношу в БД так:
for($i=0;$i<100;$i++){
$querysovpad = "SELECT * FROM `table_quote` WHERE `text_body` like '%".$quote[1][$i]."%' LIMIT 0,30";
$mysql_querysovpad = mysql_query($querysovpad);
$sovpad = mysql_num_rows($mysql_querysovpad);
if ($sovpad == 0) {
$query = "INSERT INTO `table_quote` VALUES (NULL,'spamoney', '".$quote[1][$i]."\r\n', now())";
$mysql_query = mysql_query($query);
}
}
где ".$quote[1][$i]." какая либо цитата
Но есть цитаты которые практически одинаковые, только 2-3 слова в них разные и они естественно проходят проверку на наличие уже существующих цитат и заносятся в БД, как сделать так чтоб скрипт сравнивал цитату с цитатами в БД и если процент совпадения слов в них более чем 75% цитата не заносилась в БД??
Последний раз редактировалось spamoney; 09.12.2007 в 07:50..
|
|
|