ANTICHAT.XYZ    VIDEO.ANTICHAT.XYZ    НОВЫЕ СООБЩЕНИЯ    ФОРУМ  
Баннер 1   Баннер 2
Antichat снова доступен.
Форум Antichat (Античат) возвращается и снова открыт для пользователей. Здесь обсуждаются безопасность, программирование, технологии и многое другое. Сообщество снова собирается вместе.
Новый адрес: forum.antichat.xyz
Вернуться   Форум АНТИЧАТ > Программирование > PHP, PERL, MySQL, JavaScript
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

  #1  
Старый 16.04.2009, 21:40
Аватар для Gadik
Gadik
Участник форума
Регистрация: 29.05.2006
Сообщений: 148
Провел на форуме:
1159891

Репутация: 30
По умолчанию

а, пасибо, второй вариант мне более понятен, смогу доделать)) спс большое за помощь) буду пробовать



... не происходит переход по линкам.... скрипт не менял так и залил, должен же работать в таком виде? ..


а именно срабатывает условие там где

//не определено у тя такого

вообщем false выдает, не могу понять почему...

разобрался, исправил pos !== false на pos !== "" и вроде работает

Последний раз редактировалось Gadik; 16.04.2009 в 22:11..
 
Ответить с цитированием

  #2  
Старый 17.04.2009, 05:19
Аватар для shellz[21h]
shellz[21h]
Постоянный
Регистрация: 20.12.2007
Сообщений: 334
Провел на форуме:
1934122

Репутация: 118
Отправить сообщение для shellz[21h] с помощью ICQ
По умолчанию

Доброе время суток!
Имеются записи в формате:

site.com/?id=1&page=end
site.com/?id=2&page=end
site.com/?pp=1&page=main&sort=1
site.com/?pp=2&page=main&sort=1
etc...

Подскажите пожалуйста, как убрать повторые записи, нужно чтоб вывдило, вот так:
site.com/?id=1&page=end
site.com/?pp=1&page=main&sort=1
тоесть, чтоб переменные не повторялись. Заранее спасибо.
 
Ответить с цитированием

  #3  
Старый 17.04.2009, 05:42
Аватар для 159932
159932
Постоянный
Регистрация: 28.09.2007
Сообщений: 820
Провел на форуме:
6722038

Репутация: 1385


По умолчанию

проще всего загнать в массив и заюзать ф-ию array_unique()
напр. если это файл print_r(array_unique(file('a.txt')));
ну или если уже стринг print_r(array_unique(explode("\n",$string)));
 
Ответить с цитированием

  #4  
Старый 17.04.2009, 05:50
Аватар для Dr.Frank
Dr.Frank
Постоянный
Регистрация: 31.07.2002
Сообщений: 312
Провел на форуме:
1212427

Репутация: 187
Отправить сообщение для Dr.Frank с помощью ICQ
По умолчанию

Цитата:
Сообщение от 159932  
проще всего загнать в массив и заюзать ф-ию array_unique()
напр. если это файл print_r(array_unique(file('a.txt')));
ну или если уже стринг print_r(array_unique(explode("\n",$string)));
array_unique не справится с этой задачей, т.к. в приведенном примере не полностью одинаковые строки:
Цитата:
site.com/?id=1&page=end
site.com/?id=2&page=end
site.com/?pp=1&page=main&sort=1
site.com/?pp=2&page=main&sort=1
 
Ответить с цитированием

  #5  
Старый 17.04.2009, 06:05
Аватар для shellz[21h]
shellz[21h]
Постоянный
Регистрация: 20.12.2007
Сообщений: 334
Провел на форуме:
1934122

Репутация: 118
Отправить сообщение для shellz[21h] с помощью ICQ
По умолчанию

array_unique() , в этому случае не подходит.
Dr.Frank, правильно понил вопрос)
 
Ответить с цитированием

  #6  
Старый 17.04.2009, 11:53
Аватар для Pashkela
Pashkela
Динозавр
Регистрация: 10.01.2008
Сообщений: 2,841
Провел на форуме:
9220514

Репутация: 3338


Отправить сообщение для Pashkela с помощью ICQ
По умолчанию

Тогда лучше пример такого файла ТОЧНЫЙ (или сказать, что точно так, как в вопросе, только хост заменен) + идут ли такие вот записи подряд или нет (одна под другой, или может быть случайное расположение)

PHP код:
<pre>
<?php
$str1 
"site.com/?id=1&page=end";
$str2 "site.com/?id=2&page=end";
$var1 similar_text($str1$str2, &$tmp);
echo 
"Совпадение в процентах: $tmp\n"// примерно 95%, 
//значит практически идентичны, для нас по условиям., идентичны

//Если отличие больше - значит у нас новая ссылка:
$str1 "site.com/?id=1&page=end";
$str2 "site.com/?pp=1&page=main&sort=1";
$var1 similar_text($str1$str2, &$tmp);
echo 
"Совпадение в процентах: $tmp\n"// примерно 70% 
//разница большая, новая уникальная ссылка (по условиям)
?>
</pre>
но в данном случае лучше всего подойдет функция Левенштейна, которая просто показывает, сколько символов надо заменить, чтобы из первой строки получить вторую, т.е. если возвращает 1 - строки АБСОЛЮТНО ИДЕНТИЧНЫ по условию задачи:

PHP код:
<?php
$str1 
"site.com/?id=1&page=end";
$str2 "site.com/?id=2&page=end";
$var levenshtein($str1,$str2);
echo(
$var); // вернет 1
?>
</pre>
если строки идут не подряд такого рода, а в разброс - то файл в массив и предварительная сортировка, потом обычное построчное чтение с помощью fgets() и сравнению по Левенштейну

т.е. по задаче конкретно примерно так выглядеть будет по идее:

PHP код:
<pre>
<pre>
<?php

$file 
'tema1.txt'// Файл с ссылками
$res 'tema10.txt'// Результирующий файл

// функция для сравнения по Левенштейну
function lev($str1,$str2) {
 
$a levenshtein($str1,$str2);
 if (
$a!=1) return true;
 return 
false
}

// Соритруем файл с сылками
$sort file($file);
sort($sort);
file_put_contents($file,$sort);
// Начинаем отбирать "уникальные" ссылки
$hand1 fopen($res,'w');
$hand fopen($file,'r');
while(!
feof($hand)) {
 
$buf1 trim(fgets($hand));
 
$buf2 trim(fgets($hand)); 
 if (
lev($buf1,$buf2)) fwrite($hand1,$buf1"\n" .$buf2 ."\r\n");
 else 
fwrite($hand1,$buf1 "\r\n");
}
fclose($hand);
fclose($hand1);
echo 
'Done';
?>
</pre>
Погонял щаз, на самом деле и этот вариант неправильный, т.к. будет работать только для ДВУХ подряд идущих ссылок)) А если их таких три и больше - не сработает. Поэтому вот ПРАВИЛЬНЫЙ вариант на любое кол-во таких ссылок:

PHP код:
<pre>
<?php

$file 
'tema1.txt'// Файл с ссылками
$res 'tema10.txt'// Результирующий файл

// функция для сравнения по Левенштейну
function lev($str1,$str2) {
 
$a levenshtein($str1,$str2);
 if (
$a==or $a==0) return false;
 return 
true
}

// А теперь сравниваем каждую строку 
//со всеми при помощи функции выше
function Ustr ($hand$str)
{
   
fseek($hand,0);
   while (!
feof ($hand)) {
      
$temp trim(fgets($hand));
      if (!
lev($str,$temp))
      return 
false;
   }
   return 
true;
}

// Сортируем файл с сылками
$sort file($file);
sort($sort);
file_put_contents($file,$sort);
// Начинаем отбирать "уникальные" ссылки
$hand1 fopen($res,'w+');
$hand fopen($file,'r');
while(!
feof($hand)) {
 
$buf trim(fgets($hand));
 if (
Ustr($hand1,$buf)) {
   
fseek ($hand10SEEK_END);
   
fwrite($hand1,$buf ."\r\n");
 }
}
fclose($hand);
fclose($hand1);
echo 
'Done';
?>
</pre>

Последний раз редактировалось Pashkela; 17.04.2009 в 13:28..
 
Ответить с цитированием

  #7  
Старый 17.04.2009, 13:19
Аватар для Gifts
Gifts
Reservists Of Antichat - Level 6
Регистрация: 25.04.2008
Сообщений: 827
Провел на форуме:
2769640

Репутация: 1304


По умолчанию

Pashkela Вы как бы заблуждаетесь, если строки идентичны - левенштейн вернет 0. А для id=2 и id=13 левенштейн вернет 2. И ваш скрипт вообще возвращает неожиданные результаты))

Код:
Вход:
site.com/?id=1&page=end
site.com/?id=5&page=end
site.com/?id=4&page=end
site.com/?id=3&page=end
site.com/?id=2&page=end
site.com/?id=6&page=end

Выход:
site.com/?id=1&page=end
site.com/?id=3&page=end
site.com/?id=5&page=end

Последний раз редактировалось Gifts; 17.04.2009 в 13:22..
 
Ответить с цитированием

  #8  
Старый 17.04.2009, 13:30
Аватар для Pashkela
Pashkela
Динозавр
Регистрация: 10.01.2008
Сообщений: 2,841
Провел на форуме:
9220514

Репутация: 3338


Отправить сообщение для Pashkela с помощью ICQ
По умолчанию

исправил выше в посте, когда

id=2 и id=11111

пока хз, можно ручками задать в условиях в первой функции, универсально как - хз пока, или от процентов прыгать (similar_text())

Хм, не такая уж и тривиальная задачка
 
Ответить с цитированием

  #9  
Старый 17.04.2009, 13:37
Аватар для Gifts
Gifts
Reservists Of Antichat - Level 6
Регистрация: 25.04.2008
Сообщений: 827
Провел на форуме:
2769640

Репутация: 1304


По умолчанию

Если нужно сравнивать только окончания ссылок

Входной файл:
Код:
site.com/?id=1&page=end
site.com/?id=2&page=end
site.com/?pp=1&page=main&sort=1
site.com/?pp=2&page=main&sort=1
site.com/?dd=1&page=old
site.com/?dd=2&page=old
site.com/?dd=3&page=old
site.com/?dd=4&page=old
PHP код:
<?php
$file 
'tema1.txt';

$f file_get_contents($file)."\r\n";
preg_match_all('~^[^\?]*\?[^=]+=([^&]+)(&.+)~mi',$f,$match);
$arr=array_values(array_combine($match[2],$match[0]));
print_r($arr);
echo 
'Done';
?>
С учетом ниженаписанного SQLHACK регулярка будет такая (имхо проще и быстрее будет):
PHP код:
<?php
$file 
'tema1.txt';

$f file_get_contents($file)."\r\n";
preg_match_all('~^.*/([^=]+)=[^&]+&.+~mi',$f,$match);
$arr=array_values(array_combine($match[1],$match[0]));
print_r($arr);
echo 
'Done';
?>

Последний раз редактировалось Gifts; 17.04.2009 в 17:38..
 
Ответить с цитированием

  #10  
Старый 17.04.2009, 13:43
Аватар для Pashkela
Pashkela
Динозавр
Регистрация: 10.01.2008
Сообщений: 2,841
Провел на форуме:
9220514

Репутация: 3338


Отправить сообщение для Pashkela с помощью ICQ
По умолчанию

Ну или вот с процентным совпадением, процент задаете сами в первой функции:

PHP код:
<pre>
<?php

$file 
'tema1.txt'// Файл с ссылками
$res 'tema10.txt'// Результирующий файл


// функция для процентного сравнения текста
function lev($str1,$str2) {
     
$a similar_text($str1$str2, &$tmp);
     if (
round($tmp,0)>=86) return false// тут 86 - 
// - процент совпадения строк, можно менять
     
return true
}


// А теперь сравниваем каждую строку со всеми при помощи функции выше
function Ustr ($hand$str)
{
   
fseek($hand,0);
   while (!
feof ($hand)) {
      
$temp trim(fgets($hand));
      if (!
lev($str,$temp))
      return 
false;
   }
   return 
true;
}

// Соритруем файл с сылками
$sort file($file);
sort($sort);
file_put_contents($file,$sort);
// Начинаем отбирать "уникальные" ссылки
$hand1 fopen($res,'w+');
$hand fopen($file,'r');
while(!
feof($hand)) {
 
$buf trim(fgets($hand));
 if (
Ustr($hand1,$buf)) {
   
fseek ($hand10SEEK_END);
   
fwrite($hand1,$buf ."\r\n");
 }
}
fclose($hand);
fclose($hand1);
echo 
'Done';
?>
</pre>

Последний раз редактировалось Pashkela; 17.04.2009 в 13:47..
 
Ответить с цитированием
Ответ



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
[c/c++] Новичкам: задаем вопросы _Great_ С/С++, C#, Delphi, .NET, Asm 5420 17.06.2010 13:33
Интернетчики задали российскому президенту очень странные вопросы podkashey Мировые новости 4 07.07.2006 16:53
Вопросы по Ipb 2.0 Voodoo_People Форумы 26 15.02.2005 22:57



Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT.XYZ