подскажите алгоритм

УСТРАНЕНИЕ КОНКУРЕНТОВ. БЛОКИРОВКА ДОМЕНОВ, БЛОКИРОВКА ИНСТАГРАМ/ТЕЛЕГРАМ И ДРУГОЕ. ПРОВЕРЕННЫЙ СЕЛЛЕР.

НОВЫЕ ТОРГОВАЯ НОВОСТИ ЧАТ

Скрыть

		ANTICHAT > ПРОГРАММИРОВАНИЕ > PHP
подскажите алгоритм

Страница 1 из 2

Опции темы

Поиск в этой теме

Опции просмотра

подскажите алгоритм

06.02.2007, 16:29

Termin@L

Участник форума

Регистрация: 07.12.2006

Сообщений: 192

С нами: 10223973

Репутация: 123

подскажите алгоритм

Народ подскажите, как считать большой текстовый файл(допустим словарь) и очистить его от повторов или наоборот, например найти элемент повторяющийся наибольшее кол-во раз, какой самый быстрый способ (желательно на php)?

𝕏 Twitter Reddit Telegram Копировать ссылку

06.02.2007, 20:40

Helios

Постоянный

Регистрация: 14.01.2007

Сообщений: 459

С нами: 10169427

Репутация: 589

Убирал совпадения из фалика в 200000 строк таким макаром:

Код:

<?php

$data_in = file("numbers.txt");


$data2 = file("base_final.txt");

$data_in = array_merge($data_in, $data2);

sort(&$data_in);


$t = count($data_in);

$iterator = 0;

$data_out = array();

$data_out[] = $data_in[0];

for($i = 1; $i < $t; $i++)
{
	if($data_in[$i] != $data_in[$iterator])
	{
		$data_out[] = $data_in[$i];
		$iterator = $i;
	}
}

file_put_contents("base_final.txt", join("", $data_out));

echo "Done! Total " . count($data_out) . " items";
?>

06.02.2007, 20:50

Srg

Участник форума

Регистрация: 27.01.2006

Сообщений: 118

С нами: 10676351

Репутация: 22

А еще бы комментов ......

06.02.2007, 20:52

~~ZaCo~~

Banned

Регистрация: 20.06.2005

Сообщений: 880

С нами: 10994966

Репутация: 1332

>>Народ подскажите, как считать большой текстовый файл
2Helios мало того что алгоритм неэффективен так он еще и под заданную задачу не подходит.

07.02.2007, 14:10

Helios

Постоянный

Регистрация: 14.01.2007

Сообщений: 459

С нами: 10169427

Репутация: 589

Комменты:
После считывания файла все его строки сортирую, при этом одинаковые окажутся рядом. На это совпадение и проверяю. При желании можно прикрутить strtoupper/strtolower дабы не обращать внимания на регистр.

2ZaCo Напиши эффективнее, ты ж чингачкук.

07.02.2007, 20:00

~~ZaCo~~

Banned

Регистрация: 20.06.2005

Сообщений: 880

С нами: 10994966

Репутация: 1332

2Helios я напишу вот только задачи не вижу.

07.02.2007, 20:10

genom--

Постоянный

Регистрация: 09.07.2006

Сообщений: 937

С нами: 10441826

Репутация: 1686

Цитата:

Сообщение от Helios

понимаешь твоя ошибка в том что при сортировке тебе полюбому придется заносить все в массив и они будут немеренно жрать оперативы о-- особенно если словарь метров на 300 ---

07.02.2007, 20:48

nerezus

Флудер

Регистрация: 12.08.2004

Сообщений: 3,791

С нами: 11444066

Репутация: 2290

Цитата:

Либо память, либо скорость.
Т.к. память безгранична за счет раздела подкачки, то...

07.02.2007, 21:48

Termin@L

Участник форума

Регистрация: 07.12.2006

Сообщений: 192

С нами: 10223973

Репутация: 123

2 ZaCo задача - находить повторяющиеся элементы в текстовом файле и производить с ними различные действия

Последний раз редактировалось Termin@L; 07.02.2007 в 21:51..

#10

08.02.2007, 11:17

Helios

Постоянный

Регистрация: 14.01.2007

Сообщений: 459

С нами: 10169427

Репутация: 589

Скрипт ентот исполняться будет не сотню раз одновременно, а в один поток, поэтому на ОЗУ жаловаться ИМХО нет смысла. А насчет того, что считывать нужно весь файл сразу - в другом случае прогонять поиск совпадений по циклу и сортировку пришлось бы после каждого считывания => время исполнения увеличилось бы в разы.

З.Ы.: Кто знает другие варианты - пишите, а то и самому интерессно)

Страница 1 из 2

Предыдущая тема Следующая тема

Похожие темы
Тема	Автор	Раздел	Ответов	Последнее сообщение
Подскажите Proxy	$ZLO$	Болталка	3	06.02.2005 14:29

Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)

Быстрый переход