Strict Standards: Resource ID#18 used as offset, casting to integer (18) in /home/tvoyweb/domains/tvoyweb.ru/public_html/forums/include/fm.class.php on line 401

Strict Standards: Resource ID#23 used as offset, casting to integer (23) in /home/tvoyweb/domains/tvoyweb.ru/public_html/forums/include/fm.class.php on line 401

Strict Standards: Resource ID#25 used as offset, casting to integer (25) in /home/tvoyweb/domains/tvoyweb.ru/public_html/forums/include/fm.class.php on line 401

Strict Standards: Resource ID#26 used as offset, casting to integer (26) in /home/tvoyweb/domains/tvoyweb.ru/public_html/forums/include/fm.class.php on line 401
ТвойWeb :: Разделение текста на предложения
ТвойWeb ТвойWeb
Качественный Европейский хостинг
Форум для чайников
 Чат на форуме      Помощь      Поиск      Пользователи


 Страниц (1): [1]   

> Описание: PHP
victor
Отправлено: 18 Сентября, 2007 - 04:38:55
Post Id



Full Member


Покинул форум
Сообщений всего: 177
Дата рег-ции: Февр. 2005  

Карма 0




Помогите пожалуста. Как мне разделить текст на предложения.

Я так понимаю я должен посимвольно пройти весь текст и если мне встречается буква в верхнем регистре я должен начать ее записывать в массив пока не встретится символ окончания строки (. ! ?).
Проблема вследующем, как можно быстро найти Заглавную букву.
 
 Top
Alone
Отправлено: 18 Сентября, 2007 - 06:07:18
Post Id



Super Member


Покинул форум
Сообщений всего: 2393
Дата рег-ции: Дек. 2004  

Карма 8




victor пишет:
Проблема вследующем, как можно быстро найти Заглавную букву.

А если в предложении есть чьё-то имя или просто слово с большой? Тогда не будет это работать.
Например такое предложение: "В понедльник рано утром Виктор по обыкновению делал прогулки по саду".
 
 Top
TvoyWeb Администратор
Отправлено: 18 Сентября, 2007 - 06:18:20
Post Id



Главный здесь


Покинул форум
Сообщений всего: 7072
Дата рег-ции: Нояб. 2003  
Откуда: Tashkent Uz

Карма 52




victor
CODE:
$text = preg_split("#(?<=[\.\?\!])\s+(?=[А-Я-])#s", $text,-1,PREG_SPLIT_NO_EMPTY|PREG_SPLIT_DELIM_CAPTURE);

В $text нужно считать весь текст который хочешь обработать. На выходе получишь масссив предложений.
 
 Top
victor
Отправлено: 18 Сентября, 2007 - 06:31:10
Post Id



Full Member


Покинул форум
Сообщений всего: 177
Дата рег-ции: Февр. 2005  

Карма 0




Alone читай внимательней я про это писал как само собой разумеещееся. Я же написал от Первой заглавной буквы до конца предложения.

TvoyWeb спасибо. А то я в шаблонах еще слаб. Невсегда получается сделать нужный шаблон.
 
 Top
Alone
Отправлено: 18 Сентября, 2007 - 06:51:52
Post Id



Super Member


Покинул форум
Сообщений всего: 2393
Дата рег-ции: Дек. 2004  

Карма 8




victor пишет:
Я же написал от Первой заглавной буквы до конца предложения.

Не писал Улыбка
 
 Top
victor
Отправлено: 18 Сентября, 2007 - 07:14:03
Post Id



Full Member


Покинул форум
Сообщений всего: 177
Дата рег-ции: Февр. 2005  

Карма 0




Alone а это что:
Цитата:

если мне встречается буква в верхнем регистре я должен начать ее записывать в массив пока не встретится символ окончания строки (. ! ?).

Разве тут не сказано о начале записи (заглавной букве) ничего и о конце записи?

Если не видешь я спорить небуду. Главное что шаблон поможет многим работать с текстом.
 
 Top
Alone
Отправлено: 18 Сентября, 2007 - 07:40:40
Post Id



Super Member


Покинул форум
Сообщений всего: 2393
Дата рег-ции: Дек. 2004  

Карма 8




victor
А причём здесь тогда буква в врехнем регистре?
Если известен конец предложения то ясный фиг - это является началом следующего предложения и т.д. По-моему с буквой - это лишнее.
 
 Top
Furax
Отправлено: 20 Сентября, 2007 - 04:51:01
Post Id



Бледнотик


Покинул форум
Сообщений всего: 1472
Дата рег-ции: Март 2007  
Откуда: Иркутск, Сибирь, СССР

Карма 32




Alone
Не лишнее. А знаки перевода строки? А пробелы между предлажениями, смайлы и т. п.?

victor
Проблема, скорее, в предложениях типа, "Не забудьте взять тёплые вещи: носки, свитера и т. п.". Сокращения вроде "гр.", "и пр.", "тов.", "ст." и так далее ещё никто не отменял...
 
 Top
Alone
Отправлено: 20 Сентября, 2007 - 08:14:34
Post Id



Super Member


Покинул форум
Сообщений всего: 2393
Дата рег-ции: Дек. 2004  

Карма 8




Furax пишет:
Проблема, скорее, в предложениях типа, "Не забудьте взять тёплые вещи: носки, свитера и т. п.". Сокращения вроде "гр.", "и пр.", "тов.", "ст." и так далее ещё никто не отменял...

Это точно. Что-то я об этом не подумал. Но их можно исключить (вырезать), не так уж и много.
Furax пишет:
Не лишнее. А знаки перевода строки? А пробелы между предлажениями, смайлы и т. п.?

Ну я например по такому примерно пути шёл:
CODE:
$array=explode(".",$content);
for($i=0;$i<n;$i++)
{
$text.=$array[$i]."";
}

(Отредактировано автором: 20 Сентября, 2007 - 08:15:43)

 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 4 (гостей: 4, зарегистрированных: 0, скрытых: 0)
« PHP/Perl »


Все гости форума могут просматривать этот раздел.
Только администраторы и модераторы могут создавать новые темы в этом разделе.
Только администраторы и модераторы могут отвечать на сообщения в этом разделе.
 



Форум на AlfaSpace.NET


Powered by ExBB
ExBB FM 1.0 RC1 by TvoyWeb.ru
InvisionExBB Style converted by Markus®

[Script Execution time: 0.0441]     [ Gzipped ]



Notice: ob_end_flush(): failed to send buffer of ob_gzhandler (1) in /home/tvoyweb/domains/tvoyweb.ru/public_html/forums/include/page_tail.php on line 33