21:24

Встречал ли кто-нибудь честного человека, у которого серые глаза? (c)
Ребяты, может, кто-то интересовался этой темой.
Меня сейчас конкретно так волнует тема ПО для обработки естественного языка. То, что такие штуки есть для английского - знаю, но вот что с нашим, великим и могучим?
Буду благодарна просто непомерно.

@темы: Вопрос

Комментарии
24.07.2012 в 21:30

Я болен небом. Я в него влюблен...
острое карри., имеются в виду разбор предложений по составу, например?
24.07.2012 в 21:34

Встречал ли кто-нибудь честного человека, у которого серые глаза? (c)
Свет Небесный, да, что-то в этом роде. Может, определение эмоциональной окраски текста. В общем, что-то, на что можно опереться при написании тех же ботов для чатиков.
Любая информация по этому поводу.
24.07.2012 в 22:53

Я болен небом. Я в него влюблен...
Тогда, выкладываю все, что помню:
1. Местоимения и имена собственные определяются только по словарю. Заглавные буквы, как показал опыт, не дают 100% результата. Да и словарь, сам понимаешь, содержит конечный набор слов.
2. Глаголы определяются только по окончаниям.
3. Дополнения мы пытались искать по предшествующим им предлогам. Вариант не самый плохой, но и не выдающийся.
4. Определения - тоже по окончаниям, но с ними, если мне память не изменяет, проблем не было.
5. После очередной проверки преподавателем, оказалось, что нужно еще добавить в программу словарь с названием "Хрень", потому что препод очень любил подавать на вход программы предложения вроде "Киска сказала мяу-мяу, а свинка - хрю-хрю". Но над этим, мне кажется, можно не заморачиваться.
6. С подлежащим - самое сложное, и оно (или они) выбирались по остаточному признаку. Т.е. сначала искались ... местоимения и имена собственные, потом определения, сказуемое(-ые) и подлежащее(-ие) под занавес.
Оказалось, что тот порядок, в котором предложение разбивается по составу очень сильно на результат влияет. А настольной книгой служили несколько учебников по русскому языку, так что учи мат. часть!

В результате, программа разбивала предложения текста объемом 5 листов А4 (шрифт 10) с 70-85% совпадений. Проверялось тупым сравнением разбиения машиной и человеком.
25.07.2012 в 10:04

В сторону Python NTLK посмотри.
25.07.2012 в 11:13

IDDQD - Команда молодости нашей, команда, без которой мне не жить.
В общем, что-то, на что можно опереться при написании тех же ботов для чатиков.
"Кто такая Элис?"
25.07.2012 в 12:51

Встречал ли кто-нибудь честного человека, у которого серые глаза? (c)
Свет Небесный, Flex Ferrum, спасибо, приму к сведению и посмотрю :З
Тигр, мне казалось, оно для английского. Мне казалось?
26.07.2012 в 14:22

И тесно облакам.
Свежая статья на тему: habrahabr.ru/post/148124/
26.07.2012 в 18:25

Встречал ли кто-нибудь честного человека, у которого серые глаза? (c)
Ri, спасибо большое, то, что нужно.