Встречал ли кто-нибудь честного человека, у которого серые глаза? (c)
Ребяты, может, кто-то интересовался этой темой.
Меня сейчас конкретно так волнует тема ПО для обработки естественного языка. То, что такие штуки есть для английского - знаю, но вот что с нашим, великим и могучим?
Буду благодарна просто непомерно.
Меня сейчас конкретно так волнует тема ПО для обработки естественного языка. То, что такие штуки есть для английского - знаю, но вот что с нашим, великим и могучим?
Буду благодарна просто непомерно.
Любая информация по этому поводу.
1. Местоимения и имена собственные определяются только по словарю. Заглавные буквы, как показал опыт, не дают 100% результата. Да и словарь, сам понимаешь, содержит конечный набор слов.
2. Глаголы определяются только по окончаниям.
3. Дополнения мы пытались искать по предшествующим им предлогам. Вариант не самый плохой, но и не выдающийся.
4. Определения - тоже по окончаниям, но с ними, если мне память не изменяет, проблем не было.
5. После очередной проверки преподавателем, оказалось, что нужно еще добавить в программу словарь с названием "Хрень", потому что препод очень любил подавать на вход программы предложения вроде "Киска сказала мяу-мяу, а свинка - хрю-хрю". Но над этим, мне кажется, можно не заморачиваться.
6. С подлежащим - самое сложное, и оно (или они) выбирались по остаточному признаку. Т.е. сначала искались ... местоимения и имена собственные, потом определения, сказуемое(-ые) и подлежащее(-ие) под занавес.
Оказалось, что тот порядок, в котором предложение разбивается по составу очень сильно на результат влияет. А настольной книгой служили несколько учебников по русскому языку, так что учи мат. часть!
В результате, программа разбивала предложения текста объемом 5 листов А4 (шрифт 10) с 70-85% совпадений. Проверялось тупым сравнением разбиения машиной и человеком.
"Кто такая Элис?"
Тигр, мне казалось, оно для английского. Мне казалось?