Какие инструменты вы используете для анализа текста ?

я нуждаюсь в некоторых вдохновения. Для хобби проекта я играю с контент-анализ. Я, в основном, стараюсь анализировать ввода, чтобы приспособить ее к тематической карте.

например:

  • "путь на Ирак" > " История", Ближнем Востоке
  • "Halloumni" > Еда, на Ближнем Востоке
  • "BMW" > Германии, Автомобили
  • "Обама" > США
  • "Импала" > США, Автомобили
  • "Берлинской Стены" > " История", Германия
  • "Братвурст" > Еда, Германии
  • "Чизбургер" > Еда, США
  • ...

я читал много о таксономии и, в конце концов, все, что я читал приходит к выводу, что все люди по-разному тег, и для них система обречена на провал.

я думал о с маркерами входа и остановить списки слов, но они, конечно же, много работы, чтобы придумать и построить. Здание соответствующих связей между словами и тем, кажется, утомительна, а также никогда не кончается причина, на каком бы языке вы имеете дело с очень богатым и большинство языков, также в значительной степени полагаются на контекст. Пусть поддержание его в покое.

я думаю, что мне нужно придумать что-то smart и обучать его, с тем я хочу, чтобы он сможет догадаться. Вроде как Элиза бот.

в любом случае, я не верю, что существует нечто, что делает это из коробки, но не у кого-нибудь приводит и примеры для технологию использовать для анализа входных данных в целях извлечения значение?

Найдено 3 ответа:

Which tools do you use to analyze text?

http://stackoverflow.com/questions/923597/which-tools-do-you-use-to-analyze-text

Посмотреть решение →