я нуждаюсь в некоторых вдохновения. Для хобби проекта я играю с контент-анализ. Я, в основном, стараюсь анализировать ввода, чтобы приспособить ее к тематической карте.
например:
- "путь на Ирак" > " История", Ближнем Востоке
- "Halloumni" > Еда, на Ближнем Востоке
- "BMW" > Германии, Автомобили
- "Обама" > США
- "Импала" > США, Автомобили
- "Берлинской Стены" > " История", Германия
- "Братвурст" > Еда, Германии
- "Чизбургер" > Еда, США
- ...
я читал много о таксономии и, в конце концов, все, что я читал приходит к выводу, что все люди по-разному тег, и для них система обречена на провал.
я думал о с маркерами входа и остановить списки слов, но они, конечно же, много работы, чтобы придумать и построить. Здание соответствующих связей между словами и тем, кажется, утомительна, а также никогда не кончается причина, на каком бы языке вы имеете дело с очень богатым и большинство языков, также в значительной степени полагаются на контекст. Пусть поддержание его в покое.
я думаю, что мне нужно придумать что-то smart и обучать его, с тем я хочу, чтобы он сможет догадаться. Вроде как Элиза бот.
в любом случае, я не верю, что существует нечто, что делает это из коробки, но не у кого-нибудь приводит и примеры для технологию использовать для анализа входных данных в целях извлечения значение?