24 апреля 2019 приглашаем на дата-среду из цикла «Большие данные в экономике». Тема второй встречи цикла — «Преимущества векторных представлений слов в неевклидовых геометриях».
Как аналитики в сфере бизнеса, так и академические исследователи зачастую сталкиваются с необходимостью семантического анализа текста. Он может быть применен в таких задачах, как определение тематики и тональности новостных сообщений или предсказание размера заработной платы по описанию вакансии.
На дата-среде Артур Федоров, специалист по машинному анализу естественного языка в группе операционного моделирования Yandex.Market, расскажет о модели Пуанкаре — гиперболического пространства для текстового анализа, которая сохраняет скрытую иерархическую структуру текста. Лектор сравнит стандартные методы нахождения векторных представлений текстов с методом, основанным на неевклидовых геометриях. Эксперт покажет, как решение таких задач, как машинный перевод или анализ тональности текстов становится более точным, если сохраняется контекстное значение омонимов.
Дата-среда будет интересна как тем, кто только осваивает компьютерный анализ текста, так и тем, кто уже имеет практический опыт в этой сфере.
Если вы хотите повторить упражнения за спикером — рекомендуем взять с собой ноутбук. Для участия необходимо зарегистрироваться.
Время проведения: 24 апреля 2019 года в 19.00
Место проведения: Медиалофт РАНХиГС, Пречистенская набережная 11
Организаторы дата-среды: АНО «Инфокультура», Ассоциация участников рынка данных и магистерские программы РАНХиГС «Системы больших данных в экономике» и «Цифровая экономика и современная комбинаторика».
Дата-среды – это серия бесплатных просветительских и обучающих встреч для журналистов, разработчиков, аналитиков и дизайнеров, на которых эксперты из разных сфер рассказывают о методах и инструментах работы с данными и делятся опытом. Материалы прошлых выступлений вы можете найти на странице проекта: http://datasreda.ru.