Название проекта:
Разработка и программная реализация математической модели восстановления текста стимула по данным фМРТ
Направление проекта:
Информационные технологии
Приоритетное направление:
Информационно-телекоммуникационные системы
Критическая технология федерального уровня:
Нано-, био-, информационные, когнитивные технологии
Отрасль экономики:
Деятельность профессиональная научная и техническая прочая
Область знаний:
Экспертные системы
Ключевые слова:
нейролингвистика, машинное обучение, искусственный интеллект, нейронные сети, семантика, Функциональная магниторезонансная томография (фМРТ), мозг человека
Автор проектной идеи, участник реализации проекта:
Фамилия, Имя, Отчество:
Медведева Анна Евгеньевна
Дата рождения:
01.03.1995
Пол:
-
Почтовый индекс:
236011
Почтовый адрес:
г.Калиниград, ул.Интернациональная, д.42, кв.17
Регион:
Калининградская область
Город:
КАЛИНИНГРАД
Номер телефона:
8(916) 533-6531
Факс:
-
Контактный email:
medanya@inbox.ru
Учёная степень:
-
Учёное звание:
-
Место учебы:
Московский физико-технический институт
Специальность:
прикладная математика и информатика
Место работы:
ООО Яндекc
Должность:
студентка магистратуры
Профессиональные достижения:
2017 — участие в создании специализации Advanced Machine Learning для НИУ ВШЭ и Coursera, в том числе разработка презентационных материалов и практических заданий по курсу Deep Learning for Computer Vision. 2017-н.в. — младший аналитик службы анализа больших данных Yandex Data Factory, Разработка алгоритмов компьютерного зрения с использованием глубоких нейросетей, включая модели классификации изображений, модели распознавания лиц. 2017 — разработка модели машинного обучения для предсказания стоимости автомобиля (коммерческий проект), 2017-н.в. — студентка магистратуры кафедры анализа данных Яндекса (совместная программа со Школой Анализа Данных Яндекса), 2017 — бакалавр МФТИ; с отличием защитила бакалаврский диплом по теме исследования, результаты работы докладывались и обсуждались на ряде семинаров, включая: — Summer Neurolinguistics School 2017, — научный семинар лаборатории нейролингвистики НИУ ВШЭ, — научном семинаре Курчатовского Комплекса НБИКС технологий. 2016 — второе место на хакатоне SkinHack, 2015 — научное исследование в области теории графов и дискретной математики, результаты работы докладывались и обсуждались на ряде научных конференций, включая — 58-ая научная конференция МФТИ, — научный семинар по случайным графам, — опубликована работа Жуковский, М. Е., Медведева, А. Е. (2016). Когда не выполнен k-закон нуля или единицы?. Математические заметки, 99(3), 342-349. 2009 — к.м.с. по шахматам, многократная чемпионка Калининградской области.
КОМАНДА (перечислить всех членов команды):
-
НАУЧНО-ТЕХНИЧЕСКАЯ ЧАСТЬ ПРОЕКТА:
Цель выполнения НИОКР:
Разработка математических методов и алгоритмов, позволяющих восстанавливать стимул (прочитанный текст) по данным функциональной магнитно-резонансной томографии, включая — разработка математической модели представления данных фМРТ, позволяющей преобразовать измеренный фМРТ сигнал в значимые для восстановления стимула признаки, — разработка математической модели декодирования представления данных фМРТ, позволяющей декодировать признаковое описание данных фМРТ и получить на выходе описание изначального стимула, — разработка метода машинного обучения, позволяющего настроить параметры математический моделей кодировщика и декодировщика по размеченной обучающей выборке, — программная реализация разработанных моделей и методов, — разработка демонстрационной программы для визуализации полученных результатов.
Задачи выполнения НИОКР:
Результаты работы могут использованы в области нейрофизиологии для характеризации процессов обработки информации и визуализации функциональной структуры мозга, в области компьютерной и нейролингвистики для разработки эффективных методов построения признаковых описаний текстов, а также, возможно, получит коммерческое применение в области рекламы и маркетинга для рекомендаций по созданию эффективных рекламных кампаний. Результаты работы могут использоваться в качестве демонстрационного инструмента в образовательных программах по лингвистике.
Научная новизна предлагаемых в проекте решений:
Для английского языка была показана возможность создания семантического атласа мозга, то есть такой карты мозга, на которой представлены группы семантически близких понятий. Однако данная работа не ставила своей целью восстановление стимула для испытуемых. Кроме того, в этой работе фМРТ-отклики в различные моменты времени считали независимыми, т.е. не учитывался контекст слова и предыдущее нейронная активация, и использовался аудиальный стимул. В работе [2] исследовалась предсказательная сила нейросетевых методов, в частности, рекуррентных нейронных сетей, однако отсутствовали анализ и интерпретация результатов в терминах нейролингвистики или нейрофизиологии. В работе [3] предложены оригинальные признаки, которые использовались для сопоставления предложений стимула по данным нейронной активности мозга. Ни одна из упомянутых работ не включает явной модели восстановления стимула (текстового или аудиального). Предлагается провести независимый эксперимент по исследованию возможности восстановления стимула на русском языке и провести анализ его результатов с помощью новой математической модели на основе машинного обучения с генерацией описания стимула и построением функциональной карты мозга на основе анализа параметров модели.
Обоснование необходимости проведения НИОКР:
На данный момент не существует семантического атласа мозга для русского языка (какие зоны воспринимают какие семантические группы), а также математической модели, способной предсказывать содержание стимула на основе фМРТ данных, тем более делая это с учетом времени и контекста
Научный руководитель:
Ф.И.О.
-
Должность
-
Ученая степень
-
Звание
-
Адрес
-
Телефон
-
Email
-
КОММЕРЦИАЛИЗУЕМОСТЬ НАУЧНО-ТЕХНИЧЕСКИХ РЕЗУЛЬТАТОВ:
Область применения
На данный момент не существует семантического атласа мозга для русского языка (какие зоны воспринимают какие семантические группы), а также математической модели, способной предсказывать содержание стимула на основе фМРТ данных, тем более делая это с учетом времени и контекста
Имеющиеся аналоги
трехмерный атлас мозга, однако как указывалось выше, в эксперименте стимул был аудиальный (планируется чтение текста), авторы не учитывали контекст слов, а также участки мозга, соседние с предсказываемым, также эксперимент был проведен для немецкого языка.
План реализации
Первый год поквартально: 1. Подготовка к проведению эксперимента: планирование дизайна эксперимента, подбор текста для стимула, его семантическая разметка, поиск испытуемых. 2. Проведение эксперимента. 3. Предобработка фМРТ данных: коррекция движений, нормализация. 4. Построение линейно модели предсказания семантических признаков. Второй год поквартально: 1. Разработка математической модели, учитывающая контекст. 2. Анализ работы модели, проведение статистических тестов. 3. Разработки модели общей модели нейронной сети, сравнение результатов с известными в нейрофизиологии знаниями. 4. Визуализация результатов, разработка демо.
Куратор новатора
Инновационная инфраструктура
Место научной реализации проекта
Наименование
Московский физико-технический институт
Контактное лицо
Кудрявцев Н.Н.
Телефон
8(849) 540-5559
Email
info@mipt.ru
Наличие договора
Нет
Место коммерческой реализации проекта
Наименование
Московский физико-технический институт
Контактное лицо
Кудрявцев Н.Н.
Телефон
8(495) 405-5594
Email
info@mipt.ru
Наличие договора
Да
Стадия проекта:
Прототип
Проект получил грантовую поддержку:
Да ,УМНИК, Фонд содействия инновациям
План развития результатов реализации проекта
Презентация проекта
Результаты реализации проекта
Полученная интеллектуальная собственность
-
Описание полученного продукта
Презентация Продукта
Фотогалерея продукта
Потребности новатора:
Потребность в инвестициях:
Да
Объем
2,0 млн руб
Статьи
-
Потребность в продаже интеллектуальной собственности:
Нет
Потребность в членах команды:
Нет
Потребность в получении услуг ментора
Да
Потребность в получении экспертизы проекта
Да
Потребность в получении услуг научного руководителя
Да
ПОТРЕБНОСТИ В ПАРТНЕРАХ
Для совместной реализации проекта:
Да
Для продвижения результатов реализации проекта:
Да
Для коммерциализации результатов реализации проекта:
Да
🗙