Дьяконов Александр

Научные статьи

Когда я пишу, то стараюсь забыть всё,
написанное в книгах, чтобы эти воспоминания
не испортили форму моего сочинения
(Монтень)

Статьи


Методы решения задач классификации с категориальными признаками [скачать]

Статья (Прикладная математика и информатика. 2014. № 46, с. 103-127 ). Рассмотрены различные методы решения задачи классификации на два класса, в которой все признаки категориальные (номинальные, факторные), т.е. описывают принадлежность объекта к категориям. Некоторые методы являются простым обобщением классических (байесовских алгоритмов, сингулярного разложения), другие – принципиально новыми. Предложен эффективный способ кодирования категориальных признаков в вещественные, который позволяет применять классические методы машинного обучения (например, случайный лес). Предложено обобщение алгоритмов k ближайших соседей (kNN) и вычисления оценок (АВО), которое показало наилучшее качество на реальных данных. Все методы протестированы на прикладной задаче из области построения рекомендательной системы для службы безопасности.

Прогноз поведения клиентов супермаркетов с помощью весовых схем оценок вероятностей и плотностей [скачать]

Рассмотрены две задачи, связанные с поведением клиентов сети супермаркетов: прогнозирование даты следующего визита каждого клиента и суммы его покупок. Первая задача сведена к задаче оценки вероятностей визитов, вторая ­– к задаче восстановления плотностей распределений сумм покупок каждого пользователя. Для решения указанных задач предложено использовать взвешенные схемы: каждой точке выборки ставится в соответствие вещественное неотрицательное число (вес). Веса позволяют учитывать дополнительную информацию, например устаревание данных (точки соответствующие старым данным имеют меньшие веса). Опубликовано в журнале «Бизнес-информатика». 2014. №1 (27) С.68-77.

Решение задач анализа данных, основанное на линейной комбинации деформаций [скачать]

Дан обзор некоторых теоретических результатов представления функций и алгоритмов в специальном виде: линейной комбинации «деформации»; линейных функций/алгоритмов. В теории интерполяции подобные результаты отталкиваются от работ А.Н. Колмогорова, в теории классификации - от работ Ю.И. Журавлёва. Показано, что идеи подобного представления можно успешно использовать на практике. Описаны решения нескольких прикладных задач в рамках крупных Международных конкурсов. Опубликовано в журнале «Машинное обучение и анализ данных». 2013. T. 1, № 5. C. 568-579.

Алгоритмы для рекомендательной системы: технология LENKOR [статья]

Описаны алгоритмы-победители Международного соревнования «ECML/PKDD Discovery Challenge 2011 (VideoLectures.Net Recommender System Challenge)» по написанию рекомендательной системы для научного репозитария лекций VideoLectures.net.
Опубликовано в «Бизнес-Информатике» (1/2012)

Некоторые технологии решения задач анализа данных [доклады ИОИ-2012]

В работе описаны общие методы решения современных прикладных задач анализа данных. Методы основаны на успешном авторском опыте участия в крупных Международных турнирах по анализу данных и часто позволяют получать не просто приемлемые, а лучшие результаты.

Прогнозирование связности графа [доклады ММРО-2011]

Описана проблема прогнозирования связности графа (Link Prediction Problem), которая достаточно популярна на западе, но даже не упоминается в русскоязычной литературе. Её популярность объясняется приложениями в исследованиях стремительно развивающихся социальных сетей и теории анализа графов (graph mining). Сделан обзор работ, посвященных этой проблеме, приведены результаты экспериментов по решению реальной прикладной задачи.

Другие разделы:

Слайды

Спектральная теория графов [скачать]

Обзор по некоторым результатам спектральной теории графов (Spectral Graph Theory) для своего спецсеминара.

Applied Data Analysis Problems [скачать]

Лекция, прочитанная в компании «Samsung» на «Technology Forum "Machine Learning"» (перечень решённых прикладных задач и методов их решения).

Наброски

Прогнозирование рядов соревнования «Tourism Forecasting Part Two» [скачать]

Описание простого алгоритма прогнозирования временных рядов соревнования Kaggle.com. Прилагаются иллюстрации, статистика работы, исходные коды и пошаговые инструкции
Текст недостаточно выверен, сообщайте об ошибках автору.

Решение «Topical Classification of Biomedical Research Papers» [скачать]

Описание алгоритма решения задачи классификации биомедицинских статей соревнования TunedIT.org.

Авторефераты


Алгебраические замыкания обобщённой модели алгоритмов распознавания, основанных на вычислении оценок [скачать]

Автореф. дис. … д-ра физ.-мат. наук: 01.01.09 / МГУ. – М., 2009. – 39 с.

Построение простых нормальных форм характеристических функций классов в задачах распознавания с целочисленной и бинарной информацией [скачать]

Автореф. дис. … канд. физ.-мат. наук: 01.01.09 / МГУ. – М., 2003. – 17 с.

k-сингулярные системы точек в алгебраическом подходе к распознаванию образов [скачать]

Автореф. дис. … канд. физ.-мат. наук: 01.01.09 / МГУ. – М., 2011. – 17 с. Автореферат моего ученика.

см. также

[полный список публикаций]
[английские статьи]
[список статей на MathNet] c доступом к текстам!
[список статей в системе ИСТИНА]
Идея дизайна частично взята у Mark Reid За достоверность информации никто ответственности не несёт.