Конструктивная логика
Теория алгоритмов
Конструктивные интерпретации логических и логико-математических языков
В.Е.Плиско, Лекции по конструктивной логике. М.: Луч, 2021.
Спецкурс разработан при поддержке фонда "БАЗИС".
https://basis-foundation.ru/special-program/mathmech/courses/winners
Страница курса: http://logic.math.msu.ru/staff/ver/old/error-correcting-codes/ecc2024/
Страница спецкурса: http://logic.math.msu.ru/staff/lyubetsky/mmdp/.
Этот спецкурс - вторая половина спецкурса "Современные методы обработки данных".
Слушатели должны зарегистрироваться по адресу gorbunov@iitp.ru, сообщив о себе: ФИО полностью, факультет, группу, свой email и мобильный.
Компьютерная обработка больших данных — универсальное направление исследований буквально во всех областях естественных и гуманитарных наук. В тоже время такая обработка опирается на методы современной математики, от алгоритмов до геометрии. Используемые здесь методы/алгоритмы в основном эвристические, интуитивно построенные, для которых почти неизвестны доказательства их правильности. Более того, обычно не существует даже математической постановки задачи, решаемой таким эвристическим алгоритмом; сама эта задача понимается интуитивно, на основе компьютерных экспериментов и опыта применения в данной прикладной области. Будет рассказан, так называемый, метод Seurat, широко применяемый в разных прикладных задачах и особенно в биоинформатике. Будут обсуждаться проблемы его обоснования, далёкие от математического решения. Будут предложены компьютерные вычислительные программистские математические задачи, как и реально прикладные, для курсовых и дипломных работ; для аспирантских тем. Никакие предварительные знания не предполагаются; все необходимые сообщаются на лекциях. После каждой лекции предполагается факультативный семинар и обсуждение задач.
Литература.
Первые три ссылки -- пример полного счёта программы и страница с подробным описанием каждой функции пакета Seurat. Далее работы, полезные по всем пунктам:
https://satijalab.org/seurat/articles/pbmc3k_tutorial
https://satijalab.org/seurat/reference/
https://github.com/satijalab/seurat/tree/main/src
Далее отдельные статьи по пунктам выше/ниже.
1) дисп строки почти не зависит средн строки
Преобразование данных к log-нормальному виду.
Nucleic Acids Research, 2008, Vol. 36, No. 2 e11 doi:10.1093/nar/gkm1075
2) строки с большой дисп по окрестности yi
Выделение строк числовой матрицы с большой вариабельностью.
Кластеризация точек многомерного пространства: алгоритм и программа, счёт прикладной задачи.
Лекции.
https://en.wikipedia.org/wiki/Local_regression
Traag, V.A., Waltman, L. & van Eck, N.J. From Louvain to Leiden: guaranteeing well-connected communities. Sci Rep 9, 5233 (2019). https://doi.org/10.1038/s41598-019-41695-z
3) хорошие коор-ты столбца, и оставить информативные коор-ты
Выбор наиболее информативных строк числовой матрицы с большой вариабельностью.
Кластеризация столбцов числовой матрицы на основе методов Seurat и Single R.
Traag, V.A., Waltman, L. & van Eck, N.J. From Louvain to Leiden: guaranteeing well-connected communities. Sci Rep 9, 5233 (2019). https://doi.org/10.1038/s41598-019-41695-z
https://en.wikipedia.org/wiki/Local_regression
Stuart T. et al. ComprehensiveIntegration of Single-Cell Data. Cell 177, 1888–1902, June 13, 2019. https://doi.org/10.1016/j.cell.2019.05.031
4) в множестве М точек ранговые веса рёбер
Графовое представление множества точек многомерного пространства.
Лекции.
5) начальную кластеризацию столбцов
Выбор начального графового представления множества точек многомерного пространства.
Лекции.
6) максимум фун-и модулярности, итеративно
Выбор наиболее экспрессируемых строк числовой матрицы.
Лекции.
Traag, V.A., Waltman, L. & van Eck, N.J. From Louvain to Leiden: guaranteeing well-connected communities. Sci Rep 9, 5233 (2019). https://doi.org/10.1038/s41598-019-41695-z
7) диф-экспрессированные строки: МУВ+БХ
Максимизация функции модулярности на графах.
https://en.wikipedia.org/wiki/Local_regression
Stuart T. et al. ComprehensiveIntegration of Single-Cell Data. Cell 177, 1888–1902, June 13, 2019. https://doi.org/10.1016/j.cell.2019.05.031
8) понизить размерность: новые веса+КЛ
Stuart T. et al. ComprehensiveIntegration of Single-Cell Data. Cell 177, 1888–1902, June 13, 2019. https://doi.org/10.1016/j.cell.2019.05.031
McInnes, L, Healy, J, UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction, ArXiv e-prints 1802.03426, 2018
Страница спецкурса: http://logic.math.msu.ru/staff/lyubetsky/mmdp/.
Этот спецкурс - первая половина годового спецкурса "Современные методы обработки данных".
Слушатели должны зарегистрироваться по адресу gorbunov@iitp.ru, сообщив о себе: ФИО полностью, факультет, группу, свой email и мобильный.
Компьютерная обработка больших данных — универсальное направление исследований буквально во всех областях естественных и гуманитарных наук. В тоже время такая обработка опирается на методы современной математики, от алгоритмов до геометрии. Используемые здесь методы/алгоритмы в основном эвристические, интуитивно построенные, для которых почти неизвестны доказательства их правильности. Более того, обычно не существует даже математической постановки задачи, решаемой таким эвристическим алгоритмом; сама эта задача понимается интуитивно, на основе компьютерных экспериментов и опыта применения в данной прикладной области. Будет рассказан, так называемый, метод Seurat, широко применяемый в разных прикладных задачах и особенно в биоинформатике. Будут обсуждаться проблемы его обоснования, далёкие от математического решения. Будут предложены компьютерные вычислительные программистские математические задачи, как и реально прикладные, для курсовых и дипломных работ; для аспирантских тем. Никакие предварительные знания не предполагаются; все необходимые сообщаются на лекциях. После каждой лекции предполагается факультативный семинар и обсуждение задач.
Страница спецкурса: http://logic.math.msu.ru/staff/lyubetsky/mmdp/.
Курс можно сдавать как два полугодовых или как годовой. Названия полугодовых «половинок»: «Математические методы анализа данных (Mathematical methods of data analysis)», «Компьютерный анализ клеточных типов (Computer analysis of cell types)».
Слушатели должны зарегистрироваться по адресу gorbunov@iitp.ru, сообщив о себе: ФИО полностью, факультет, группу, свой email и мобильный.
Компьютерная обработка больших данных — универсальное направление исследований буквально во всех областях естественных и гуманитарных наук. В тоже время такая обработка опирается на методы современной математики, от алгоритмов до геометрии. Используемые здесь методы/алгоритмы в основном эвристические, интуитивно построенные, для которых почти неизвестны доказательства их правильности. Более того, обычно не существует даже математической постановки задачи, решаемой таким эвристическим алгоритмом; сама эта задача понимается интуитивно, на основе компьютерных экспериментов и опыта применения в данной прикладной области. Будет рассказан, так называемый, метод Seurat, широко применяемый в разных прикладных задачах и особенно в биоинформатике. Будут обсуждаться проблемы его обоснования, далёкие от математического решения. Будут предложены компьютерные вычислительные программистские математические задачи, как и реально прикладные, для курсовых и дипломных работ; для аспирантских тем. Никакие предварительные знания не предполагаются; все необходимые сообщаются на лекциях. После каждой лекции предполагается факультативный семинар и обсуждение задач.