Проекты не по математике
Биоинформатика. Раменский Василий Евгеньевич, Салимгареев Руслан Салаватович
Проект рассчитан на слушателей, не имеющих специальной подготовки, кроме школьных уроков биологии. Биоинформатика — раздел молекулярной биологии, связанный с анализом и обработкой данных, — представлена несколькими направлениями, среди которых биоинформатика последовательностей, структурная биоинформатика, системная биология. Цель нашего проекта — освоить основные инструменты работы с биоинформатическими данными через небольшие практические задачи, в основном будет затронута биоинформатика последовательностей. Поработав над этим проектом, вы сами сможете найти последние научные данные про любой интересующий вас ген или белок и даже провести несложный анализ их свойств.
Проект начнётся с вводной лекции по основам молекулярной биологии и биоинформатики. Затем вам будет предложено несколько небольших биоинформатических кейсов. На защите нужно будет рассказать, чем вы занимались и чему научились, так, чтобы слушатели без биологической подготовки это поняли — а это не так просто, как кажется!
Клеточные автоматы. Даня Макаров
Сложный непонятный проект! Я сам не знаю, что получится!
Возможно, вы слышали про игру жизнь Конвея. Часть клеток бесконечной клетчатой доски живая, часть — мёртвая, затем клетки оживают и умирают в зависимости от количества живых соседей. Несмотря на простые правила, может возникать очень сложное и интересное поведение, вот видео с примерами. Есть и другие клеточные автоматы. Есть несколько вариантов активности:
- Поразбираться с игрой жизнь и другими клеточными автоматами, например, фон Неймана (он сделан для того, чтобы в нём были копирующие себя структуры) и его усовершенствованиями. Попробовать придумать свой клеточный автоматами
- Важное отличие игры жизнь от настоящей жизни состоит в том, что, если чуть-чуть повредить вас, вы этого не заметите, а конструкция в игре жизнь рассыплется. Я предлагаю посмотреть, что будет, если добавить в клеточные автоматы чуть-чуть шума — иногда случайно переключать клетки. Сначала нужно разобраться с клеточными автоматами, как в предыдущем пункте. Возможно, получится что-то интересное, но не обещаю.
- Ещё один вариант — поразбираться с клеточным автоматом Flow Lenia. В нём время пространство непрерывны и, если верить авторам, легко получать безумно интересные конструкции, которые реплицируются, обходят препятствия, устойчивы к помехам, етц
Кто-то из команды должен будет программировать. Кто-то другой может ставить эксперименты почти без программирования, но совсем без программистов не получится. Но какие-то невероятные навыки программирования не нужны.
Ю.В. Калугина. Ждём анонса
Языки России и лингвистические задачи. Митя Крылов и Даша Аракелова
В России более 150 языков, которые являются родными для их носителей. К каким языковым семьям они относятся и какие у них есть особенности? Чем отличаются друг от друга диалекты русского языка и из каких диалектов складывался русский литературный язык? Мы обсудим эти вопросы, а в процессе решения лингвистических задач на материале разных языков России сможем сами понаблюдать за явлениями, которые в них встречаются. В конце курса, возможно, у нас получится придумать свою лингвистическую задачу.
Курс + проект, нужно 3 пары и проектор. Каждая тема будет состоять из лекционной части и совместного решения задачи. Опционально – найти интересный языковой материал и составить задачу самим
https://t/me/ars_leb, https://t.me/noumaa
Спеллчекинг и редакционное расстояние. Даша Аракелова
Как работают программы, которые автоматически исправляют ошибки и опечатки в текстах? Мы поговорим об метриках, которые позволяют измерить редакционное расстояние, то есть схожесть между двумя строками, и их использовании в спеллчекинге. В практической части проекта мы выберем и напишем программу, которая использует такие алгоритмы: например, очень простой спеллчекер или игру, которая основана на угадывании слов (быки и коровы, виселица).
Для проекта потребуется знание Python базового уровня (если вы ориентируетесь в типах данных и умеете писать циклы и функции, этого вполне достаточно).
Лекционная часть – про то, как были устроены системы исправления ошибок в текстах раньше и как они работают сейчас; про редакционное расстояние, зачем оно нужно и как считается. Потом решим, какую программу мы делаем (или несколько – в зависимости от количества участников), обсудим алгоритм и будем писать код.
Сбор и исследование корпуса текстов. Даша Аракелова
Лингвистический корпус – это массив текстов, которые специальным образом отобраны и размечены. Корпуса широко используются для решения исследовательских и прикладных задач. В этом проекте я предлагаю собрать небольшой корпус по теме, которую мы выберем (это могут быть, например, статьи, стихи, посты из паблика или сообщения из чата), а потом провести его количественный анализ и разобраться в том, что компьютерные методы могут рассказать нам о текстах.
Для проекта потребуется знание Python базового уровня (если вы ориентируетесь в типах данных и умеете писать циклы и функции, этого вполне достаточно).
Решим, какой источник текстов берем (если наберется группа, было бы лучше создать несколько мини-корпусов по интересам участников). Найдем способ выкачать тексты, программно обработаем их, а дальше я расскажу про разные количественные методы – например, выделение ключевых слов, н-граммы – и мы их применим (что-то запрограммируем сами, для чего-то используем уже готовые инструменты). В итоге обсудим, что мы таким образом узнали о текстах.