Проекты не по математике
Биоинформатика. Раменский Василий Евгеньевич, Салимгареев Руслан Салаватович
Ждём анонса во вторник.
Клеточные автоматы. Даня Макаров
Сложный непонятный проект! Я сам не знаю, что получится!
Возможно, вы слышали про игру жизнь Конвея. Часть клеток бесконечной клетчатой доски живая, часть — мёртвая, затем клетки оживают и умирают в зависимости от количества живых соседей. Несмотря на простые правила, может возникать очень сложное и интересное поведение, вот видео с примерами. Есть и другие клеточные автоматы. Есть несколько вариантов активности:
- Поразбираться с игрой жизнь и другими клеточными автоматами, например, фон Неймана (он сделан для того, чтобы в нём были копирующие себя структуры) и его усовершенствованиями. Попробовать придумать свой клеточный автоматами
- Важное отличие игры жизнь от настоящей жизни состоит в том, что, если чуть-чуть повредить вас, вы этого не заметите, а конструкция в игре жизнь рассыплется. Я предлагаю посмотреть, что будет, если добавить в клеточные автоматы чуть-чуть шума
иногда случайно переключать клетки. Сначала нужно разобраться с клеточными автоматами, как в предыдущем пункте. Возможно, получится что-то интересное, но не обещаю. - Ещё один вариант
поразбираться с клеточным автоматом Flow Lenia. В нём время пространство непрерывны и, если верить авторам, легко получать безумно интересные конструкции, которые реплицируются, обходят препятствия, устойчивы к помехам, етц
Языки России и лингвистические задачи. Митя Крылов и Даша Аракелова
В России более 150 языков, которые являются родными для их носителей. К каким языковым семьям они относятся и какие у них есть особенности? Чем отличаются друг от друга диалекты русского языка и из каких диалектов складывался русский литературный язык? Мы обсудим эти вопросы, а в процессе решения лингвистических задач на материале разных языков России сможем сами понаблюдать за явлениями, которые в них встречаются. В конце курса, возможно, у нас получится придумать свою лингвистическую задачу.
Курс + проект, нужно 3 пары и проектор. Каждая тема будет состоять из лекционной части и совместного решения задачи. Опционально – найти интересный языковой материал и составить задачу самим
https://t/me/ars_leb, https://t.me/noumaa
Спеллчекинг и редакционное расстояние. Даша Аракелова
Как работают программы, которые автоматически исправляют ошибки и опечатки в текстах? Мы поговорим об метриках, которые позволяют измерить редакционное расстояние, то есть схожесть между двумя строками, и их использовании в спеллчекинге. В практической части проекта мы выберем и напишем программу, которая использует такие алгоритмы: например, очень простой спеллчекер или игру, которая основана на угадывании слов (быки и коровы, виселица).
Для проекта потребуется знание Python базового уровня (если вы ориентируетесь в типах данных и умеете писать циклы и функции, этого вполне достаточно).
Лекционная часть – про то, как были устроены системы исправления ошибок в текстах раньше и как они работают сейчас; про редакционное расстояние, зачем оно нужно и как считается. Потом решим, какую программу мы делаем (или несколько – в зависимости от количества участников), обсудим алгоритм и будем писать код.
Сбор и исследование корпуса текстов. Даша Аракелова
Лингвистический корпус – это массив текстов, которые специальным образом отобраны и размечены. Корпуса широко используются для решения исследовательских и прикладных задач. В этом проекте я предлагаю собрать небольшой корпус по теме, которую мы выберем (это могут быть, например, статьи, стихи, посты из паблика или сообщения из чата), а потом провести его количественный анализ и разобраться в том, что компьютерные методы могут рассказать нам о текстах.
Для проекта потребуется знание Python базового уровня (если вы ориентируетесь в типах данных и умеете писать циклы и функции, этого вполне достаточно).
Решим, какой источник текстов берем (если наберется группа, было бы лучше создать несколько мини-корпусов по интересам участников). Найдем способ выкачать тексты, программно обработаем их, а дальше я расскажу про разные количественные методы – например, выделение ключевых слов, н-граммы – и мы их применим (что-то запрограммируем сами, для чего-то используем уже готовые инструменты). В итоге обсудим, что мы таким образом узнали о текстах.