Это старая версия ZSh2024/Proektyponematematike за 12.02.2024 13:35:49.

Проекты не по математике

Биоинформатика. Раменский Василий Евгеньевич, Салимгареев Руслан Салаватович

Организация генов человека, сплайсинг, генетический код. Ждём более подробного анонса.


https://t.me/russal2010

Клеточные автоматы. Даня Макаров


Сложный непонятный проект! Я сам не знаю, что получится!
Возможно, вы слышали про игру жизнь Конвея. Часть клеток бесконечной клетчатой доски живая, часть — мёртвая, затем клетки оживают и умирают в зависимости от количества живых соседей. Несмотря на простые правила, может возникать очень сложное и интересное поведение, вот видео с примерами. Есть и другие клеточные автоматы. Есть несколько вариантов активности:

  • Поразбираться с игрой жизнь и другими клеточными автоматами, например, фон Неймана (он сделан для того, чтобы в нём были копирующие себя структуры) и его усовершенствованиями. Попробовать придумать свой клеточный автоматами
  • Важное отличие игры жизнь от настоящей жизни состоит в том, что, если чуть-чуть повредить вас, вы этого не заметите, а конструкция в игре жизнь рассыплется. Я предлагаю посмотреть, что будет, если добавить в клеточные автоматы чуть-чуть шума — иногда случайно переключать клетки. Сначала нужно разобраться с клеточными автоматами, как в предыдущем пункте. Возможно, получится что-то интересное, но не обещаю.
  • Ещё один вариант — поразбираться с клеточным автоматом Flow Lenia. В нём время пространство непрерывны и, если верить авторам, легко получать безумно интересные конструкции, которые реплицируются, обходят препятствия, устойчивы к помехам, етц

https://t.me/danyam127

Языки России и лингвистические задачи. Митя Крылов и Даша Аракелова

В России более 150 языков, которые являются родными для их носителей. К каким языковым семьям они относятся и какие у них есть особенности? Чем отличаются друг от друга диалекты русского языка и из каких диалектов складывался русский литературный язык? Мы обсудим эти вопросы, а в процессе решения лингвистических задач на материале разных языков России сможем сами понаблюдать за явлениями, которые в них встречаются. В конце курса, возможно, у нас получится придумать свою лингвистическую задачу.


Курс + проект, нужно 3 пары и проектор. Каждая тема будет состоять из лекционной части и совместного решения задачи. Опционально – найти интересный языковой материал и составить задачу самим


https://t/me/ars_leb, https://t.me/noumaa

Спеллчекинг и редакционное расстояние. Даша Аракелова

Как работают программы, которые автоматически исправляют ошибки и опечатки в текстах? Мы поговорим об метриках, которые позволяют измерить редакционное расстояние, то есть схожесть между двумя строками, и их использовании в спеллчекинге. В практической части проекта мы выберем и напишем программу, которая использует такие алгоритмы: например, очень простой спеллчекер или игру, которая основана на угадывании слов (быки и коровы, виселица).
Для проекта потребуется знание Python базового уровня (если вы ориентируетесь в типах данных и умеете писать циклы и функции, этого вполне достаточно).


Лекционная часть – про то, как были устроены системы исправления ошибок в текстах раньше и как они работают сейчас; про редакционное расстояние, зачем оно нужно и как считается. Потом решим, какую программу мы делаем (или несколько – в зависимости от количества участников), обсудим алгоритм и будем писать код.


https://t.me/noumaa

Сбор и исследование корпуса текстов. Даша Аракелова

Лингвистический корпус – это массив текстов, которые специальным образом отобраны и размечены. Корпуса широко используются для решения исследовательских и прикладных задач. В этом проекте я предлагаю собрать небольшой корпус по теме, которую мы выберем (это могут быть, например, статьи, стихи, посты из паблика или сообщения из чата), а потом провести его количественный анализ и разобраться в том, что компьютерные методы могут рассказать нам о текстах.


Для проекта потребуется знание Python базового уровня (если вы ориентируетесь в типах данных и умеете писать циклы и функции, этого вполне достаточно).


Решим, какой источник текстов берем (если наберется группа, было бы лучше создать несколько мини-корпусов по интересам участников). Найдем способ выкачать тексты, программно обработаем их, а дальше я расскажу про разные количественные методы – например, выделение ключевых слов, н-граммы – и мы их применим (что-то запрограммируем сами, для чего-то используем уже готовые инструменты). В итоге обсудим, что мы таким образом узнали о текстах.


https://t.me/noumaa