Deep Neural Projects

(1st part of the course: Images)

Всего есть 13 проектов по первой части нашего курса. Все они так или иначе связаны с обработкой изображений, поскольку первая часть курса посвящена преимущественно компьютерному зрению.

В этом семестре нет возможности предложить свой проект.

Если не оговорено иное, в проекте подразумевается работа в Jupyter Notebook'ах, и, при желании, реализация функционала в виде веб-демо, мобильного приложения или бота.

1. Image Search Engine

image_search.png

В этом проекте вам предстоит реализовать свой мини-поисковый движок по картинке.

Есть некоторая база изображений (будет собрана вами и вашим ментором для проекта), на вход поступает новая картинка и нужно вывести наиболее похожие на неё картинки из базы

(скажем, топ-10 похожих).

2. Face Recognition

face_reco.jpeg

В этом проекте нужно реализовать систему распознавания лиц. Есть некоторая база изображений с лицами людей для 5-10 человек. Нужно по входному изображению говорить, является ли этот человек одним из тех 5-10, и, если да, то какова вероятность этого.

3. Face Keypoints Detector

face_regression.jpg

На вход поступает изображение лица человека, и необходимо детектировать точки его лица

(будет заранее задано, какие именно, их будет фиксированное количество).

4. Image Captioning

image_captioning_2.png

В этом проекте нужно реализовать нейросеть, которая по входному изображению печатает его текстовое описание. Примеры работы можно видеть на изображениях выше.

5. Segmentation in Medicine

segmentation_med.jpeg

В этом проекте нужно будет написать нейросеть, которая качественно сегментирует медицинские снимки, выделяя на них регионы нужного типа.

6. 3D Pose Estimation

3d_pose.png

Здесь вам предстоит написать нейросеть, которая по изображению предсказывает

позу человека в 3D. Будет фиксированный набор точек тела,

необходимо все их точно предсказывать и соединять линиями, получая трёхмерный скелет.

7. Text Extraction

text_extraction_2.png

В этом проекте нужно поработать над извлечением текста с изображений.

На вход поступает картинка, нужно распознать регионы с текстом на картинке

и вывести текст из них на экран.

8. Age Recognition

age_prediction.jpg

По лицу человека предсказать его возраст.

9. Image Question Answering

visual_question_answering.jpg

На вход поступает изображение и вопрос. Например: "Сколько детей на этом изображении?".

Нужно уметь точно отвечать на этот вопрос по изображению.

10. Gesture Action Recognition

gesture_recognition.jpg

В этом проекте нужно по изображению предсказывать положение кистей рук, а именно: положение всех фаланг пальцев и нижних точек кистей. Делать это нужно максимально точно и быстро, ведь потенциально эта технология может быть использована при управлении жестами в реальном времени.

11. Classification Bot

tg_bot_classification.png
tg_bot_image_classif.jpg

Проект состоит в том, чтобы написать бота (в Telegram или в ВК), который по присланному ему изображению будет выдавать класс изображённого объекта.

12. Style Transfer Bot

tg_bot_classification.png
tg_bot_style_transfer.png

Проект состоит в том, чтобы написать бота (в Telegram или в ВК), который по присланным ему изображениям стиля и фото будет возвращать картинку с перенесённым на фото стилем.

13. Style Transfer Filters

style_transfer_filters.jpg

В данном проекте акцент делается на реализацию наиболее быстрого и качественного переноса стиля на фотографии людей, создание так называемых "фильтров".